Relazione tra le variabili: regressione lineare e coefficienti di correlazione
|
|
- Enrico Ippolito
- 7 anni fa
- Visualizzazioni
Transcript
1 Relazione tra le variabili: regressione lineare e coefficienti di correlazione 1
2 Indice Stima della relazione tra le variabili di un campione Migliore retta che può essere tracciata a partire dai dati Errori standard dei coefficienti di regressione IC retta di regressione IC per singola osservazione Confronto di due rette di regressione test globale Correlazione e coefficienti di correlazione Coefficiente dei ranghi di Spearman Metodo di Bland-Altman per il confronto tra due misure diverse di una grandezza
3 Obiettivo 1. Stimare in quale misura una variabile MEDIAMENTE cresce/decresce al variare di un altra variabile RETTA DI REGRESSIONE Procedimento parametrico I campioni sono tratti da popolazioni caratterizzate da una risposta media che varia in modo continuo al variare dell entità del trattamento (test precedenti: valutare l efficacia di un trattamento discreto). Quantificare la FORZA dell associazione tra due variabili COEFFICIENTE DI CORRELAZIONE 3
4 Statura / Peso Tutta la popolazione (00 us) è accessibile all osservazione, misuriamo: variabile dipendente peso (kg) OSSERVAZIONI: pesof(statura) Statura (cm) yf(x) Statura ~ N(40,5) Peso ~ N(1,.5) 1. Il peso cresce LINEARMENTE con l altezza. Non si può predire il peso di una singola us essendo nota l altezza perché c è VARIABILITA yx 1 nei pesi di us con uguale statura variabile indipendente 4 DS dei pesi di us FISSATA certa statura
5 Variabile dipendente/indipendente 1 CASO, associazione tra variabili: Osservare la variabile indipendente e Predire la variabile dipendente CASO, legame casuale: Agire sulla variabile indipendente e Stimare, anche se con incertezza, la variabile dipendente (esperimenti controllati) 5
6 La retta delle medie Fissato x, calcolo la MEDIA di tutti i possibili valori di y, µ y.x Queste medie si dispongono lungo una linea retta di eq: µ y.x + x nel nostro caso intercetta coefficiente angolare il peso medio aumenta di 0.5Kg quando la statura aumenta di 1cm: µ y.x 8Kg + (0.5Kg/ cm)x Esiste una VARIABILITA intorno alla retta delle medie: y 1Kg.x y.x valuta quanto la RETTA delle MEDIE sia utile a predire i valori della variabile dipendente 6
7 La retta delle medie peso (kg) µ y.x + x Statura (cm) µ y.x 8Kg + (0.5Kg/ cm)x Esiste una VARIABILITA intorno alla retta delle medie: y.x 1Kg 7
8 Ipotesi per la retta di regressione La media della popolazione della variabile DIPENDENTE corrispondente ad un certo valore della variabile indipendente CRESCE/DECRESCE linearmente al crescere della variabile indipendente Fissato un valore della variabile INDIPENDENTE, i possibili valori della variabile dipendente si distribuiscono NORMALMENTE La deviazione standard della popolazione della variabile dipendente intorno alla sua media NON VARIA al variare della variabile indipendente 8
9 Statura / Peso Ho accesso solo a 10 campioni dell intera popolazione: peso (kg) Statura (cm) Il peso aumenta all aumentare della statura Problema: Il campione è significativo di ciò che accade nella popolazione? Risoluzione: Stimare i parametri della popolazione: (intercetta) e (coeff. angolare) della retta delle medie 9
10 Retta di regressione per statura / peso peso (kg) I: non passa tra i dati I II III II: passa tra i dati, IV ma ha coefficiente angolare più elevato Statura (cm) III e IV: ok! Qual è la migliore? Migliore è quella retta che rende minima la variabilità totale tra i dati osservati e la retta stessa si misura con la varianza o DS Metodo dei minimi quadrati: La somma dei quadrati degli scarti tra i valori della variabile dipendente osservati e quelli individuati dalla retta deve essere MINIMA 10
11 Retta dei minimi quadrati L equazione della retta detta RETTA DI REGRESSIONE è: ŷ a + bx l intercetta (a) e il coefficiente angolare (b) sono: a ( Y)( n( X X ) ( ) ( X)( X) XY) dove X e Y sono le coordinate dei punti b n( n( XY) ( X ) ( X)( X) Y) 11
12 s X 5cm Statura / Peso s Y.4Kg Statura osserv.(cm) TOT369 Peso osserv.(kg) TOT103.8 X (cm ) XY(Kg.cm) X XY (103.8kg)(13841cm 10(13841cm ) (369cm)(3930.1Kg a 10(3930.1Kg 10(13841cm ) (369cm) cm) (369cm)(103.8Kg) b ) (369cm) La retta di regressione: cm) 0.44Kg ŷ 6Kg + 6Kg cm stima di stima di (0.44Kg/ cm) x 1
13 Stima della variabilità della popolazione y.x Si calcola la radice quadrata degli scarti tra i dati e la retta di regressione: s y x [ ] Y Ŷ [ Y (a bx) ] n n 1 (s Y b s X ) n n Per rendere più piccolo il denominatore e compensare la tendenza alla sottostima della variabilità della popolazione Nell ES: s X 5cm s Y.4Kg 9 sy X ( ) 0.96Kg 8 è una stima della variabilità della popolazione y.x 1Kg 13
14 Errori standard dei coefficienti a, b Al variare dei campioni, VARIA la retta di regressione ovvero variano i coefficienti a e b Le distribuzioni di tutti i possibili valori a (rispettivamente b) hanno MEDIA (rispettivamente ), e DS (rispettivamente ) e si distribuiscono normalmente e sono utilizzati per la verifica delle ipotesi e per il calcolo di IC relativamente ai coefficienti di regressione e alla stessa retta deviazione standard dell intercetta deviazione standard del coefficiente angolare PROBLEMA: come si stimano? 14
15 Errori standard dei coefficienti a, b Dai campioni si stima la deviazione standard di tutti i possibili valori assunti dall intercetta: s a s y x 1 n + (n X 1)s X e la deviazione standard di tutti i possibili coefficienti angolari: s b 1 n 1 s y x s X ES: 1 (36.9cm) s (0.96Kg) + 10 (10 1)(5cm) a Kg s b 0.06Kg/cm cm.4Kg 15
16 Verifica di ipotesi Verificare che il COEFFICIENTE ANGOLARE0 equivale stimare la probabilità di osservare una relazione di forza uguale o maggiore a quella mostrata dai dati sotto ipotesi che NON C E RELAZIONE LINEARE tra la variabile indipendente e dipendente H 0 : non c è relazione lineare tra la variabile indipendente e dipendente t-test: test: t stima del parametro - valore reale del parame.nella popol. errore standard della stima del parametro Affinchè non esista relazione lineare: 0 t b s b b Questo t-empirico si confronta col t-teorico a n- GL che individua nella distribuzione i valori corrispondenti al 100% di errore nel caso di assenza di relazione 16 s b
17 Esempio: statura / peso Abbiamo calcolato b0.44kg/cm e s b 0.06Kg/cm 0.44 t Fissato 0.1%, t poichè 10-8 t > t c Conclusione: RIFIUTO H 0, ovvero questo campione è estratto da una popolazione nella quale vi è una relazione lineare tra variabile indipendente e dipendente 17
18 Esempio: statura / peso con IC Utilizzando la definizione di t, si definisce IC al 100(1-)% per il COEFFICIENTE ANGOLARE della retta delle medie: b t sb < < b + ts b Nell ES: essendo t , poichè 10-8, IC al 95% è: Kg/ cm < < < < Kg/ cm Conclusione: 0.06 Questo IC contiene il valore reale 0.5Kg/cm 0IC RIFIUTO H 0, ovvero questo campione è estratto da una popolazione nella quale vi è una relazione lineare tra variabile indipendente e dipendente 18
19 Analogamente per l INTERCETTA con la relazione: t-test: test: t Verifica di ipotesi e IC stima del parametro - valore reale del parame.nella popol. errore standard della stima del parametro a che segue la distribuzione normale con n- GL e IC è: Nell ES: 6.0 a t.306 sa < < a + ts a essendo t , poichè 10-8, IC al 95% è:.4 < < ,5 < < -0,5 Conclusione:.4 s a Questo IC contiene il valore reale -8Kg 0IC RIFIUTO H 0 19
20 IC per la retta di regressione Il grado di incertezza nella stima di COEFFICIENTE ANGOLARE e INTERCETTA della retta delle medie è quantificata da: s a.4kg, s b 0.06Kg peso (kg) La retta delle medie può trovarsi sopra/sotto la retta di regressione, oppure avere un coefficiente angolare leggermente diverso: in ogni caso si trova in un INTERVALLO che INCLUDE la Retta di Regressione Statura (cm) La regione è più ampia agli estremi perché la retta di regressione deve essere tracciata in linea retta e passare per la media delle due variabili 0
21 IC per la retta di regressione Fissata la variabile indipendente esiste la distribuzione di tutti i possibili valori della retta di regressione. E una distribuzione normale ERRORE STANDARD della RETTA DI REGRESSIONE (dipende dalla variabile indipendente) s ŷ s y x 1 n (x + (n X) 1)s E una distribuzione normale IC al 100(1-)%: ŷ t dove t ha n- GL e X s < y < ŷ + t s ŷ ŷ ŷ a + bx 1
22 ATTENZIONE! Errore frequente IC retta regressione IC della popolazione E analogo a quando per descrivere la VARIABILITA della popolazione si utilizza l ERRORE STANDARD DELLA MEDIA anzicchè la DEVIAZIONE STANDARD peso (kg) Statura (cm) IC retta di regressione: al 95% il peso medio per un altezza di 40cm è compreso in [11,1.5] NON è vero che al 95% il peso di ciascuna us con altezza 40cm è compreso in [11,1.5]
23 IC per una nuova osservazione COSA OCCORRE: Variabilità derivante dalla dispersione della popolazione intorno alla RETTA delle MEDIE, Variabilità derivante dall incertezza sulla posizione della retta delle medie, s ŷ La deviazione del valore predetto di una nuova osservazione è: 1 (x X) IC al 100(1-)%: sy sy x + s s ŷ y x 1 + nuovo n (n 1)s s ŷ s y x 1 n (x + (n X) 1)s X X ŷ t s y x sy < y < ŷ + t s nuovo Y nuovo A COSA SERVE? E l IC da usare quando si stima un nuovo valore della v.d. a partire dalla v.i. con una confidenza del 95% che il range 3 includa il valore reale
24 Confronto tra due rette di regressione TIPI DI TEST: 1. per cercare una differenza dei coefficienti angolari. per cercare una differenza delle intercette 3. test globale di coincidenza nel quale si chiede se le rette sono diverse i coefficienti angolari e le intercette seguono la distribuzione t 4
25 Confronto per i coefficienti angolari Ipotesi: i due campioni sono tratti da popolazioni con uguale coefficiente angolare della retta delle medie t-test: test: t differenza tra i coefficienti angolari errore standard della differenza tra i coefficienti angolari b 1 s b b 1 b dove s s + s b1 b b1 b (n n 1 n n 1 n (n s y x p 1 s y x p 1)s 1 x 1 + )s n y x 1 (n s y x p 1)s x + (n )s 1 + n 4 Si confronta questo valore con t c per n 1 +n -4 GL y x Ipotesi: i due campioni sono tratti da popolazioni con uguali intercette della retta delle medie t-test: test: t a 1 s a a 1 a con s s + s a1 a a1 a 5
26 Test globale Significato di metodo dei minimi quadrati Capire se approssimare i dati con DUE rette di regressione diverse produce RESIDUI minori rispetto all approssimazione con UNA sola retta METODO: 1. adattare ciascun insieme di dati ad una propria retta di regressione. calcolare la variabilità globale, s y x p, intorno a due rette di regressione differenti 3. adattare tutti i dati ad un unica retta di regressione e calcolare la variabilità globale, s, y x c COMUNE intorno ad essa 6
27 METODO: s Test globale 4. calcolare il miglioramento : y x migl (n 1 + n )s y x c (n 1 + n 4)s y x p Riduzione della somma totale dei quadrati delle differenze tra le osservazioni e la retta di regressione res SS c resp sotto l ipotesi che le due rette abbiano coefficienti ed intercette differenti con SS res somme dei quadrati dei residui intorno alle rette di regressione 5. quantificare i miglioramenti utilizzando il test s y x statistico F: migl F s y x 6. confrontare p F-empirico con F-teorico per n e d n 1 +n -4 GL 7. F>F c approssimazione migliore con DUE rette RIFIUTO H 0 ovvero i due insiemi di dati sono tratti da popolazioni con rette delle medie differenti SS 7
28 Esempio: relazione tra debolezza e riduzione massa muscolare in artrite reumatoide POBLEMA: La riduzione della forza con cui i pazienti affetti da artrite riescono a stringere oggetti fosse dovuto alle articolazioni artritiche o semplicemente fosse un riflesso della riduzione della massa muscolare. Forza di presa (N) senza artrite 400 con artrite Area della sezione trasversa del muscolo (cm ) Tesi: C è una relazione tra l area della sezione trasversa del muscolo e le diverse forze di presa per individui normali e quelli affetti da artrite? 8
29 Esempio: relazione tra debolezza e riduzione massa muscolare in artrite reumatoide Ampiezza del campione Intercetta a, (s a ) (N) Coefficiente angolare b, (s b ) (N/cm ) Errore standard della stima (N) Dati: Senza artrite (5.3) (00.789) 45.7 Con artrite (.4).41 (0.70) 40.5 Totale (50.5) 6.39(1.579) 19.1 Calcolo la stima combinata della varianza (n 1 )s n y x 1 + n + (n 4 )s y x (5 )45.7 (5 ) sy x p 1864N Approssimiamo tutti i dati ad una sola retta di regressione s y x migl (n 1 + n )s y x c (n 1 + n 4)s y x p (5 + 5 )16667 (5 + 5 ) N 9
30 Esempio: relazione tra debolezza e riduzione massa muscolare in artrite reumatoide Test F: s y x F sy x migl p Fissato 1%, F poichè n e d F < F c Conclusione: La relazione tra forza di presa e area della sezione trasversale è diversa per persone con e senza artrite Cosa determina la differenza? Cosa determina la differenza? Sono diverse le intercette o i coefficienti angolari? 30
31 Esempio: relazione tra debolezza e riduzione massa muscolare in artrite reumatoide Intercette: sa a sa sa (5.3) (.4) senza con senza con 33.8N t a s senza a a senza a con con ( 7.3) Fissato 5%, t poichè n 1 +n -446 t < t c le intercette NON sono significativamente differenti Coefficiente angolare: t Fissato 5%, t poichè 46 t > t c i coefficienti angolari sono significativamente differenti Conclusione: L aumento della forza di presa è minore nelle persone con artrite rispetto a quelle senza. 31
32 REGRESSIONE: Correlazione stima di come la v.d. varia al variare della v.i. stima della variabilità delle medie della v.d. intorno alla retta Quando due variabili pur variando CONGIUNTAMENTE non sono tali da individuare la v.d. e v.i. si cerca solo di descrivere LA FORZA della RELAZIONE tra le due variabili: COEFFICIENTE di CORRELAZIONE (CC) [-1,1] Pearson per variabili distribuite normalmente Spearman per variabili misurate su scala ordinale Stretta relazionecc1 Debole relazionecc 0 3
33 OSSERVAZIONE: Coefficiente di Pearson Invertendo il ruolo della v.i. con quello della v.d. si ottengono rette di regressione differenti (cambiano il coefficiente angolare e l intercetta). E necessario un indicatore indipendente da questa scelta: coefficiente di Pearson (X X)(Y Y) r (X X) (Y Y) SIGNIFICATO: Indica la FORZA dell associazione tra le due variabili r+1 le due variabili variano nello stesso senso r+1 le due variabili variano in senso opposto (una cresce, l altra decresce) 33
34 Coefficiente di Pearson (CP) r+1 r-1 r+0.8 r0 34
35 Stat.osserv. (cm) TOT369 Peso osserv. (Kg) TOT103.8 Statura / Peso X X (cm) TOT0 Y Y ( X )( ) (Kg) TOT0 ( ) X Y Y cmkg TOT99.9 ( ) X X Y Y cm TOT4.9 Kg TOT51.8 r 99.9Kg 4.9cm cm 51.8Kg 0.95 numero puro 35
36 r Regressione e correlazione 1. Legame con il significato di retta di regressione: Per definizione, la retta di regressione è quella che rende minima la somma dei quadrati degli scarti tra i punti sulla retta di regressione e il valore della v.d. in corrispondenza di ogni valore della v.i. osservato. Quindi si può definire 1 somma dei quadrati degli scarti dalla retta di regr. somma dei quadrati degli scarti dalla media SS res 0 r±1 la v.d. può essere definita senza incertezza dalla v.i. SS res SS tot r0 la v.d. NON può essere definita senza incertezza dalla v.i. (non esiste trend tra i dati) 1 36 SS SS res tot
37 Regressione e correlazione 1.1 Legame con il significato di retta di regressione: Calcolo il quadrato r DETERMINAZIONE Significato: 1 SS SS è il COEFFICIENTE di fornisce indicazione su quanto una retta sia adatta a descrivere la relazione tra le due variabili res tot 37
38 Regressione e correlazione. Legame con i risultati dell analisi di regressione: r Riprendendo le definizioni estese di SS res e SS tot 1 n n 1 s y x s y Maggiore è r, maggiore è la precisione con cui si può predire la v.d. dalla v.i. IC è più completo nella misura dell incertezza nella previsione di un fenomeno clinico 3. Legame con il coefficiente angolare della retta di regressione: s r b s X Y Quando la DS dei residui intorno alla retta di regresione s y x diminuisce diminuisce la variabilità totale della v.d. misurata da s s y y.x diminuisce r aumenta s y per la verifica delle ipotesi r0 (coeff. angolare retta di regressione0) 38
39 Verifica di ipotesi e correlazione t-test: test: t (1 r r con n- GL )/(n ) Questa formula deriva dall espressione del t-test per b coefficienti angolari, t Dimostrazione: n sy x r 1 s n 1 s Y y x n n s b 1 (1 r ) sy s b 1 s n 1 s s b y x x s s Y X 1 r n Ricordando che s b r s Y X sostituiamo in t b s b t r(s / s ) Y X c.v.d. (sy / sx ) (1 r )/(n ) (1 r )/(n ) r 39
40 Esempio: grassi nella dieta e tumore alla mammella PROBLEMA: La dieta influisce sull insorgenza di alcuni tumori (cancro alla mammella) in animali da esperimento. Per verificare un analoga tendenza nell uomo, sono stati raccolti dati relativi al tasso di mortalità per tumore alla mammella in funzione di ingestione quotidiana di GRASSI ANIMALI e VEGETALI in 39 nazioni. r+0.90 r
41 Esempio: grassi nella dieta e tumore alla mammella H 0 : Non c è relazione lineare tra tasso di mortalità per cancro e grassi alimentari animali t-test: test: t 1 (1 r r )/(n ) (1 0.90) /(39 ) Fissato 0.1%, t poichè 39-7 t > t c RIFIUTO H 0 ovvero c è correlazione tra grassi animali e cancro. H 0 : Non c è relazione lineare tra tasso di mortalità per cancro e grassi alimentari vegetali. 41
42 Esempio: grassi nella dieta e tumore alla mammella 0.14 t-test: test: t 0. 9 (1 r r )/(n ) (1 0.15) /(39 ) Fissato 0.1%, t poichè 39-7 t < t c ACCETTO H 0 ovvero non c è correlazione tra grassi animali e cancro. Conclusione: I grassi animali contribuiscono ad aumentare la probabilità di tumore alla mammella rispetto ai grassi vegetali. Ciò prova che un alimentazione ricca di grassi animali è causa del cancro? NO!!!! 4
43 Esempio: grassi nella dieta e tumore alla mammella Spiegazione: Il ricercatore non aveva modo di modificare le diete delle donne osservate studio di tipo osservazionale e non sperimentale CASI: AGIRE sulla v.i. e OSSERVARE come si modifica la v.d. OSSERVARE la contemporanea variazione delle variabili Trarre conclusioni su quanto tali MODIFICAZIONI nella v.d. sono CAUSATE da quelle verificatesi nella v.i. Si può definire solo un ASSOCIAZIONE tra le variabili evidenziata dalla loro contemporanea modifica 43
44 Coefficiente di Spearman IPOTESI per l applicazione del coefficiente di PEARSON: Dati con distribuzione gaussiana su scala ad intervalli Campione tratto da popolazione nella quale le variabili hanno entrambe una distribuzione normale Le due variabili devono essere legate da relazione lineare se queste ipotesi NON sono soddisfatte: COEFFICIENTE di CORRELAZIONE dei RANGHI di SPEARMAN Cos è? 44
45 Coefficiente di Spearman Indicatore NON PARAMETRICO dell associazione tra due variabili a partire dai RANGHI piuttosto che dai valori delle osservazioni. DEF: COME UTILIZZARLO? 1. Si ordinano i valori delle Numero variabili d ordine indi un modo valore in una serie crescente/decrescente ordinata di valori (ordine di arrivo di una corsa). Si assegna il rango (1, n). A valori uguali si assegna la media dei ranghi che sarebbero stati loro assegnati se fosse stato possibile distinguerli 3. Si calcola il coefficiente di correlazione 6d 1 n n r 3 dove d è la differenza tra i due ranghi corrispondenti a ciascuna osservazione 4. Fissato il valore di significatività, se r > r c le osservazioni sono compatibili con l ipotesi che non esiste associazione tra le variabili. 45
46 Pearson OK! RANGO statura Statura / Peso Stat.osserv. (cm) Peso osserv. (Kg) RANGO peso Differenza Ranghi (d) TOT369 TOT [( 1 ) + ( 1 ) ( 0.5 r ) Fissato 0.1%, r poichè n10 r > r c esiste un associazione tra peso e statura con una significatività dello 0.1%
47 Esempio: esami di laboratorio e qualità dell assistenza PROBLEMA: Il medico che fa largo uso di esami di laboratorio è un medico attento e meticoloso oppure uno che spreca il denaro del paziente? Medico migliore rango 1 Medico peggiore rango 1 (totale medici1) Costo più basso di esami rango 1 Costo più alto di esami rango 1 r-0.13 Fissato 5%, r poichè n1 r > r c non c è relazione tra competenza del medico e denaro speso per esami di laboratorio 47
48 Esempio: esami di laboratorio e qualità dell assistenza Osserviamo meglio il grafico: dati grezzi I medici meno capaci si trovano agli estremi dello spettro dei costi: richiedono molti/meno esami dei medici migliori c è RELAZIONE!!!!! Dov è l ERRORE? La curva ha forma ad U analisi della correlazione non può essere in grado di individuare l associazione! Pearson e Spearman si utilizzano quando l ASSOCIAZIONE tra le due variabili è crescente o decrescente 48
49 Potenza per regressione e correlazione Verificare che significativamente il coeff. angolare 0 coeff. di correlazione 0 Trasformiamo il coefficiente di correlazione: Z 1 1 ln 1 + r r distribuita normalmente con Z n 1 3 z Z ~N(0,1) z 49
50 PROBLEMA: Esempio Calcolare la POTENZA di un analisi di regressione per trovare una correlazione di 0.9 con un livello di confidenza del 95%, utilizzando un campione di 10 osservazioni. Risoluzione: Z ln ln 1.47 e Z n 3 Fissato 5%, z poichè n. 50
51 Potenza per regressione e correlazione H 0 VERA (non c è correlazione) H 0 FALSA (c è correlazione) La POTENZA del test è l area sottesa alla distribuzione di z a destra del valore critico z necessario per concludere che la correlazione è significativamente diversa da zero. La POTENZA è l area sotto la distribuzione reale della statistica z oltre z Z Se 0.9 la distribuzione di z sarà centrata su: z z valore inferiore al Ma Z z z POTENZA97% valore centrale della distribuzione Z 51
52 Esempio La potenza di un analisi della correlazione di 0.9 con livello di confidenza del 95% e ampiezza campionaria 10 è pari al 97% Grandezza campionaria per la retta di regressione e correlazione La grandezza campionaria necessaria per ottenere una correlazione prefissata con una potenza prefissata a un prefissato livello di confidenza è data da : n z z Z
53 Confronto tra due misure diverse della STESSA grandezza OBIETTIVO: Confrontare due modi diversi di misurare la stessa grandezza quando entrambi sono imprecisi (tecniche meno invasive ma altrettanto precise come le tradizionali?) OSSERVAZIONE 1. Confronto di due misure cliniche (non esistono valori standard di riferimento) Problema della taratura di laboratorio nel quale si confrontano valori misurati con valori standard 53
54 Confronto tra due misure diverse della grandezza OSSERVAZIONE. Confronto di due misure cliniche SOTTOINTENDE una relazione fra le due misure non ha senso verificare l ipotesi nulla che non ci sia relazione utilizzando l analisi di correlazione OSSERVAZIONE 3. La correlazione dipende dalla variabilità dei dati: più variano le osservazioni più alta sarà la correlazione non ha senso usare la correlazione per il confronto tra due misure diverse della grandezza 54
55 Metodo di Bland e Altman La DIFFERENZA è la misura più diretta della NON CONCORDANZA fra due osservazioni 1. Si calcola la differenza fra tutte le coppie di osservazioni.. Della differenza si calcola Media Deviazione Standard misura la DISTORSIONE fra le due osservazioni misura la VARIABILTA fra le due osservazioni 55
56 Metodo di Bland e Altman 3. La media delle due osservazioni (che sono ugualmente buone/cattive) è la MIGLIORE stima del valore vero della variabile 4. Rappresentare in un grafico differenzaf(media) in modo da evidenziare eventuali differenze sistematiche fra le due tecniche di misurazione 56
57 Esempio: valutazione del rigurgito mitralico mediante ecocardiografia PROBLEMA: Funzionamento della circolazione sanguigna! La valvola mitralica impedisce al sangue di rifluire nei polmoni quando la parte sinistra del cuore si contrae per spingere il sangue verso il corpo. Se la valvola è mal funzionante si verifica il rigurgito mitralico. La quantità di rigurgito si calcola con: fraz. di rigurgito flux mitralico(parte sinistra cuore) - flux aortico(verso il corpo) flux mitralico Valvola funzionante flux mitralico flux aortico fraz. rigurgito 0 Valvola NON funzionante fraz. rigurgito ~ 1 57
58 Esempio: valutazione del rigurgito mitralico mediante ecocardiografia I due metodi per la valutazione del rigurgito mitralico: 1. cateterizzazione cardiaca. ecocardiografia doppler Osservazioni Dati Doppler Cateterizzaz. Differenza Media
59 Dati continuazione Osservazioni Doppler Cateterizzaz Differenza Media Media della differenza-0.03! Non c è differenza sistematica fra i due diversi metodi DS della differenza ! È piccola se confrontata con i livelli di rigurgito osservati
60 Esempio: valutazione del rigurgito mitralico mediante ecocardiografia Fraz.rigurgito Doppler 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0, 0,1 0-0,1 0 0,1 0, 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 Fraz.rigurgito cateterismo r0.89 e dimostra concordanza tra i metodi Differenza misure CONCLUSIONE: L ecocardiografia Doppler produce una misura del rigurgito mitralico altrettanto corretta del più invasivo metodo della cateterizzazione cardiaca 0,3 0,1-0,1-0,3 Media+DS Media-DS 0 0, 0,4 0,6 0,8 1 Media misure Doppler/Catet. 60 Media ICMedia±DS dà misura del grado di disaccordo tra i due metodi
61 Conclusione Metodi per QUANTIFICARE le relazioni tra due variabili. Approccio analogo ai metodi precedenti: descrizione della popolazione con riferimento alla determinazione dei parametri caratteristici sviluppo dei metodi per la valutazione di tali parametri e loro errori standard in uno o più campioni. ATTENZIONE: Regressione SI ma solo quando la relazione attesa tra i dati è lineare (curva ad U ), in modo che le ipotesi alla base del metodo statistico siano 61 soddisfatte dai dati osservati.
62 Percentili della distribuzione normale standardizzata Es: Se si vuole ottenere una potenza dell 80% si trova z z
63 Tabella t-test 63
64 Tabella F-test 64
65 Tabella F-test 65
66 Tabella F-test 66
67 Tabella Spearman 67
68 Percentili della distribuzione normale standardizzata Es: Se si vuole ottenere una potenza dell 80% si trova z z
Il confronto fra medie
L. Boni Obiettivo Verificare l'ipotesi che regimi alimentari differenti non producano mediamente lo stesso effetto sulla gittata cardiaca Ipotesi nulla IPOTESI NULLA La dieta non dovrebbe modificare in
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
DettagliIl processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni
La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con
DettagliUniversità del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
DettagliΣ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica
13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in
DettagliStatistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
DettagliPresentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii
Sommario Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii xv Parte I Statistica descrittiva 1 Capitolo 1 Introduzione 3 Perché studiare statistica? 4
DettagliDESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.
Corso di Laurea Specialistica in Biologia Sanitaria, Universita' di Padova C.I. di Metodi statistici per la Biologia, Informatica e Laboratorio di Informatica (Mod. B) Docente: Dr. Stefania Bortoluzzi
DettagliREGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
Dettaglii dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente
TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2
DettagliTeoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
DettagliStatistica Inferenziale
Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione
DettagliStatistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme
DettagliDistribuzioni campionarie
1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari
DettagliISTOGRAMMI E DISTRIBUZIONI:
ISTOGRAMMI E DISTRIBUZIONI: i 3 4 5 6 7 8 9 0 i 0. 8.5 3 0 9.5 7 9.8 8.6 8. bin (=.) 5-7. 7.-9.4 n k 3 n k 6 5 n=0 =. 9.4-.6 5 4.6-3.8 3 Numero di misure nell intervallo 0 0 4 6 8 0 4 6 8 30 ISTOGRAMMI
DettagliDistribuzione Normale
Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di
DettagliCAPITOLO 11 ANALISI DI REGRESSIONE
VERO FALSO CAPITOLO 11 ANALISI DI REGRESSIONE 1. V F Se c è una relazione deterministica tra due variabili,x e y, ogni valore dato di x,determinerà un unico valore di y. 2. V F Quando si cerca di scoprire
DettagliPrefazione. Presentazione dell edizione italiana
Glantz_2007.book Page VII Monday, February 5, 2007 12:53 PM Indice Prefazione Presentazione dell edizione italiana XV XIX Capitolo 1 Biostatistica e pratica clinica 1 Medicina scientifica 1 Cosa rivelano
DettagliDistribuzioni e inferenza statistica
Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione
DettagliMetodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale
DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie
DettagliMETODO DEI MINIMI QUADRATI
METODO DEI MINIMI QUADRATI Torniamo al problema della crescita della radice di mais in funzione del contenuto di saccarosio nel terreno di coltura. Ripetendo varie volte l esperimento con diverse quantità
DettagliEsercitazione: La distribuzione NORMALE
Esercitazione: La distribuzione NORMALE Uno dei più importanti esempi di distribuzione di probabilità continua è dato dalla distribuzione Normale (curva normale o distribuzione Gaussiana); è una delle
Dettaglile scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:
DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it si basano su tre elementi: le scale di misura sistema empirico: un insieme di entità non numeriche (es. insieme di persone; insieme
DettagliTEST NON PARAMETRICO DI MANN-WHITNEY
TEST NON PARAMETRICO DI MANN-WHITNEY Questo test viene può essere utilizzato come test di confronto tra due campioni in maniera analoga ai test ipotesi parametrici di confronto medie (test Z se la varianza
DettagliDISTRIBUZIONE NORMALE (1)
DISTRIBUZIONE NORMALE (1) Nella popolazione generale molte variabili presentano una distribuzione a forma di campana, bene caratterizzata da un punto di vista matematico, chiamata distribuzione normale
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliPSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI
PSICOMETRIA Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI CAMPIONI INDIPENDENTI Campioni estratti casualmente dalla popolazione con caratteristiche omogenee Assegnazione
DettagliOgni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.
Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza. Misure ripetute forniscono dati numerici distribuiti attorno ad un valore centrale indicabile con un indice (indice
DettagliStatistica4-29/09/2015
Statistica4-29/09/2015 Raccogliere i dati con il maggior numero di cifre significative ed arrotondare eventualmente solo al momento dei calcoli (min. 3); nella grande maggioranza delle ricerche biologiche
DettagliCHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DettagliConcetti principale della lezione precedente
Corso di Statistica medica e applicata 9 a Lezione Dott.ssa Donatella Cocca Concetti principale della lezione precedente I concetti principali che sono stati presentati sono: Variabili su scala nominale
Dettaglistandardizzazione dei punteggi di un test
DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it standardizzazione dei punteggi di un test serve a dare significato ai punteggi che una persona ottiene ad un test, confrontando la
DettagliIntervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da:
Analisi chimica strumentale Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da: (31.4) dove s y è la varianza dei valori
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
DettagliTeoria e tecniche dei test
Teoria e tecniche dei test Lezione 9 LA STANDARDIZZAZIONE DEI TEST. IL PROCESSO DI TARATURA: IL CAMPIONAMENTO. Costruire delle norme di riferimento per un test comporta delle ipotesi di fondo che è necessario
DettagliLaboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.
5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema
DettagliApplicazioni statistiche e utilizzo del package statistico Spss - 7
Applicazioni statistiche e utilizzo del package statistico Spss - 7 CISI 27 gennaio 2005 ricercapsicologica@tiscali.it Illustrare le principali statistiche mono e bivariate. Valutare quando è opportuno
DettagliLezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Il concetto di interpolazione In matematica, e in particolare in
DettagliDistribuzione Gaussiana - Facciamo un riassunto -
Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura
DettagliTest d Ipotesi Introduzione
Test d Ipotesi Introduzione Uno degli scopi più importanti di un analisi statistica è quello di utilizzare i dati provenienti da un campione per fare inferenza sulla popolazione da cui è stato estratto
DettagliIntervalli di confidenza
Probabilità e Statistica Esercitazioni a.a. 2006/2007 C.d.L.: Ingegneria per l Ambiente ed il Territorio, Ingegneria Civile, Ingegneria Gestionale, Ingegneria dell Informazione C.d.L.S.: Ingegneria Civile
DettagliGENETICA QUANTITATIVA
GENETICA QUANTITATIVA Caratteri quantitativi e qualitativi I caratteri discontinui o qualitativi esibiscono un numero ridotto di fenotipi e mostrano una relazione genotipo-fenotipo semplice I caratteri
DettagliTOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo
TOPOGRAFIA 2013/2014 L operazione di misura di una grandezza produce un numero reale che esprime il rapporto della grandezza stessa rispetto a un altra, a essa omogenea, assunta come unità di misura. L
DettagliLEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi
DettagliTest di ipotesi su due campioni
2/0/20 Test di ipotesi su due campioni Confronto tra due popolazioni Popolazioni effettive: unità statistiche realmente esistenti. Esempio: Confronto tra forze lavoro di due regioni. Popolazioni ipotetiche:
DettagliSeconda Parte Specifica per la tipologia di scuola - Statistica sanitaria e Biometria - 22/07/2016
Domande relative alla specializzazione in: Statistica sanitaria e Biometria Scenario 1: In uno studio prospettivo condotto per valutare la relazione tra l'uso di estrogeni e rischio di cancro alla mammella,
Dettaglilezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1
lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,
DettagliCapitolo 3 Sintesi e descrizione dei dati quantitativi
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 3 Sintesi e descrizione dei dati quantitativi Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e tecnologie Alimentari" Unità
DettagliPremessa: la dipendenza in media
Premessa: la dipendenza in media Supponiamo di avere K diversi livelli di un fattore che potrebbero influire su una determinata variabile. Per esempio supponiamo di domandarci se la diversificazione (intesa
DettagliEsercitazioni di Statistica
Esercitazioni di Statistica Indici di posizione e di variabilità Prof. Livia De Giovanni lstatistica@dis.uniroma1.it Esercizio 1 Data la seguente distribuzione unitaria del carattere X: X : 4 2 4 2 6 4
DettagliEsercitazioni di statistica
Esercitazioni di statistica Intervalli di confidenza Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 10 Dicembre 2014 Stefania Spina Esercitazioni di statistica 1/43 Stefania Spina
DettagliAnalisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:
Obiettivi: Esplicitare la correlazione esistente tra l altezza di un individuo adulto e la lunghezza del suo piede e del suo avambraccio. Idea del progetto: Il progetto nasce dall idea di acquistare scarpe
DettagliLA DISTRIBUZIONE NORMALE (Vittorio Colagrande)
LA DISTRIBUZIONE NORMALE (Vittorio Colagrande) Allo scopo di interpolare un istogramma di un carattere statistico X con una funzione continua (di densità), si può far ricorso nell analisi statistica alla
DettagliIndicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica
Indicatori di Posizione e di Variabilità Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Indici Sintetici Consentono il passaggio da una pluralità
DettagliCapitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
DettagliProgrammazione con Foglio di Calcolo Cenni di Statistica Descrittiva
Fondamenti di Informatica Ester Zumpano Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Lezione 5 Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di
DettagliProf. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione
Consentono di descrivere la variabilità all interno della distribuzione di requenza tramite un unico valore che ne sintetizza le caratteristiche CAMPO DI VARIAZIONE DIFFERENZA INTERQUARTILE SCOSTAMENTO
DettagliMISURE DI DISPERSIONE
MISURE DI DISPERSIONE 78 MISURE DI DISPERSIONE Un insieme di dati numerici può essere sintetizzato da alcuni valori tipici, che indicano il grado di variabilità dei dati stessi. Grado di Variabilità o
DettagliIL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e
DettagliANALISI MULTIVARIATA
ANALISI MULTIVARIATA Marcella Montico Servizio di epidemiologia e biostatistica... ancora sulla relazione tra due variabili: la regressione lineare semplice VD: quantitativa VI: quantitativa Misura la
DettagliAnalisi degli Errori di Misura. 08/04/2009 G.Sirri
Analisi degli Errori di Misura 08/04/2009 G.Sirri 1 Misure di grandezze fisiche La misura di una grandezza fisica è descrivibile tramite tre elementi: valore più probabile; incertezza (o errore ) ossia
DettagliREGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori
REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE
DettagliSTATISTICHE DESCRITTIVE Parte II
STATISTICHE DESCRITTIVE Parte II INDICI DI DISPERSIONE Introduzione agli Indici di Dispersione Gamma Differenza Interquartilica Varianza Deviazione Standard Coefficiente di Variazione introduzione Una
DettagliStatistica Un Esempio
Statistica Un Esempio Un indagine sul peso, su un campione di n = 100 studenti, ha prodotto il seguente risultato. I pesi p sono espressi in Kg e sono stati raggruppati in cinque classi di peso. classe
DettagliProbabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva
Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.
DettagliTest per la correlazione lineare
10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche
DettagliRingraziamenti dell Editore
Indice Elenco dei simboli e delle abbreviazioni in ordine di apparizione Ringraziamenti dell Editore XI XVII 1 Introduzione FAQ e qualcos altro, da leggere prima 1 1.1 QuestoèunlibrodiStatistica....................
DettagliSommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25
Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità
DettagliAnalisi della varianza
1. 2. univariata ad un solo fattore tra i soggetti (between subjects) 3. univariata: disegni fattoriali 4. univariata entro i soggetti (within subjects) 5. : disegni fattoriali «misti» L analisi della
DettagliStatistica descrittiva II
Probabilità e Statistica Esercitazioni a.a. 009/010 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Statistica descrittiva II Ines Campa Probabilità e Statistica - Esercitazioni
DettagliStatistica. Matematica con Elementi di Statistica a.a. 2015/16
Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati
DettagliSignificatività ed analisi degli errori
Significatività ed analisi degli errori Quanto il valore sperimentale è vicino al valore vero? Campioni replicati: si esclude a priori che venga eseguita una sola misurazione Quanto il valore sperimentale
DettagliMisure di dispersione (o di variabilità)
14/1/01 Misure di dispersione (o di variabilità) Range Distanza interquartile Deviazione standard Coefficiente di variazione Misure di dispersione 7 8 9 30 31 9 18 3 45 50 x = 9 range=31-7=4 x = 9 range=50-9=41
DettagliStatistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi
Esercitazione 14 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 14 Ex.1: Verifica Ipotesi sulla media (varianza nota) Le funi prodotte da un certo macchinario hanno una
DettagliEsercizi di Probabilità e Statistica
Esercizi di Probabilità e Statistica Samuel Rota Bulò 6 giugno 26 Statistica Esercizio Sia {X n } n una famiglia di v.a. di media µ e varianza σ 2. Verificare che X = n n X i σ 2 = n (X i µ) 2 S 2 = n
DettagliRisoluzione di problemi ingegneristici con Excel
Risoluzione di problemi ingegneristici con Excel Problemi Ingegneristici Calcolare per via numerica le radici di un equazione Trovare l equazione che lega un set di dati ottenuti empiricamente (fitting
DettagliSchema lezione 5 Intervalli di confidenza
Schema lezione 5 Intervalli di confidenza Non centrerò quella barca, ne sono convinto al 95% COMPRENDERE: Significato di intervallo di confidenza Uso degli stimatori come quantità di pivot per stime intervallari
DettagliSTATISTICA ESERCITAZIONE
STATISTICA ESERCITAZIONE Dott. Giuseppe Pandolfo 1 Giugno 2015 Esercizio 1 Una fabbrica di scatole di cartone evade il 96% degli ordini entro un mese. Estraendo 300 campioni casuali di 300 consegne, in
Dettagli1.4. Siano X B(1, 1/2) e Y B(1, 1/2) variabili aleatorie indipendenti. Quale delle seguenti affermazioni é falsa? E(X + Y ) = 1 V ar(x + Y ) = 1/2
Statistica N. Crediti: Cognome: Laurea Triennale in Biologia Nome: 4 settembre 2012 Matricola: 1. Parte A 1.1. Siano x 1, x 2,..., x 10 i dati relativi al peso di 10 neonati espressi in chilogrammi e y
DettagliMATEMATICA CORSO A II COMPITINO (Tema 1) 5 Aprile 2013
MATEMATICA CORSO A II COMPITINO (Tema 1) 5 Aprile 2013 Soluzioni 1. Due sperimentatori hanno rilevato rispettivamente 25 e 5 misure di una certa grandezza lineare e calcolato le medie che sono risultate
DettagliApprossimazione normale alla distribuzione binomiale
Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N
DettagliCorso di laurea in Statistica Statistica I Esercizi sulla regressione lineare semplice
Corso di laurea in Statistica Statistica I Esercizi sulla regressione lineare semplice Esercizio 1 Efficacia di un disinfettante I dati della Tabella 1 mostrano i conteggi relativi alla presenza o meno
DettagliAnalisi della varianza
Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.
DettagliSTATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA
Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE
DettagliLezione 4 a - Misure di dispersione o di variabilità
Lezione 4 a - Misure di dispersione o di variabilità Abbiamo visto che la media è una misura della localizzazione centrale della distribuzione (il centro di gravità). Popolazioni con la stessa media possono
DettagliSTATISTICA Disciplina scien tifica che fornisce strumenti per l interpretazione delle informazioni contenute in insiemi di dati relativi a
STATISTICA Disciplina scien tifica che fornisce strumenti per l interpretazione delle informazioni contenute in insiemi di dati relativi a VARIABILI CASUALI VARIABILE Qualunque fenomeno espri mibile numericamente
DettagliElementi di Statistica
Università degli Studi di Palermo Dipartimento di Ingegneria Informatica Informatica ed Elementi di Statistica 3 c.f.u. Anno Accademico 2010/2011 Docente: ing. Salvatore Sorce Elementi di Statistica Statistica
DettagliPROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
DettagliESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo
Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova Docenti: Prof. L. Salmaso, Dott. L. Corain ESERCIZI Regressione lineare semplice
DettagliStatistica Applicata all edilizia: il modello di regressione
Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione
DettagliESERCIZI DI RIEPILOGO 1
ESERCIZI DI RIEPILOGO 1 ESERCIZIO 1 La tabella seguente contiene la distribuzione di frequenza della variabile X = età (misurata in anni) per un campione casuale di bambini: x i 4.6 8 3.2 3 5.4 6 2.6 2
DettagliProprietà della varianza
Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Intermezzo: ma perché dovremmo darci la pena di studiare come calcolare la varianza nel caso di somme,
DettagliUNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:
UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525 2 LEZIONE Statistica descrittiva STATISTICA DESCRITTIVA Rilevazione dei dati Rappresentazione
DettagliFENOMENI CASUALI. fenomeni casuali
PROBABILITÀ 94 FENOMENI CASUALI La probabilità si occupa di fenomeni casuali fenomeni di cui, a priori, non si sa quale esito si verificherà. Esempio Lancio di una moneta Testa o Croce? 95 DEFINIZIONI
Dettaglib) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):
ESERCIZIO 1 Una grande banca vuole stimare l ammontare medio di denaro che deve essere corrisposto dai correntisti che hanno il conto scoperto. Si seleziona un campione di 100 clienti su cui si osserva
Dettagli