TEST NON PARAMETRICI PER CORRELAZIONE, CONCORDANZA, REGRESSIONE MONOTONICA E REGRESSIONE LINEARE

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "TEST NON PARAMETRICI PER CORRELAZIONE, CONCORDANZA, REGRESSIONE MONOTONICA E REGRESSIONE LINEARE"

Transcript

1 CAPITOLO XXI TEST NON PARAMETRICI PER CORRELAZIONE, CONCORDANZA, REGRESSIONE MONOTONICA E REGRESSIONE LINEARE 1.1. La correlazone non parametrca ρ (rho) d Spearman, con la dstrbuzone d Hotellng-Pabst Il coeffcente d correlazone τ (tau) d Kendall; l τ a e τ b d Kendall con tes Confronto tra ρ e τ; potenza del test e numero d osservazon necessare per la sgnfcatvta Altr metod per la correlazone non parametrca: test d Ptman con le permutazon; test della medana d Blomqvst Il test d Danels per l trend Sgnfcatvta della regressone e della correlazone lneare parametrca con test nonparametrc ρ e τ Il coeffcente d correlazone parzale: τ 1,3 d Kendall, ρ 1,3 d Spearman Il coeffcente d concordanza tra valutator: la w d Kendall; sue relazon con la correlazone non parametrca e con l test d Fredman per k campon dpendent. Cenn sulla top-down concordance Cenn sul coeffcente d concordanza u d Kendall, n confront appaat La regressone lneare non parametrca Calcolo della retta d regressone non parametrca con l metodo d Thel o test d Thel-Kendall Confronto tra la retta parametrca e la retta d Thel Sgnfcatvta d b con l τ d Kendall La regressone lneare non parametrca con l metodo de tre grupp d Bartlett Il test d Hollander per l confronto tra due coeffcent angolar La regressone monotonca d Iman-Conover Trend lneare d Armtage per le proporzon e le frequenze 104

2 CAPITOLO XXI TEST NON PARAMETRICI PER CORRELAZIONE, CONCORDANZA, REGRESSIONE MONOTONICA E REGRESSIONE LINEARE 1.1. LA CORRELAZIONE NON PARAMETRICA ρ (rho) DI SPEARMAN, CON LA DISTRIBUZIONE DI HOTELLING-PABST. La correlazone è uno de metod statstc pù antch, dffuso gà all nzo del 900, almeno dec ann prma del test t d Student e quas trenta prma dell'anals della varanza. La metodologa non parametrca proposto da - C. Spearman nel 1904 (con l artcolo The proof and measurement of assocaton between two thngs su Amercan Journal of Psychology vol. 15, pp e con l artcolo A footrule for measurng correlaton, pubblcato nel 1906 su Brt. Journ. Psychol. n. ) è una correlazone basata su rangh, che rcorre agl stess concett della correlazone parametrca r d Pearson presentata anch'essa poco prma, nel 1900, e successvamente chamata Pearson s Product Moment Sample Correlaton Coeffcent. Questa metodologa non parametrca ha subto vare elaborazon e modfche. Era ancora dscussa negl ann 0, come può dmostrare l artcolo d W. S. Gosset (Student) del 191 An expermental determnaton of the probable error of Dr. Spearman s correlaton coeffcents (comparso su Bometrka vol. 13). Ora, dopo un secolo, è ancora uno de test pù ampamente utlzzat, per lo studo dell'assocazone tra due varabl quanttatve. In rfermento a test d correlazone non parametrca, n letteratura sono rcorrent termn d correlazone tra rangh, cograduazone, assocazone e concordanza. Da molt utent della statstca, sono usat come snonm; ma - prm due (correlazone e cograduazone) dovrebbero essere utlzzat n modo approprato solo con scale almeno d tpo ordnale, - mentre le ultme due (assocazone e concordanza) con scale qualtatve o categoral. Il coeffcente d correlazone d Spearman è sovente ndcato con l smbolo greco ρ (rho); n altr test è smboleggato con r S, per evdenzare la sua affntà con l test r d Pearson dal quale è dervato. Come esso, può varare - tra +1 e 1 quando la correlazone è massma, con valore postvo oppure negatvo; - è vcno a zero, quando non esste correlazone. 1

3 Il metodo rchede che entrambe le varabl sano msurate su una scala almeno ordnale, per cu ognuna delle due sere d msure, ndcate sovente con X e Y anche se non esste tra esse una relazone d causa effetto e dovrebbero essere correttamente ndcate con X 1 e X, non dovrebbe avere valor ugual entro la stessa sequenza. Questo metodo può essere pù potente del test r d Pearson anche per scale d'ntervallo o d rapporto, quando le condzon d valdtà del test parametrco non sono penamente soddsfatte. D conseguenza, come per altr test non parametrc, la sua utlzzazone è consglable nseme con l test parametrco, ad ulterore dmostrazone e verfca delle concluson raggunte. In partcolare quando s dsponga solo d poch dat e pertanto non sa possble dmostrare che le condzon d valdtà del test parametrco sono soddsfatte n modo completo. Il coeffcente d correlazone per rangh d Spearman serve per verfcare l'potes nulla dell'ndpendenza tra due varabl, nel senso che gl N valor della varable Y hanno le stesse probabltà d assocars con ognuno degl N valor d X. L potes alternatva d esstenza d una assocazone può prevedere un rsultato postvo oppure negatvo. Nel prmo caso è detta assocazone dretta: le coppe d valor sono contemporaneamente alt o bass sa per X che per Y; nel secondo caso, chamata anche assocazone ndretta, a valor alt d X corrspondono valor bass d Y o vceversa. Per una llustrazone ddattca chara, var passagg logc rchest dal metodo proposto da Spearman possono essere suddvs n 5 fas, d seguto presentate nella dmostrazone d un caso. e - sa blaterale H 0 : ρ 0 contro H 1 : ρ 0 - sa unlaterale n una drezone H 0 : ρ 0 contro H 1 : ρ > 0 oppure nell altra H 0 : ρ 0 contro H 1 : ρ < 0 è utle rportare dat come nella tabella seguente Varabl Coppe d valor osservat X Y Soggett A B C D E F G

4 - Successvamente, occorre ordnare rangh della varable X, assegnando 1 al valore pù pccolo e progressvamente valor nter maggor, fno ad N per l valore pù alto. Se dat della varable X hanno due o pù valor ugual, è necessaro assegnare ad ognuno d ess come rango la meda delle loro poszon. Varabl Coppe d valor osservat X Y Soggett B C A D F E G Anche se nnfluente a fn de calcol successv, è utle alla comprensone della msura d correlazone porre nell'ordne naturale (da 1 a N) rangh della varable X e spostare la collocazone de valor d Y relatv al medesmo soggetto, come nella tabella sovrastante. 3 - Sostture anche gl N valor d Y con rangh rspettv; per valor d Y ugual, usare la meda de loro rangh: Varabl Coppe d valor osservat X Y Soggett B C A D F E G S ottene la rga Y, rportata n grassetto. 4 - Se le due dstrbuzon (quella della sere delle X e quella della sere delle Y) - sono correlate n modo postvo (r +1), valor della varable X e della Y relatv allo stesso soggetto saranno ugual; - sono correlate n modo negatvo (r -1), a valor alt d X saranno assocat valor bass d Y e vceversa; - se tra le due varabl non esste correlazone (r 0), valor d X e d Y relatv agl stess soggett saranno assocat n modo casuale. 3

5 Per quantfcare questo grado d correlazone o concordanza, Spearman ha proposto la dstanza tra le coppe de rangh (d R ) Varabl Coppe d valor osservat X Y R R come calcolate nella terza rga (R ); successvamente devono essere elevate al quadrato come rportate nella quarta rga (R ) L ndcatore d correlazone, da cu dervano passagg logc e metodologc successv, è la somma d quest quadrat: d R Con dat dell esempo, la somma delle d R è uguale a 10 ( ) 5 - Quando r +1, le coppe d osservazon d X e Y hanno lo stesso rango e pertanto questa sommatora è uguale a 0. Quando r -1, se X è ordnato n modo crescente, Y è ordnato n modo decrescente: d conseguenza, le dfferenze sono massme e la sommatora raggunge un valore massmo determnato dal numero d coppe d osservazon (N). Quando r 0, mentre rangh d X sono ordnat n modo crescente quell d Y hanno una dstrbuzone casuale: la sommatora delle d R tende ad un valore medo, determnato dal numero d coppe d osservazon (N). Il test è fondato sulla statstca D d R ed è conoscuto anche come test statstco d Hotellng-Pabst (ved l artcolo d H. Hotellng e M. R. Pabst del 1936 Rank correlaton and tests of sgnfcance nvolvng no assumpton of normalty, n Annals of Mathematcal Statstcs, Vol. 7, pp ). Per essa sono state proposte tavole d valor crtc, al fne d valutare la sgnfcatvtà del test. 4

6 6 - Il coeffcente d correlazone tra rangh (ρ) d Spearman è dervato dalla formula della correlazone d Pearson Applcata a rangh, dopo semplfcazone dvene cod r dev xy x ρ Rx N + 1 Ry N( N 1) 1 N + 1 Il coeffcente d correlazone per rangh d Spearman è semplcemente l coeffcente d correlazone d Pearson applcato a rangh. Rtornando alla somma degl scart tra rangh, la formula abbrevata può essere scrtta come ρ 1 6 d 3 N N con N uguale al numero d coppe d osservazon. In var test, è scrtto con la formula equvalente 6 ρ N 1 R d R ( N 1) Quando due o pù valor d X o d Y sono dentc (tes) e pertanto hanno lo stesso rango, l'attrbuzone de puntegg med rduce l valore della devanza. Con poch valor dentc, l'effetto è trascurable. Con molt valor dentc, è bene calcolare un fattore d correzone T sa per la varable X (T x ) sa per la Y (T y ) g 3 1 ( ) T t t dove g è l numero d raggruppament con puntegg dentc e t è l numero d rangh dentc entro ogn raggruppamento. Con queste correzon, nel caso d molt valor dentc la formula completa del ρ d Spearman dventa 5

7 ρ T 3 N N 6 d + T 3 3 ( ) ( ) ( ) N N T + T N N + T T x x y x y y Come n tutt tes e gà evdenzato, la correzone determna - una dfferenza sensble quando uno stesso valore è uguale n molt cas, - un effetto trascurable o comunque rdotto quando s hanno molt valor rpetut solo volte. D conseguenza, nonostante la correzone, questo test è da evtare e può essere utle rcorrere ad altr metod, quando uno o pù valor sono rpetut con frequenza elevata, nella X e/o nella Y. Nel caso d pccol campon (N < 0-5), la sgnfcatvtà d ρ è fornta dalle tabelle de valor crtc. Nella pagna successva sono rportat valor crtc d ρ, sa per test a una coda che per test a due code. Alla probabltà α prefssata, s rfuta l potes nulla se l valore calcolato è uguale o superore a quello rportato nella tabella. Nel caso d grand campon (N > 0-5), quando è valda l'potes nulla d'assenza d correlazone, l valore d ρ è dstrbuto con meda 0 e devazone standard 1. Per la sua sgnfcatvtà è stato proposto - sa l rcorso alla dstrbuzone Z con la trasformazone Z ρ N 1 - sa alla dstrbuzone t d Student con gdl N - con la trasformazone d ρ t( N ) ρ N 1 ρ Tra t e Z, - l test t sembra preferble, n quanto gustamente pù cautelatvo ma pertanto meno potente, quando l campone ha meno d 50 osservazon; - per campon d dmenson maggor, due metod rsultano equvalent poché valor crtc sono quas concdent, - non dversamente da quanto avvene per l confronto tra due mede. 6

8 Valor crtc del coeffcente ρ d Spearman per test a 1 coda (1 a rga) e test a code ( a rga) α coda N code

9 ESEMPIO. La concentrazone delle sostanze organche present nell'acqua può essere msurata medante l BOD (da Bologcal Oxygen Demand, la rchesta bochmca dell'ossgeno), l COD (da Chemcal Oxygen Demand, la rchesta chmca dell'ossgeno) e l TOC (da Total Organc Carbon, l carbono organco totale). Lungo un corso d'acqua sono state fatte 16 rlevazon del BOD (a 5 gorn) e dell'azoto 5 ammonacale, con la successva sere d msure. Stazone BOD 5 N s 1 5 0,7 s 5 0,8 s 3 1 5,6 s ,3 s ,7 s 6 7 1,8 s 7 8 1,6 s 8 9 4,8 s 9 9 1,7 s ,8 s ,6 s , s ,6 s 14 15,9 s ,9 s 16 11,8 S ntende verfcare se tra le due sere d valor essta una correlazone postva sgnfcatva, nonostante la non normaltà delle dstrbuzon, come evdenza la semplce lettura de dat della stazone S 4.e S 5, ovvamente da confermare con le anals relatve. Rsposta. Il test è unlaterale, con H 0 : ρ 0 contro H 1 : ρ > 0 Il metodo può essere suddvso n 7 fas; per le prme 5, qu elencate, calcol sono rportat nella tabella successva: 1 - ordnare n modo crescente valor del BOD ed attrbure rangh relatv (colonne 1a e 1b); 5 - trasformare n rangh corrspondent valor d N (colonne a e b); 8

10 3 - calcolare la dfferenza d tra rangh (colonna 3); 4 - elevare al quadrato tal dfferenze (d nella colonna 4); 5 - calcolare la somma de quadrat delle dfferenze (somma delle d nella colonna 4); Con dat dell esempo, ( d R ) è uguale a 0, Per N uguale a 16, calcolare l valore d ρ ρ 1 6 d R 6 0, , 34 0,676 N N che rsulta uguale a 0,676. 1a a 1b b 3 4 Stazone BOD 5 N R(BOD ) 5 R( N ) d d s1 5 0,7 1,5 1 0,5 0,5 s 5 0,8 1,5-0,5 0,5 s6 7 1, s7 8 1, s9 9 1,7 5,5 4 1,5,5 s8 9 4,8 5,5 11, s16 11,8 7,5 6 1,5,5 s5 11 9,7 7,5 15-7,5 56,5 s3 1 5,6 9 13,5-4,5 0,5 s1 13 3, 10,5 8,5 6,5 s ,9 10,5 10 0,5 0,5 s ,6 1 13,5-1,5,5 s , ,5 1,5,5 s , s10 0, s4 35 4, Nella tabella de valor crtc, alla probabltà α 0.01 per un test a 1 coda l valore rportato è Il valore calcolato è superore: s rfuta l potes nulla e s accetta mplctamente l'potes alternatva dell'esstenza d un assocazone postva tra le due sere d dat rlevat. Benché l numero d dat (N 16) sa oggettvamente rdotto, la sgnfcatvtà può essere stmata sa con la dstrbuzone Z che con la dstrbuzone t d Student. Con l test Z s ottene un valore d Z uguale a,6. Z 0, ,676 3,873,6 9

11 Nella tabella della dstrbuzone normale unlaterale, a - Z,6 corrsponde la probabltà α L'approssmazone con l rsultato precedente è molto buona: con tabelle d ρ pù dettaglate e ovvamente all aumentare del numero d osservazon, la dfferenza rsulta trascurable; n questo caso è d crca l /1000. Con l test t s ottene t (15) 16 0, ,676 0, , t ( 15) 0,767 0,676 5,783 0,676 5,078 3,433 0,543 un valore d t uguale a 3,433 con 15 gdl. Nella tabella snottca de valor crtc del t d Student per un test unlaterale, - t (15) 3,433 s trova tra la probabltà α (t,947) e α (t 4,073) La conclusone non è molto dfferente da quella ottenuta con due metod precedent. I tre rsultat sono approssmatvamente equvalent. Un altro esempo d correlazone con l test r s d Spearman è rportato nel successvo paragrafo dedcato al test d Danels. Sono stat propost anche altr metod, per stmare la sgnfcatvtà della regressone non parametrca ρ d Spearman. Tra test a maggor dffusone, quello d - W. J. Conover del 1999 (Practcal nonparametrc statstcs, 3 rd ed. John Wley & Soons, New York, 584) rporta valor crtc de quantl, esatt quando X e Y sono ndpendent, - calcolat da G. J. Glasser e R. F. Wnter nel 1961 (nell artcolo Crtcal values of the coeffcent of rank correlaton for testng the hypothess of ndpendence, pubblcato su Bometrka Vol. 48, pp ). 10

12 1.. IL COEFFICIENTE DI CORRELAZIONE τ (tau) DI KENDALL; IL τ a E τ b DI KENDALL CON I TIES. Oltre 30 ann dopo l ρ (o r s ) d Spearman, - M. G. Kendall nel 1938 con l artcolo A new measure of rank correlaton (pubblcato su Bometrka vol. 30, pp ) e n modo pù dettaglato nel 1948 con la descrzone dettaglata della metodologa nel volume Rank correlaton methods (edto a Londra da C. Grffn) ha proposto l test τ (tau). Questo metodo - ha le stesse assunzon, - può essere utlzzato nelle medesme condzon e - su medesm dat del test ρ d Spearman. I rsultat tra due test sono molto sml, anche se matematcamente non equvalent, per motv che saranno d seguto spegat con l llustrazone della metodologa. Tuttava, da parte d molt autor l ρ d Spearman è preferto perché pù semplce, meglo conoscuto e del tutto analogo al coeffcente parametrco r d Pearson. Il vantaggo del test τ derva dalla sua estensone - sa all'anals de coeffcent d correlazone parzale o netta (llustrata ne paragraf successv), che tuttava successvamente è stata estesa anche al ρ con rsultat equvalent, - sa alla msura dell accordo tra gudz multpl. La metodologa per stmare l τ d Kendall può essere suddvsa n 6 fas: le prme due sono ugual a quelle del test ρ d Spearman, s dfferenza per la msura dell accordo tra le due dstrbuzon. 1 - Dopo la presentazone tabellare de dat con due msure per ogn oggetto d osservazone Varabl Coppe d valor osservat X Y Oggett A B C D E F G occorre ordnare per rangh la varable X, assegnando l rango 1 al valore pù pccolo e progressvamente un rango maggore, fno ad N, al valore pù grande. Se sono present due o pù valor ugual nella varable X, assegnare ad ognuno come rango la meda delle loro poszon. 11

13 La scala comunque dovrebbe essere contnua, anche se d rango, e qund non avere valore dentc, se non n cas eccezonal. E' ndspensable collocare nell'ordne naturale (da 1 a N) rangh della varable X, spostando d conseguenza valor della Y relatv agl stess soggett Varabl Coppe d valor osservat X Y Oggett B C A D F E G - Sostture gl N valor d Y con rangh rspettv; per valor d Y ugual, come al solto usare la meda de rangh. I rangh d Y rsultano dstrbut secondo l rango della varable X, come nella tabella seguente: Varabl Coppe d valor osservat X Y Oggett B C A D F E G Il metodo proposto da Kendall utlzza le nformazon fornte dall ordne della sola varable Y. E un concetto che rchama l metodo delle precedenze, gà utlzzate n var test nn parametrc per l confronto tra le tendenze central. 3 - Se le due dstrbuzon sono correlate - n modo postvo (r +1), anche rangh della varable Y sono ordnat n modo crescente, concordant con l'ordne naturale; - n modo negatvo (r -1), valor d Y rsulteranno ordnat n modo decrescente e saranno dscordant dall'ordne naturale; 1

14 - se tra le due varabl non esste correlazone (r 0), l'ordne della varable Y rsulterà casuale e l numero d rangh concordant e d quell dscordant dall'ordne naturale tenderà ad essere uguale, con somma 0. Per quantfcare l grado d correlazone o concordanza, Kendall ha proposto d contare per la sola varable Y Y quante sono le coppe d rangh che sono concordant e - quante quelle dscordant dall'ordne naturale. Per esempo, elencando n modo dettaglato tutte le sngole operazon, - l valore è seguto da 1: non è nell ordne naturale e pertanto contrburà con -1; noltre è seguto da altr 5 valor maggor, che contrburanno nseme con +5: l contrbuto complessvo del valore al calcolo delle concordanze è uguale a +4; - l valore 1 è seguto da 5 valor maggor e contrburà con + 5; - l valore 4 contrbusce con -1, perché seguto dal 3, e con +3, n quanto 3 successv sono maggor, per un valore complessvo d +; - l valore 3 contrbusce con +3; - l valore 7 contrbusce con -, n quanto seguto da valor mnor; - l valore 5 contrbusce con l valore 6 è l ultmo e non fornsce alcun contrbuto al calcolo delle concordanze; con esso termna l calcolo delle dfferenze tra concordanze e dscordanze. Nella tabella seguente è rportato l conteggo dettaglato e complessvo delle concordanze (+) e delle dscordanze (-) Totale Totale (concordanze meno dscordanze)

15 La msura della concordanza complessva con la varable X è dato dalla somma algebrca d tutte le concordanze e le dscordanze. Il totale d concordanze e dscordanze de 7 valor dell esempo (+4, +5, +, +3, -, +1) è uguale a Per rcondurre l valore calcolato a un campo d varazone compreso tra +1 e 1, l numero totale d concordanze e dscordanze d una sere d valor deve essere rapportato al massmo totale possble. Poché confront sono fatt a coppe, con N dat l numero totale d confront concordant o dscordant è dato dalla combnazone d N element a C N Con una sere d 7 dat come nell esempo, l numero complessvo d confront, qund l massmo totale possble d concordanze o dscordanze, è 7! C 7 ( 7 )!! uguale a Secondo l metodo proposto d Kendall, l grado d relazone o concordanza (τ ) tra la varable X e Y può essere quantfcato dal rapporto τ totale( concordanze dscordanze) totale( concordanze dscordanze) massmo totale possble C N Con 7 dat dell esempo, τ è uguale a +0,619. τ ,619 Il τ d Kendall vara n modo smle al coeffcente r d Pearson: è - +1, quando la correlazone tra X e Y è massma e postva, - -1, quando la correlazone tra le due varabl è massma e negatva; - 0, quando non esste alcuna correlazone. La formula abbrevata è τ totale( concordanze dscordanze) N ( N 1) 14

16 dove N è l numero d coppe d dat. Nel caso n cu sano present due o pù valor dentc nella successone delle Y, l confronto con l ordne naturale non determna né una concordanza né una dscordanza: l loro confronto non contrbusce al calcolo d τ e s rduce l valore d N. La mancata correzone comporterebbe che l rango d varazone non sarebbe pù tra -1 e +1. Consderando la presenza d valor dentc sa nella varable Y sa nella varable X, la formula corretta dventa τ totale( concordanze dscordanze) N ( N 1) T N ( N 1) T dove - N è l numero totale d coppe d dat delle varabl X e Y, - Tx ( tx tx) dove - t x è l numero d osservazon dentche d ogn gruppo d valor dentc della varable X, - Ty ( ty ty) dove - t y è l numero d osservazon dentche d ogn gruppo d valor dentc della varable Y. x y Nel caso d tes, da L. A. Goodman e W. H. Kruskal nel 1963 (ved l artcolo Measures of assocaton for cross-classfcatons. III: Approxmate sample theory, pubblcato su Journal of the Amercan Statstcal Assocaton Vol. 58, pp ) hanno proposto che τ sa stmato con la relazone dove - N C numero d concordanze - N D numero d dscordanze τ N N C C N + N D D Questo valore τ è strettamente correlato con l coeffcente gamma (gamma coeffcent), tanto da poter essere dentfcato con esso, come sarà dmostrato nel paragrafo dedcato a tale ndce; ha l grande vantaggo d varare tra +1 e 1 anche quando sono present de tes. 15

17 Valor crtc del coeffcente d correlazone semplce τ d Kendall per test a 1 coda e a code α coda N code

18 Per pccol campon, valor crtc sono fornt dalla tabella relatva, rportata nella pagna precedente. Il rsultato dell esempo, con N 7, per un test ad 1 coda rsulta sgnfcatvo alla probabltà α Per grand campon la sgnfcatvtà del τ d Kendall può essere verfcata con la dstrbuzone normale Z τ µ σ τ Z (*) τ Quando è vera l'potes nulla (assenza d correlazone o d assocazone), - per la meda µ τ vale l'uguaglanza µ τ (coè l'ordne della varable Y è casuale e la somma totale delle sue concordanze e dscordanze è nulla), 0 - mentre la varanza σ τ è data da dove N è l numero d coppe d dat. ( N + 5) σ τ 9N ( N 1) Sosttuendo nella precedente relazone(*) per la normale Z e semplfcando, con la formula abbrevata s ottene - una stma pù rapda d Z medante la relazone Z 3τ n ( n 1) (n + 5) Anche n questo caso sono stat propost altr metod per valutare la sgnfcatvtà d τ. Tra test a maggor dffusone, quello d - W. J. Conover del 1999 (Practcal nonparametrc statstcs, 3 rd ed. John Wley & Soons, New York, 584) rporta valor crtc de quantl, esatt quando X e Y sono ndpendent, - propost da D. J. Best nel 1973 (nell artcolo Extended tables for Kendall s tau, pubblcato su Bometrka Vol. 60, pp ) e nel 1974 (nella relazone Tables for Kendall s tau and an examnaton of the normal approxmaton, pubblcato su Dvson of Mathematcal Statstcs, 17

19 Techncal Paper n 39, edto da Commonwealth Scentfc and Industral Research Organzaton, Australa) ESEMPIO. Medante l τ d Kendall, rspondere alla medesma domanda d verfca della sgnfcatvtà dell'assocazone tra le varabl X e Y, utlzzando gl stess dat dell'eserczo precedente sul ρ d Spearman a 3b 4 Stazone BOD 5 N R(BOD ) 5 R( N ) concord. dscord. dff. s1 5 0,7 1, s 5 0,8 1, s6 7 1, s7 8 1, s9 9 1,7 5, s8 9 4,8 5,5 11, s16 11,8 7, s5 11 9,7 7, s3 1 5,6 9 13, s1 13 3, 10, s ,9 10, s ,6 1 13, s , , s , s10 0, s4 35 4, Totale dfferenze (concordanze dscordanze) 63 La metodologa del τ d Kendall rchede seguent passagg (rportat nella tabella da colonna 1 a colonna 4): 1 - ordnare n modo crescente valor del BOD ed attrbure rangh relatv; 5 - trasformare n rangh corrspondent valor d N; 3 - calcolare per ogn punteggo d N l numero d concordanze e d dscordanze; 4 - calcolare la somma complessva d tutte le concordanze e le dscordanze. La somma totale delle dfferenze tra concordanze e dscordanze rsulta postva (+63). 5 - Tradotto nel corrspondente coeffcente medante τ ( + 63) ,

20 s ottene un valore d τ uguale a +0, Per un test unlaterale, la tabella de valor crtc del τ d Kendall - con N 16 e alla probabltà α rporta un valore d τ uguale a 0,483. Il valore calcolato (0,55) è superore n modulo. D conseguenza, s rfuta l'potes nulla e s accetta l'potes alternatva: esste un assocazone o correlazone postva tra le due sere d dat, con probabltà P < d commettere un errore d I tpo. Il campone utlzzato nell esempo può essere rtenuto suffcentemente grande. Pertanto, è possble valutare la sgnfcatvtà del coeffcente τ + 0,55 medante l test Z: Z 3τ n ( n 1) (n + 5) 3 ( + 0,55) (3 + 5) + 1, ,340 +,93 8,307 che rsulta Z +,93. Nella dstrbuzone normale, a Z uguale a,93 per un test ad una coda corrsponde una probabltà P 0,0017. E un rsultato che non s dscosta n modo rlevante da quello precedente, fornta dalle tabelle de valor crtc. Alcun test d statstca presentano una procedura d calcolo delle precedenze che è pù complessa d quella llustrata e propongono msure dfferent (τ a, τ b ); la scelta tra τ a e τ b dpende dal numero d valor dentc e qund dalla contnutà del tpo d scala utlzzato. E possble determnare cas concord, dscord oppure a par merto, confrontando smultaneamente valor d X e Y n una coppa d oggett. Una coppa d cas è - concorde (P), se per un oggetto valor d entramb le varabl sono pù bass o pù alt rspetto a valor dell altro caso; - dscorde (Q), se per una varable è maggore e per l altra mnore, o vceversa; - par merto (T), se hanno lo stesso valore per la varable X (T X ) o per la varable Y (T Y ). 19

21 Il τ a è la dfferenza tra coppe concord e dscord (P-Q), rapportata al numero totale d coppe d oggett: P Q τ a C n Se non esstono coppe con valor ugual, questa msura vara tra -1 e +1. Se esstono coppe con valor ugual, l campo d varazone è pù lmtato e dpende dal numero d valor par merto present sa nella varable X che nella varable Y. Il τ b normalzza la dfferenza P-Q, prendendo n consderazone anche valor par merto delle due varabl n modo separato τ b P Q ( P+ Q+ T ) ( P+ Q+ T ) X Y L assocazone tra due varabl può essere valutate anche con altr metod, che utlzzano tabelle d contngenza CONFRONTO TRA ρ E τ; POTENZA DEL TEST E NUMERO DI OSSERVAZIONI NECESSARIE PER LA SIGNIFICATIVITA. I coeffcent d correlazone non parametrca ρ d Spearman e τ d Kendall rchedono varabl almeno d tpo ordnale. Se valor sono msurat su una scala ad ntervall o d rapport, le osservazon devono essere trasformate ne loro rangh. Anche con rangh, è possble calcolare l coeffcente d correlazone r d Pearson, utlzzandol appunto al posto de valor rlevat. E nteressante osservare che l rsultato della correlazone non parametrca ρ d Spearman concde con quello ottenuto medante l metodo r d Pearson, quando sono utlzzat rangh. E una convergenza tra test parametrco e non parametrco corrspondente, gà evdenzata per altr test: - per l ANOVA con la varanza non parametrca d Kruskall-Walls, - per l test t d Student con l test U d Mann-Whtney. Nonostante questa concdenza de rsultat, è mportante comprendere che la correlazone parametrca e quella non parametrca analzzano caratterstche dfferent della relazone esstente tra le due varabl. Mentre - la correlazone parametrca d Pearson valuta la sgnfcatvtà d una correlazone d tpo lneare, 0

22 - la correlazone non parametrca d Spearman e d Kendall valutano l esstenza della monotonctà; è una condzone pù generale, realzzata sempre quando esste regressone lneare. In altr termn, la correlazone non parametrca - rsulta + 1 quando all'aumentare della prma varable aumenta anche la seconda, - rsulta 1 quando all aumentare della prma la seconda dmnusce, ma senza rchedere che tal ncrement sano costant, come per la retta. Con termn pù tecnc, l concetto è che - se due varabl hanno una regressone monotonca, - loro rangh hanno una relazone lneare. Il testo d W. J. Conover del 1999 (Practcal nonparametrc statstcs, 3 rd ed. John Wley & Soons, New York, 584) mostra l dagramma d dspersone e l tpo d relazone tra le due varabl nella seguente sere d valor X 0 0,5 1,0 1,8,,7 4,0 4,0 4,9 5,6 6,0 6,5 7,3 8,0 8,8 9,3 9,8 Y >30 >30 > CURVA DI REGRESSIONE MONOTONICA CON I DATI OSSERVATI Nella tabella e nel grafco, 1

23 - n 17 contentor e con una osservazone della durata d 30 gorn, - X è la quanttà d zucchero aggunta al mosto d uva, - Y è l numero d gorn dopo qual ha avuto nzo la fermentazone. Nelle tre quanttà mnor, (coè con X uguale a 0 po 0,5 e 1,0) la fermentazone non aveva ancora avuto nzo dopo 30 gorn d osservazone (> 30). Con dat orgnal, rportat nella tabella e nel grafco, per utlzzare la correlazone r d Pearson - un prmo problema è rappresentato dalla presenza d dat stmat con approssmazone, addrttura troncat censored come >30, per cu non è possble l calcolo né delle mede né della codevanza e delle devanze; - l secondo problema è una lneartà de dat molto approssmata, come la rappresentazone grafca evdenza vsvamente. Quando al posto de valor s utlzzano rangh relatv (nella tabella successva valor precedent sono stat trasformat n rangh) Rx ,5 7, Ry ,5 9, , ,5 5 la rappresentazone grafca evdenza la dfferente dstrbuzone lneare de punt DISPOSIZIONE DEI PUNTI E RETTA DI REGRESSIONE OTTENUTA CON LA TRASFORMAZIONE DEI DATI IN RANGHI

24 Quest concett, come calcolare punt della curva segmentata della fgura precedente e come calcolare la retta con n rangh n quella sovrastane sono svluppat nel paragrafo dedcato alla regressone monotonca d Iman-Conover. Per quanto attene la potenza de due test, l ρ d Spearman e l d τ Kendall hanno la stessa potenza nel rfutare l'potes nulla, anche se valor d ρ e τ sono numercamente dfferent per lo stesso campone d dat. Stme dell effcenza asntotca relatva d Ptman per l test τ d Kendall, ovvamente rspetto al test parametrco r d Pearson e nel caso che l potes nulla sa vera, rportano che; - quando la dstrbuzone de dat è Normale, la potenza del τ è uguale a 0,91 (3/π) ; - quando la dstrbuzone de dat è Rettangolare, la potenza del τ è uguale a 1; - quando la dstrbuzone de dat è Esponenzale Doppa, la potenza del τ è uguale a 1,66 (81/64). Quando l'potes nulla H 0 è vera, le probabltà α fornte da due metod sono molto sml; per grand campon dstrbut normalmente, esse tendono ad essere molto sml. Ma quando l'potes nulla H 0 è falsa, qund s accetta come vera l'potes alternatva H 1, due dfferent ndc sono dversamente sensbl alle dstorson determnate dal dverso campo d varazone (quest concett sono svluppat nel capto della correlazone parametrca e dell ntervallo d confdenza d r); d conseguenza, rsultat tendono a dfferre maggormente. Con dat dell esempo utlzzato nel paragrafo precedente, per un test unlaterale - con l ρ d Spearman è stato ottenuto un valore d Z,6 corrspondente alla probabltà α con l τ d Kendall è stato ottenuto un valore d Z,93 che corrsponde a una probabltà α La dfferenza tra le probabltà stmate con due dvers ndc è n assoluto nferore al 3/1000 e qund oggettvamente molto lmtata; ma è elevata (,59 a 1), se consderata n rapporto alle pccole probabltà stmate. E uno de problem che s pone nella valutazone de rsultat: se è pù corretto fornre una stma n termn assolut oppure n termn relatv. Per l confronto tra ρ e τ, al momento non è noto quale ndce n generale da l valore pù corretto. Quant dat è necessaro raccoglere perché una regressone non parametrca sa sgnfcatva? 3

25 Secondo la proposta d G. E. Noether del 1987 (ved artcolo Sample sze determnaton for some common nonprametrc tests, su Journal of the Amercan Statstcal Assocaton Vol. 8, pp ), rportata nel testo d P. Sprent e N. C. Smeeton del 001 (Appled nonparametrc statstcal methods, 3 rd ed. Chapman & Hall/CRC, 461 p.) e n quello d M. Hollander e D. A. Wolfe del 1999 (Nonparametrc Statstcal Methods, nd ed., New York,, John Wley & Sons) una stma approssmata del numero (n) d dat necessar affnché un valore τ 1 d correlazone non parametrca sa sgnfcatvo alla probabltà α e con rscho β è data dalla relazone 4 n ( Z + Z ) α 9 τ dove - τ 1 è l valore d τ che s vuole rsult sgnfcatvo rspetto all potes nulla H 0 : τ 0 - α è la probabltà o rscho d I Tpo, scelta per l test, la cu potes alternatva può essere blaterale oppure unlaterale - β è la probabltà o rscho d II tpo d non trovare una dfferenza che n realtà esste, - rcordando che, per prass e n accordo con l ndcazone d Cohen, la probabltà β è scelta con un rapporto d crca 5 a 1 rspetto a α. 1 β ESEMPIO (CON TEST BILATERALE). Una anals prelmnare d una sere d rlevazon ha permesso d stmare un valore d correlazone non parametrca τ 0,3. Quant dat (n) occorre raccoglere perché tale valore rsult sgnfcatvamente dfferente da 0, n un test blaterale alla probabltà α 0.05 e con un rscho β 0.0 (qund con una potenza 1 - β 0.80)? Rsposta. Dalla tabella della dstrbuzone normale, s rcava - per α 0.05 blaterale, Z α 1,96 - per β 0,0 (sempre unlaterale), Z β 0,84 Da ess rsulta che n 4 ( Z α + Z β ) 4 ( 1,96 + 0,84) 9 τ 1 9 0,3 31,36 38,7 0,81 che l numero d dat necessaro è almeno 39. 4

26 Per rfutare l potes nulla H 0 : τ 0 ed accettare mplctamente l potes alternatva blaterale H 1 : τ 0 alla probabltà α 0.05 e con una potenza 1-β 0.0, con τ 1 0,3 servono almeno 39 osservazon. ESEMPIO (CON TEST UNILATERALE). Nell esempo precedente, quant dat è necessaro raccoglere se l test che s vuole utlzzare è unlaterale? Rsposta. Dalla tabella della dstrbuzone normale, s rcava - per α 0.05 unlaterale, Z α 1,645 - per β 0,0 (sempre unlaterale), Z β 0,84 Da ess rsulta che n 4 ( Z α + Z β ) 4 ( 1, ,84) 9 τ 1 9 0,3 4,70 0,81 30,5 che l numero d dat necessaro è almeno 31. Se la potenza (1 - β) è 0.90, qund con β 0.10 l cu valore d Z β 1,8 l numero mnmo d dat necessar n 4 ( Z α + Z β ) 4 ( 1, ,8) 9 τ 1 9 0,3 34, 0,81 4, dventa n ALTRI METODI PER LA CORRELAZIONE NON PARAMETRICA: TEST DI PITMAN CON LE PERMUTAZIONI; TEST DELLA MEDIANA DI BLOMQVIST. Per l anals della correlazone non parametrca, sono stat propost altr metod molto meno not poché rportat raramente sa ne test d statstca applcata sa nelle lbrere nformatche a grande dffusone nternazonale. D norma, sono test meno potent del ρ e del τ, n quanto fondat su condzon d valdtà pù general; altr, n stuazon contngent, offrono alcun vantagg pratc. Nella rcerca applcata è qund utle la conoscenza d alcun d quest metod. 5

27 Tra ess, rportat nell ultma versone nel testo d P Sprent e N. C. Smeeton del 001 dal ttolo Appled Nonparametrc Statstcal Methods (Chapman & Hall/CRC, London, 461 p.) possono essere rcordat: - l test d Ptman, quando s dspone d un numero d dat partcolarmente rdotto; - l test della medana d Blomqvst, quando le due sere d msure sono approssmate o contengono valor con attendbltà dfferente, con tutt vantagg e gl svantagg propr de test della medana gà presentat. S supponga che questo dagramma d dspersone, tratto dal testo d Sprent e Smeeton ctato, sa la rappresentazone grafca del numero d error commess da 1 allev mpegnat prma n un compto d matematca (M) e successvamente n uno d lngua stranera (L): Matematca (X) Lngua (Y)

28 Che tpo d relazone esste tra le due sere d dat? Può essere vera la teora che afferma che gl student mglor n matematca sono mglor anche nell apprendmento delle lngue? L nterpretazone, sempre necessara dal punto d vsta dscplnare seppure non rchesta dall anals statstca, potrebbe essere che mglor n matematca sono tal perché pù dlgent, logc e studos; qund, con poche eccezon, anche mglor n tutte le altre dscplne, tra cu lo studo della lngua. Ma può essere ugualmente convncente anche la teora opposta. Ch è portato alla logca matematca ha poca atttudne per l apprendmento alle lngue; noltre la conoscenza delle lngue stranere rchedono attvtà e mpegn, come vagg, soggorn all estero e contatt con le persone, che male s conclano con lo studo e la rflessone rchest dalla matematca. I rsultat della tabella e la loro rappresentazone nel dagramma d dspersone sembrano complessvamente (all mpressone vsva che tuttava deve essere tradotta nel calcolo delle probabltà con un test) deporre a favore della prma teora; ma l punto anomalo, l allevo che ha commesso pù error n matematca e nessuno n lngua, forse per condzon famlar partcolar, è un dato mportante a favore della seconda teora. Come tutt valor anomal, questo dato da solo sembra n grado d contraddre l anals fondata su tutt gl altr, almeno d annullarne le concluson. I metodo parametrc, che rcorrono al quadrato degl scart, danno un peso rlevante a quest dat anomal; ma la loro presenza evdenza una condzone d non valdtà d tale anals. Per quanto attene la verfca statstca d queste teore medante l anals della regressone, dat rportat, costrut ad arte ma verosml nella rcerca applcata come affermano due autor, rappresentano un esempo ddattco che bene evdenza quattro caratterstche de dat, da dscutere sempre nella scelta del test pù adatto per anals con la correlazone: - l tpo d scala, - la normaltà della dstrbuzone, - l omogenetà della varanza, - la presenza d un valore anomalo. Anche questa breve ntroduzone evdenza quanto sa utle avere un quadro ampo delle opportuntà offerte da test, per sceglere sempre quello con la potenza maggore, n rapporto alle caratterstche de dat e nel peno rspetto de presuppost d valdtà. Nel 1937, E. J. G. Ptman ha proposto un test d correlazone non parametrca (ved l artcolo Sgnfcance tests that may appled to samples fron any populaton, II: The correlaton coeffcent 7

29 test, pubblcato su Journal of the Royal Statstcal Socety, Suppl. 4, pp. 5-3), che utlzza l calcolo combnatoro gà llustrato ne test d casualzzazone per due campon dpendent e per due campon ndpendent. Per verfcare l potes nulla sulla correlazone (H 0 : ρ 0) contro un potes alternatva sa blaterale (H 1 : ρ 0), che può essere anche unlaterale n una delle due drezon (H 1 : ρ < 0 oppure H 1 : ρ > 0), propone un test esatto, fondato sulle permutazon. Svluppando un esempo ddattco con sol 4 coppe d dat, - dopo aver ordnato valor della varable X n modo crescente, come ne metod d Spearman e d Kendall, - prende n consderazone la varable Y, stmandone tutte le possbl permutazon, che con n dat sono n! Con n 4 esse sono 4! 4 come nella tabella successva, nella quale sono organzzate n modo logco e con valor d ρ tendenzalmente decrescente. Elenco de cas Rango 1 Rango Rango 3 Rango 4 ρ , , , , , , , , , , , , , , , , , , , , , , , ,0 8

30 Tale dstrbuzone può essere rassunta n una tabella, qu organzzata n modo crescente per l valore d ρ 4,5 4,0 3,5 3,0,5,0 1,5 1,0,5-1 -0,8-0,6-0,4-0, 0 0, 0,4 0,6 0,8 1 DISTRIBUZIONE DEI VALORI DI CORRELAZIONE Valor d ρ -1,0-0,8-0,6-0,4-0, 0,0 +0, +0,4 +0,6 +0,8 +1,0 N Freq. Rel. 0,04 0,15 0,04 0,166 0,083 0,084 0,083 0,166 0,04 0,15 0,04 (Le frequenze relatve sono arrotondate alla terza cfra, affnché l totale sa 1,00) Con la dstrbuzone d frequenza d tutte le permutazon, s rfuta l potes nulla H 0 quando la sere osservata degl Y camponar è collocata agl estrem della dstrbuzone, nella zona d rfuto 9

31 Nel caso dell esempo, se l potes alternatva fosse stata H 1 : ρ > 0 s sarebbe potuto rfutare l potes nulla solo se la dstrbuzone camponara fosse stata quella estrema, rportata per ultma nella tabella con l'ordne crescente de valor, coè quella con rangh 1,, 3, 4 n ordne naturale. Infatt la probabltà d trovarla per caso, nella condzone che H 0 sa vera, è P < 0.05 (esattamente P 0.04, avendo frequenza 1/4). La dffusone de computer e d programm nformatc approprat permette l uso d questo metodo. Con poch dat, come con 4 rangh, la dstrbuzone delle probabltà ha forma smmetrca ma non normale, evdenzata vsvamente dalla fgura precedente. Per un numero pù alto d osservazon, la dstrbuzone delle probabltà tende alla normale, rcordando che l numero delle permutazon cresce rapdamente all aumentare d n! Ad esempo con 8! è gà 4030 e con 10! è addrttura Nel caso qu presentato, l metodo delle permutazon è stato applcato a rangh per semplctà ddattca. In realtà questo test d permutazone dovrebbe essere applcato a valor osservat, rchedendo le stesse condzon d valdtà d tutt test d permutazone, coè la dstrbuzone normale de dat. In tale condzone l valore d correlazone vara da 1 a +1 e la sua effcenza asntotca relatva o effcenza d Ptman è stmata uguale a 1. Ovvamente offre gl stess vantagg de test d permutazone, con campon pccol: - la possbltà d calcolare drettamente la sgnfcatvtà, con un numero mnmo d dat; - la stma delle probabltà esatte. Per grand campon è napplcable, anche lmtando l anals a valor collocat nella zona d rfuto, per l numero rapdamente crescente delle permutazon. Il test della medana per la correlazone, analogo al test della medana per due campon, n realtà è un test d assocazone; nell artcolo d presentazone, dall autore (Blomqvst) è stato chamato test d dpendenza tra due varabl casual. Il metodo è stato proposto nel 1950 da N. Blomqvst con l artcolo On a mesure of dependence between two random varables (pubblcato su The Annals of Mathematcal Statstcs, Vol. 1, pp ); nel 1951 è stato rpreso sulla stessa rvsta n un elenco d test analogh, nell artcolo Some tests based on dchotomzaton (The Annals of Mathematcal Statstcs, Vol., pp ). Questo test è utle n partcolare quando la dstrbuzone de dat s allontana dalla normaltà, come nell esempo rportato n precedenza. I dat rappresentat nel dagramma d dspersone possono essere rportat n un tabella d contngenza x, consderando 30

32 - la collocazone de punt sopra o sotto la medana, - conguntamente per la varable X e la varable Y - n modo da rspettare la loro collocazone grafca. I punt del dagramma d dspersone, nel quale le due rette perpendcolar rappresentano la medana d X e la medana d Y, permettono d costrure la tabella x con facltà: Dal grafco è semplce rcavare la tabella d contngenza x : Varable X < Medana > Medana Totale Varable > Medana Y < Medana Totale

33 Se l potes nulla H 0 fosse vera, nel grafco e nella tabella da esso rcavata, valor della varable X e della varable Y dovrebbero essere dstrbut n modo ndpendente; percò avere frequenze sml ne quattro quadrant e qund nelle quattro caselle. La casualtà della dstrbuzone osservata può essere verfcata con l metodo esatto d Fsher. Esso permette anche d stmare la probabltà esatta n un test unlaterale. L uso de computer ha esteso con facltà l calcolo a grand campon. Rprendendo concett fondamental d tale metodo applcat a questo caso, per verfcare l potes H 0 : ρ 0 contro H 1 : ρ > 0 - dapprma s calcola la probabltà d ottenere la rsposta osservata (dove l valore mnmo n una casella è 1) 6! 6! 6! 6! P 1! 5! 5! 1! 1! 1 0, successvamente quella delle rsposte pù estreme nella stessa drezone, che n questo caso è solamente una: Varable X < Medana > Medana Totale Varable > Medana Y < Medana Totale ! 6! 6! 6! P 0! 6! 6! 0! 1! 0 0, Infne, per semplce somma, s rcava la probabltà d avere la rsposta osservata e tutte quelle pù estreme nella stessa drezone (n questo caso solo una), nella condzone che H 0 sa vera P P1 + P0 0, , ,04004 Con dat dell esempo, s rcava una probabltà totale nferore al 5%, che ndca d rfutare l potes nulla e qund mplctamente d accettare quella alternatva. Se l test fosse stato blaterale, tale probabltà dovrebbe essere raddoppata. 3

34 Per le ndcazon che ne dervano sulla scelta del test pù approprato, è nteressante confrontare questo rsultato con quello ottenuto applcando l test r d Pearson, ρ d Sperman e τ d Kendall agl stess dat del grafco, coè alla sere bvarata: M (X) L (Y) Utlzzando un programma nformatco a grande dffusone, sono stat ottenut rsultat de tre test. A) Con l test r d Pearson l valore d correlazone è rsultato r 0,373. In un test unlaterale, ad esso corrsponde una probabltà P Non solo non permette d rfutare l potes nulla, ma ndurrebbe a rtenere che l potes nulla sa vera, dato l valore elevato della probabltà P stmata. B) Con l test ρ d Spearman s è ottenuto un valore d correlazone ρ 0, 434. In un test unlaterale, ad esso corrsponde una probabltà P che non permette d rfutare l potes nulla. C) Con l test τ d Kendall s è ottenuto un valore d correlazone τ 0, 44; pù esattamente l programma rporta τ b 0, 44. In un test unlaterale, ad esso corrsponde una probabltà P 0.07 che permette d rfutare l potes nulla. Questo confronto tra tre metod che analzzano la correlazone con gl stess dat evdenza la forte dfferenza, attesa a causa del tpo d dstrbuzone, tra due test non parametrc e quello parametrco. Ma evdenza anche una marcata dfferenza, nattesa anche se nota ed effetto della forte anomala della dstrbuzone, tra ρ e τ. Purtroppo non è stato ancora proposto un metodo per raccordare logcamente due probabltà così dfferent e trarne una decsone fnale condvsa. In conclusone, con dat dell esempo, l test pù semplce, fondato su segn (P 0.04) e qund con condzon d valdtà pù general e rspettate anche n questo caso, s dmostra l pù potente e l pù corretto. 33

35 Per una esatta comprensone de metod e una dzone corretta delle concluson, è mportante rcordare ancora che tre tp d test verfcano l esstenza d rapport dfferent tra le due varabl. Se un test rsulta sgnfcatvo, - nella correlazone parametrca dmostra l esstenza d una relazone lneare, - mentre nella correlazone non parametrca dmostra l esstenza d una relazone monotonca; - con l test della medana dmostra solamente che esste assocazone (se postva o negatva dpende dal segno) tra valor alt e bass delle due varabl IL TEST DI DANIELS PER IL TREND Nel 1950, H. E. Danels (con l artcolo Rank correlaton and populaton models, pubblcato su Journal of the Royal Statstcal Socety (B), vol. 1, pp ) ha proposto d utlzzare l test ρ d Spearman - per verfcare se nel tempo una varable camba n modo monotonco, con potes sa unlaterale che blaterale come è possble per la correlazone, - contro l potes nulla che essa s mantenga costante, coè che l tempo e l altra varable rlevata sano mutuamente ndpendent. Il test può essere faclmente esteso ad una successone spazale. Per gl stess scop, var rcercator utlzzano anche l test τ d Kendall. I rsultat sono del tutto analogh a quell del ρ, seppure non concdent, per motv llustrat ne paragraf precedent. Come negl altr cas, l vantaggo del test ρ rspetto al test τ è d essere stmato n modo pù semplce e rapdo. E un aspetto sempre mportante nella pratca della statstca, quando calcol sono svolt manualmente. Quest due test possono essere applcat a dat per qual è gà stato proposto l test d Cox e Stuart, coè ad una successone temporale d valor. Pertanto, con la fnaltà d presentare l applcazone del metodo ρ e d analzzare le stuazon ne qual sceglere quello pù adeguato, è utle rprendere gl stess dat utlzzat per l test d Cox e Stuart. S supponga d avere la successone temporale d 8 osservazon, rportate nella tabella e nel grafco successv. S vuole valutare se è confermata l potes d una tendenza sgnfcatva all aumento de valor med. 34

36 I Settmana II Settmana L M M G V S D L M M G V S D III Settmana IV Settmana L M M G V S D L M M G V S D Rappresentazone grafca de dat e della loro meda moble a 7 element 35

37 A dfferenza de test parametrc, che rchedono espressamente dat delle sngole osservazon e non mede, n quanto ndspensabl per calcolare la covaranza e la stma della varanza d errore, l anals non parametrca può essere condotta anche sulle mede, sulle medane o altr quantl rtenut mportant (come l 5 e l 75 percentle). Infatt usando le mede s ottene drettamente la devazone standard delle mede, coè l errore standard. Nel caso dell esempo, per valutare la tendenza d fondo del perodo servendos delle sngole osservazon raccolte, s pone l problema della grande varabltà presente nell arco d una settmana, come evdenza la successone de dat e soprattutto mostra vsvamente la rappresentazone grafca. La forte oscllazone d perodo (n questo caso settmanale) tende a nascondere l cambamento sstematco potzzato (una dfferenza monotonca tra l nzo e la fne mese). Inoltre, sono present molt valor ugual, che rendono l calcolo de rangh pù complesso e soprattutto fanno dventare l rsultato del test approssmato, dovendo rcorrere a mede de rangh. D conseguenza, per applcare l test d Danels appare convenente utlzzare la successone delle mede mobl, gà calcolate nel test d Cox e Stuart. Il test d Danels non rchede attenzone alle varazon cclche e qund non rchede che l perodo sa suddvso n fas corrspondent ,0 6,3 6,1 6,4 6,6 6,7 6,9 7,1 7,3 8,0 8, ,7 9,1 9,4 30,6 30,7 30,3 30,1 9,7 9,4 30,1 30, Da quest valor med, s derva la seguente tabella, che rporta tutt calcol necessar per l test: In essa - nella colonna 1 è rportato l rango de temp, che ovvamente sono sempre n successone ordnata, - nella colonna è rportata la meda moble della varable analzzata, - nella colonna 3 l rango d questo ultmo valore, - nella colonna 4 la dfferenza n valore assoluto d tra due rangh (colonna 1 colonna 3), - nella colonna 5 l quadrato d tale dfferenza d. 36

Correlazione lineare

Correlazione lineare Correlazone lneare Varable dpendente Mortaltà per crros 50 45 40 35 30 5 0 15 10 5 0 0 5 10 15 0 5 30 Consumo d alcool Varable ndpendente Metodologa per l anals de dat spermental L anals d stud con varabl

Dettagli

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 17/09/2012

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 17/09/2012 CdL n SCIENZE DELL ORGANIZZAZIONE ESAME d STATISTICA ESERCIZIO 1 (+.5+.5+3) La tabella seguente rporta la dstrbuzone d frequenza del peso X n gramm d una partta d mele provenent da un certo frutteto. X=peso

Dettagli

Corso di. Dott.ssa Donatella Cocca

Corso di. Dott.ssa Donatella Cocca Corso d Statstca medca e applcata 3 a Lezone Dott.ssa Donatella Cocca Concett prncpale della lezone I concett prncpal che sono stat presentat sono: Mede forme o analtche (Meda artmetca semplce, Meda artmetca

Dettagli

Lezioni di Statistica (25 marzo 2013) Docente: Massimo Cristallo

Lezioni di Statistica (25 marzo 2013) Docente: Massimo Cristallo UNIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECONOMIA Corso d laurea n Economa Azendale Lezon d Statstca (25 marzo 2013) Docente: Massmo Crstallo QUARTILI Dvdono la dstrbuzone n quattro part d uguale

Dettagli

Variabili statistiche - Sommario

Variabili statistiche - Sommario Varabl statstche - Sommaro Defnzon prelmnar Statstca descrttva Msure della tendenza centrale e della dspersone d un campone Introduzone La varable statstca rappresenta rsultat d un anals effettuata su

Dettagli

Relazioni tra variabili: Correlazione e regressione lineare

Relazioni tra variabili: Correlazione e regressione lineare Dott. Raffaele Casa - Dpartmento d Produzone Vegetale Modulo d Metodologa Spermentale Febbrao 003 Relazon tra varabl: Correlazone e regressone lneare Anals d relazon tra varabl 6 Produzone d granella (kg

Dettagli

Campo di applicazione

Campo di applicazione Unverstà del Pemonte Orentale Corso d Laurea n Botecnologa Corso d Statstca Medca Correlazone Regressone Lneare Corso d laurea n botecnologa - Statstca Medca Correlazone e Regressone lneare semplce Campo

Dettagli

Modelli descrittivi, statistica e simulazione

Modelli descrittivi, statistica e simulazione Modell descrttv, statstca e smulazone Master per Smart Logstcs specalst Roberto Cordone (roberto.cordone@unm.t) Statstca descrttva Cernusco S.N., govedì 28 gennao 2016 (9.00/13.00) 1 / 15 Indc d poszone

Dettagli

La t di Student. Per piccoli campioni si definisce la variabile casuale. = s N. detta t di Student.

La t di Student. Per piccoli campioni si definisce la variabile casuale. = s N. detta t di Student. Pccol campon I parametr della dstrbuzone d una popolazone sono n generale ncognt devono essere stmat dal campone de dat spermental per pccol campon (N N < 30) z = (x µ)/ )/σ non ha pù una dstrbuzone gaussana

Dettagli

CAPITOLO X ANALISI DELLA VARIANZA (ANOVA I) A UN CRITERIO DI CLASSIFICAZIONE E CONFRONTI TRA PIU MEDIE

CAPITOLO X ANALISI DELLA VARIANZA (ANOVA I) A UN CRITERIO DI CLASSIFICAZIONE E CONFRONTI TRA PIU MEDIE CAPITOLO X ANALISI DELLA VARIANZA (ANOVA I) A UN CRITERIO DI CLASSIFICAZIONE E CONFRONTI TRA PIU MEDIE 10.1. Anals della varanza ad un crtero d classfcazone o a camponamento completamente randomzzato 4

Dettagli

Integrazione numerica dell equazione del moto per un sistema lineare viscoso a un grado di libertà. Prof. Adolfo Santini - Dinamica delle Strutture 1

Integrazione numerica dell equazione del moto per un sistema lineare viscoso a un grado di libertà. Prof. Adolfo Santini - Dinamica delle Strutture 1 Integrazone numerca dell equazone del moto per un sstema lneare vscoso a un grado d lbertà Prof. Adolfo Santn - Dnamca delle Strutture 1 Introduzone 1/2 L equazone del moto d un sstema vscoso a un grado

Dettagli

LA CALIBRAZIONE NELL ANALISI STRUMENTALE

LA CALIBRAZIONE NELL ANALISI STRUMENTALE LA CALIBRAZIONE NELL ANALISI STRUMENTALE La maggor parte delle anals chmche sono ogg condotte medante metod strumental (spettrometra d assorbmento ed emssone a dverse λ, metod elettrochmc, spettrometra

Dettagli

Lezione 2 a - Statistica descrittiva per variabili quantitative

Lezione 2 a - Statistica descrittiva per variabili quantitative Lezone 2 a - Statstca descrttva per varabl quanttatve Esempo 5. Nella tabella seguente sono rportat valor del tasso glcemco rlevat su 10 pazent: Pazente Glcema (mg/100cc) 1 x 1 =103 2 x 2 =97 3 x 3 =90

Dettagli

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI IL LEGAME TRA DUE VARIABILI I METODI DELLA CORRELAZIONE Prof.ssa G. Sero, Prof. P. Trerotol, Cattedra d Statstca Medca, Unverstà d Bar 1/19 IL PROBLEMA

Dettagli

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill Statstca - metodologe per le scenze economche e socal /e S Borra, A D Cacco - McGraw Hll Es Soluzone degl esercz del captolo 7 In base agl arrotondament effettuat ne calcol, s possono rscontrare pccole

Dettagli

Elementi di statistica

Elementi di statistica Element d statstca Popolazone statstca e campone casuale S chama popolazone statstca l nseme d tutt gl element che s voglono studare (ndvdu, anmal, vegetal, cellule, caratterstche delle collettvtà..) e

Dettagli

RAPPRESENTAZIONE DI MISURE. carta millimetrata

RAPPRESENTAZIONE DI MISURE. carta millimetrata carta mllmetrata carta mllmetrata non è necessaro rportare sul foglo la tabella (ma auta; l mportante è che sta da qualche parte) carta mllmetrata 8 7 6 5 4 3 smbolo della grandezza con untà d msura!!!

Dettagli

Scienze Geologiche. Corso di Probabilità e Statistica. Prove di esame con soluzioni

Scienze Geologiche. Corso di Probabilità e Statistica. Prove di esame con soluzioni Scenze Geologche Corso d Probabltà e Statstca Prove d esame con soluzon 004-005 1 Corso d laurea n Scenze Geologche - Probabltà e Statstca Appello del 1 gugno 005 - Soluzon 1. (Punt 3) In una certa zona,

Dettagli

ESERCIZIO 4.1 Si consideri una popolazione consistente delle quattro misurazioni 0, 3, 12 e 20 descritta dalla seguente distribuzione di probabilità:

ESERCIZIO 4.1 Si consideri una popolazione consistente delle quattro misurazioni 0, 3, 12 e 20 descritta dalla seguente distribuzione di probabilità: ESERCIZIO. S consder una popolazone consstente delle quattro msurazon,, e descrtta dalla seguente dstrbuzone d probabltà: X P(X) ¼ ¼ ¼ ¼ S estrae casualmente usando uno schema d camponamento senza rpetzone

Dettagli

LEZIONE 2. Riassumere le informazioni: LE MEDIE MEDIA ARITMETICA MEDIANA, MODA, QUANTILI. La media aritmetica = = N

LEZIONE 2. Riassumere le informazioni: LE MEDIE MEDIA ARITMETICA MEDIANA, MODA, QUANTILI. La media aritmetica = = N LE MEDIE LEZIOE MEDIE ALGEBRICHE: calcolate con operazon algebrche su valor del carattere (meda artmetca) per varabl Rassumere le nformazon: MEDIA ARITMETICA MEDIAA, MODA, QUATILI MEDIE LASCHE: determnate

Dettagli

STATISTICA DESCRITTIVA - SCHEDA N. 5 REGRESSIONE LINEARE

STATISTICA DESCRITTIVA - SCHEDA N. 5 REGRESSIONE LINEARE Matematca e statstca: da dat a modell alle scelte www.dma.unge/pls_statstca Responsabl scentfc M.P. Rogantn e E. Sasso (Dpartmento d Matematca Unverstà d Genova) STATISTICA DESCRITTIVA - SCHEDA N. REGRESSIONE

Dettagli

Relazione funzionale e statistica tra due variabili Modello di regressione lineare semplice Stima puntuale dei coefficienti di regressione

Relazione funzionale e statistica tra due variabili Modello di regressione lineare semplice Stima puntuale dei coefficienti di regressione 1 La Regressone Lneare (Semplce) Relazone funzonale e statstca tra due varabl Modello d regressone lneare semplce Stma puntuale de coeffcent d regressone Decomposzone della varanza Coeffcente d determnazone

Dettagli

Università degli Studi di Urbino Facoltà di Economia

Università degli Studi di Urbino Facoltà di Economia Unverstà degl Stud d Urbno Facoltà d Economa Lezon d Statstca Descrttva svolte durante la prma parte del corso d corso d Statstca / Statstca I A.A. 004/05 a cura d: F. Bartolucc Lez. 8/0/04 Statstca descrttva

Dettagli

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI CONFRONTO DI PIU MEDIE IL METODO DI ANALISI DELLA VARIANZA

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI CONFRONTO DI PIU MEDIE IL METODO DI ANALISI DELLA VARIANZA NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI CONFRONTO DI PIU MEDIE IL METODO DI ANALISI DELLA VARIANZA IL PROBLEMA Supponamo d voler studare l effetto d 4 dverse dete su un campone casuale d 4

Dettagli

CAPITOLO VII METODI NON PARAMETRICI PER UN CAMPIONE

CAPITOLO VII METODI NON PARAMETRICI PER UN CAMPIONE CAPITOLO VII METODI NON PARAMETRICI PER UN CAMPIONE 7.1. Caratterstche de test non parametrc 1 7.. I test esatt e l metodo Monte Carlo 7 7.3. Il test delle successon per un campone 10 7.4. Il test de segn

Dettagli

LA VARIABILITA. Nella metodologia statistica si distinguono due aspetti della variabilità:

LA VARIABILITA. Nella metodologia statistica si distinguono due aspetti della variabilità: LA VARIABILITA LA VARIABILITA E L ATTITUDINE DEL FENOMENO QUANTITATIVO AD ASSUMERE DIVERSE MODALITA, O MEGLIO LA TENDENZA DI OGNI SINGOLA OSSERVAZIONE AD ASSUMERE VALORI DIFFERENTI RISPETTO AL VALORE MEDIO.

Dettagli

Università di Cassino. Esercitazioni di Statistica 1 del 19 Febbraio Dott. Mirko Bevilacqua

Università di Cassino. Esercitazioni di Statistica 1 del 19 Febbraio Dott. Mirko Bevilacqua Unverstà d Cassno Eserctazon d Statstca del 9 Febbrao 00 Dott. Mro Bevlacqua DATASET STUDENTI N SESSO ALTEZZA PESO CORSO NUMERO COLORE COLORE (cm) (g) LAUREA SCARPA OCCHI CAPELLI M 79 65 INFORMAICA 43

Dettagli

Esame di Statistica tema A Corso di Laurea in Economia Prof.ssa Giordano Appello del 15/07/2011

Esame di Statistica tema A Corso di Laurea in Economia Prof.ssa Giordano Appello del 15/07/2011 Esame d Statstca tema A Corso d Laurea n Economa Prof.ssa Gordano Appello del /07/0 Cognome Nome atr. Teora Dmostrare che la somma degl scart dalla meda artmetca è zero. Eserczo L accesso al credto è sempre

Dettagli

CORRETTA RAPPRESENTAZIONE DI UN RISULTATO: LE CIFRE SIGNIFICATIVE

CORRETTA RAPPRESENTAZIONE DI UN RISULTATO: LE CIFRE SIGNIFICATIVE CORRETT RPPREETZIOE DI U RIULTTO: LE CIFRE IGIFICTIVE Defnamo cfre sgnfcatve quelle cfre che esprmono realmente l rsultato d una msura, o del suo errore, coè che non sono completamente ncluse nell ntervallo

Dettagli

LA COMPATIBILITA tra due misure:

LA COMPATIBILITA tra due misure: LA COMPATIBILITA tra due msure: 0.4 Due msure, supposte affette da error casual, s dcono tra loro compatbl quando la loro dfferenza può essere rcondotta ad una pura fluttuazone statstca attorno al valore

Dettagli

Sommario. Obiettivo. Quando studiarla? La concentrazione. X: carattere quantitativo tra le unità statistiche. Quando studiarla?

Sommario. Obiettivo. Quando studiarla? La concentrazione. X: carattere quantitativo tra le unità statistiche. Quando studiarla? Corso d Statstca a.a. 9- uando studarla? Obettvo Dagramma d Lorenz Rapporto d concentrazone rea d concentrazone Esemp Sommaro La concentrazone uando studarla? Obettvo X: carattere quanttatvo tra le untà

Dettagli

Laboratorio 2B A.A. 2013/2014. Elaborazione Dati. Lab 2B CdL Fisica

Laboratorio 2B A.A. 2013/2014. Elaborazione Dati. Lab 2B CdL Fisica Laboratoro B A.A. 013/014 Elaborazone Dat Lab B CdL Fsca Elaborazone dat spermental Come rassumere un nseme d dat spermental? Una statstca è propro un numero calcolato a partre da dat stess. La Statstca

Dettagli

Norma UNI CEI ENV 13005: Guida all'espressione dell'incertezza di misura

Norma UNI CEI ENV 13005: Guida all'espressione dell'incertezza di misura orma UI CEI EV 3005: Guda all'espressone dell'ncertezza d msura L obettvo d una msurazone è quello d determnare l valore del msurando, n altre parole della grandezza da msurare. In generale, però, l rsultato

Dettagli

3 (solo esame 6 cfu) Elementi di Analisi Numerica, Probabilità e Statistica, modulo 2: Elementi di Probabilità e Statistica (3 cfu)

3 (solo esame 6 cfu) Elementi di Analisi Numerica, Probabilità e Statistica, modulo 2: Elementi di Probabilità e Statistica (3 cfu) lement d Anals Numerca, Probabltà e Statstca, modulo 2: lement d Probabltà e Statstca ( cfu) Probabltà e Statstca (6 cfu) Scrtto del 06 febbrao 205. Secondo Appello Id: A Nome e Cognome: same da 6 cfu

Dettagli

Rappresentazione dei numeri PH. 3.1, 3.2, 3.3

Rappresentazione dei numeri PH. 3.1, 3.2, 3.3 Rappresentazone de numer PH. 3.1, 3.2, 3.3 1 Tp d numer Numer nter, senza segno calcolo degl ndrzz numer che possono essere solo non negatv Numer con segno postv negatv Numer n vrgola moble calcol numerc

Dettagli

Ministero della Salute D.G. della programmazione sanitaria --- GLI ACC - L ANALISI DELLA VARIABILITÀ METODOLOGIA

Ministero della Salute D.G. della programmazione sanitaria --- GLI ACC - L ANALISI DELLA VARIABILITÀ METODOLOGIA Mnstero della Salute D.G. della programmazone santara --- GLI ACC - L ANALISI DELLA VARIABILITÀ METODOLOGIA La valutazone del coeffcente d varabltà dell mpatto economco consente d ndvduare gl ACC e DRG

Dettagli

CARATTERISTICHE DEI SEGNALI RANDOM

CARATTERISTICHE DEI SEGNALI RANDOM CARATTERISTICHE DEI SEGNALI RANDOM I segnal random o stocastc rvestono una notevole mportanza poché sono present, pù che segnal determnstc, nella maggor parte de process fsc real. Esempo d segnale random:

Dettagli

Capitolo 3 Covarianza, correlazione, bestfit lineari e non lineari

Capitolo 3 Covarianza, correlazione, bestfit lineari e non lineari Captolo 3 Covaranza, correlazone, bestft lnear e non lnear ) Covaranza e correlazone Ad un problema s assoca spesso pù d una varable quanttatva (es.: d una persona possamo determnare peso e altezza, oppure

Dettagli

5. Baricentro di sezioni composte

5. Baricentro di sezioni composte 5. Barcentro d sezon composte Barcentro del trapezo Il barcentro del trapezo ( FIURA ) s trova sull asse d smmetra oblqua (medana) della fgura; è suffcente, qund, determnare la sola ordnata. A tal fne,

Dettagli

Statistica descrittiva

Statistica descrittiva Statstca descrttva. Indc d poszone. Per ndc d poszone d un nseme d dat, ordnat secondo la loro randezza, s ntendono alcun valor che cadono all nterno dell nseme. Gl ndc pù usat sono: I. eda. II. edana.

Dettagli

Esercitazioni del corso di Relazioni tra variabili. Giancarlo Manzi Facoltà di Sociologia Università degli Studi di Milano-Bicocca

Esercitazioni del corso di Relazioni tra variabili. Giancarlo Manzi Facoltà di Sociologia Università degli Studi di Milano-Bicocca Eserctazon del corso d Relazon tra varabl Gancarlo Manz Facoltà d Socologa Unverstà degl Stud d Mlano-Bcocca e-mal: gancarlo.manz@statstca.unmb.t Terza eserctazone Mlano, 8 febbrao 7 SOMMARIO TERZA ESERCITAZIONE

Dettagli

* * * Nota inerente il calcolo della concentrazione rappresentativa della sorgente. Aprile 2006 RL/SUO-TEC 166/2006 1

* * * Nota inerente il calcolo della concentrazione rappresentativa della sorgente. Aprile 2006 RL/SUO-TEC 166/2006 1 APAT Agenza per la Protezone dell Ambente e per Servz Tecnc Dpartmento Dfesa del Suolo / Servzo Geologco D Itala Servzo Tecnologe del sto e St Contamnat * * * Nota nerente l calcolo della concentrazone

Dettagli

* PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE *

* PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE * * PROBABILITÀ - SCHEDA N. LE VARIABILI ALEATORIE *. Le varabl aleatore Nella scheda precedente abbamo defnto lo spazo camponaro come la totaltà degl est possbl d un espermento casuale; abbamo vsto che

Dettagli

La ripartizione trasversale dei carichi

La ripartizione trasversale dei carichi La rpartzone trasversale de carch La dsposzone de carch da consderare ne calcol della struttura deve essere quella pù gravosa, ossa quella che determna massm valor delle sollectazon. Tale aspetto nveste

Dettagli

LE FREQUENZE CUMULATE

LE FREQUENZE CUMULATE LE FREQUENZE CUMULATE Dott.ssa P. Vcard Introducamo questo argomento con l seguente Esempo: consderamo la seguente dstrbuzone d un campone d 70 sttut d credto numero flal present nel terrtoro del comune

Dettagli

STATISTICA DESCRITTIVA CON EXCEL

STATISTICA DESCRITTIVA CON EXCEL STATISTICA DESCRITTIVA CON EXCEL Corso d CPS - II parte: Statstca Laurea n Informatca Sstem e Ret 2004-2005 1 Obettv della lezone Introduzone all uso d EXCEL Statstca descrttva Utlzzo dello strumento:

Dettagli

Capitolo 6 Risultati pag. 468. a) Osmannoro. b) Case Passerini c) Ponte di Maccione

Capitolo 6 Risultati pag. 468. a) Osmannoro. b) Case Passerini c) Ponte di Maccione Captolo 6 Rsultat pag. 468 a) Osmannoro b) Case Passern c) Ponte d Maccone Fgura 6.189. Confronto termovalorzzatore-sorgent dffuse per l PM 10. Il contrbuto del termovalorzzatore alle concentrazon d PM

Dettagli

Introduzione al Machine Learning

Introduzione al Machine Learning Introduzone al Machne Learnng Note dal corso d Machne Learnng Corso d Laurea Magstrale n Informatca aa 2010-2011 Prof Gorgo Gambos Unverstà degl Stud d Roma Tor Vergata 2 Queste note dervano da una selezone

Dettagli

Concetti principale della lezione precedente

Concetti principale della lezione precedente Corso d Statstca medca e applcata 6 a Lezone Dott.ssa Donatella Cocca Concett prncpale della lezone precedente I concett prncpal che sono stat presentat sono: I fenomen probablstc RR OR ROC-curve Varabl

Dettagli

1) Dato un carattere X il rapporto tra devianza entro e devianza totale è 0.25 e la devianza totale è 40. La devianza tra vale: a) 10 b) 20 c) 30

1) Dato un carattere X il rapporto tra devianza entro e devianza totale è 0.25 e la devianza totale è 40. La devianza tra vale: a) 10 b) 20 c) 30 1) Dato un carattere X l rapporto tra devanza entro e devanza totale è 0.25 e la devanza totale è 40. La devanza tra vale: a) 10 b) 20 c) 30 2) Data una popolazone normalmente dstrbuta con meda 10 e varanza

Dettagli

Regressione Multipla e Regressione Logistica: concetti introduttivi ed esempi

Regressione Multipla e Regressione Logistica: concetti introduttivi ed esempi Regressone Multpla e Regressone Logstca: concett ntroduttv ed esemp I Edzone ottobre 014 Vncenzo Paolo Senese vncenzopaolo.senese@unna.t Indce Note prelmnar alla I edzone 1 Regressone semplce e multpla

Dettagli

Valutazione dei Benefici interni

Valutazione dei Benefici interni Corso d Trasport Terrtoro prof. ng. Agostno Nuzzolo Valutazone de Benefc ntern Valutazone degl ntervent Indvduazone degl effett rlevant La defnzone degl effett rlevant per un ntervento sul sstema d trasporto

Dettagli

RICHIAMI SULLA RAPPRESENTAZIONE IN COMPLEMENTO A 2

RICHIAMI SULLA RAPPRESENTAZIONE IN COMPLEMENTO A 2 RICHIAMI SULLA RAPPRESENTAZIONE IN COMPLEMENTO A La rappresentazone n Complemento a Due d un numero ntero relatvo (.-3,-,-1,0,+1,+,.) una volta stablta la precsone che s vuole ottenere (coè l numero d

Dettagli

Tutti gli strumenti vanno tarati

Tutti gli strumenti vanno tarati L'INCERTEZZA DI MISURA Anta Calcatell I.N.RI.M S eseguono e producono msure per prendere delle decson sulla base del rsultato ottenuto, come per esempo se bloccare l traffco n funzone d msure d lvello

Dettagli

Regressione lineare con un singolo regressore

Regressione lineare con un singolo regressore Regressone lneare con un sngolo regressore Eduardo Ross 2 2 Unverstà d Pava (Italy) Marzo 2013 Ross Regressone lneare semplce Econometra - 2013 1 / 45 Outlne 1 Introduzone 2 Lo stmatore OLS 3 Esempo 4

Dettagli

NUMERI GRANDI DI FIBONACCI come trovare velocemente i loro esatti valori numerici Cristiano Teodoro

NUMERI GRANDI DI FIBONACCI come trovare velocemente i loro esatti valori numerici Cristiano Teodoro NUMERI GRANDI DI FIBONACCI come trovare velocemente loro esatt valor numerc Crstano Teodoro crstanoteodoro@vrglo.t Sommaro: n questo artcolo vene proposto, n alternatva al metodo classco per l calcolo

Dettagli

Intorduzione alla teoria delle Catene di Markov

Intorduzione alla teoria delle Catene di Markov Intorduzone alla teora delle Catene d Markov Mchele Ganfelce a.a. 2014/2015 Defnzone 1 Sa ( Ω, F, {F n } n 0, P uno spazo d probabltà fltrato. Una successone d v.a. {ξ n } n 0 defnta su ( Ω, F, {F n }

Dettagli

Per calcolare le probabilità di Testa e Croce è possibile risolvere il seguente sistema di due equazioni in due incognite:

Per calcolare le probabilità di Testa e Croce è possibile risolvere il seguente sistema di due equazioni in due incognite: ESERCIZIO.1 Sa X la varable casuale che descrve l numero d teste ottenute nella prova lanco d tre monete truccate dove P(Croce)= x P(Testa). 1) Defnrne la dstrbuzone d probabltà ) Rappresentarla grafcamente

Dettagli

Analisi di mercurio in matrici solide mediante spettrometria di assorbimento atomico a vapori freddi

Analisi di mercurio in matrici solide mediante spettrometria di assorbimento atomico a vapori freddi ESEMPIO N. Anals d mercuro n matrc solde medante spettrometra d assorbmento atomco a vapor fredd 0 Introduzone La determnazone del mercuro n matrc solde è effettuata medante trattamento termco del campone

Dettagli

LEZIONE 2 e 3. La teoria della selezione di portafoglio di Markowitz

LEZIONE 2 e 3. La teoria della selezione di portafoglio di Markowitz LEZIONE e 3 La teora della selezone d portafoglo d Markowtz Unverstà degl Stud d Bergamo Premessa Unverstà degl Stud d Bergamo Premessa () È puttosto frequente osservare come gl nvesttor tendano a non

Dettagli

Matematica II: Calcolo delle Probabilità e Statistica Matematica

Matematica II: Calcolo delle Probabilità e Statistica Matematica Matematca II: Calcolo delle Probabltà e Statstca Matematca ELT A-Z Docente: dott. F. Zucca Eserctazone # 8 Gl esercz contrassegnat con (*) sono tratt da Eserc. 2002-2003- Prof. Secch # 0 - Statstca Matematca

Dettagli

L analisi di studi con variabili di risposta multiple

L analisi di studi con variabili di risposta multiple X1 X X 3 Quando un confronto venga effettuato per tre lvell d un fattore, sembrerebbe ntutvo effettuare l confronto con l test t d Student a pù lvell: X X X 1 1 vs vs vs X X X 3 3 Metodologa per l anals

Dettagli

CORSO DI FISICA TECNICA 2 AA 2013/14 ACUSTICA. Lezione n 2:

CORSO DI FISICA TECNICA 2 AA 2013/14 ACUSTICA. Lezione n 2: CORSO DI FISICA TECNICA AA 013/14 ACUSTICA Lezone n : Lvell sonor: operazon su decbel e lvello sonoro equvalente. Anals n requenza de segnal sonor, bande d ottava e terz d ottava. Rumore banco e rumore

Dettagli

Propagazione degli errori statistici. Test del χ 2 per la bontà di adattamento. Metodo dei minimi quadrati.

Propagazione degli errori statistici. Test del χ 2 per la bontà di adattamento. Metodo dei minimi quadrati. Propagazone degl error statstc. Test del χ per la bontà d adattamento. Metodo de mnm quadrat. Eserctazone 14 gennao 004 1 Propagazone degl error casual Sano B 1,..., B delle varabl casual con valor attes

Dettagli

ANALISI DI TABELLE DI CONTINGENZA

ANALISI DI TABELLE DI CONTINGENZA ANALISI DI TABELLE DI CONTINGENZA 91 TABELLE DI CONTINGENZA Una tabella d contngenza è una tabella d frequenza a doppa entrata n cu vengono ncrocate due varabl qualtatve. Esempo SESSO INTERESSE PER STATISTICA

Dettagli

Lezione 10. L equilibrio del mercato finanziario: la struttura dei tassi d interesse

Lezione 10. L equilibrio del mercato finanziario: la struttura dei tassi d interesse Lezone 1. L equlbro del mercato fnanzaro: la struttura de tass d nteresse Ttol con scadenza dversa hanno prezz (e tass d nteresse) dfferent. Due ttol d durata dversa emess dallo stesso soggetto (stesso

Dettagli

Il modello markoviano per la rappresentazione del Sistema Bonus Malus. Prof. Cerchiara Rocco Roberto. Materiale e Riferimenti

Il modello markoviano per la rappresentazione del Sistema Bonus Malus. Prof. Cerchiara Rocco Roberto. Materiale e Riferimenti Il modello marovano per la rappresentazone del Sstema Bonus Malus rof. Cercara Rocco Roberto Materale e Rferment. Lucd dstrbut n aula. Lemare 995 (pag.6- e pag. 74-78 3. Galatoto G. 4 (tt del VI Congresso

Dettagli

CAPITOLO 3 Incertezza di misura Pagina 26

CAPITOLO 3 Incertezza di misura Pagina 26 CAPITOLO 3 Incertezza d msura Pagna 6 CAPITOLO 3 INCERTEZZA DI MISURA Le operazon d msurazone sono tutte nevtablmente affette da ncertezza e coè da un grado d ndetermnazone con l quale l processo d msurazone

Dettagli

Trigger di Schmitt. e +V t

Trigger di Schmitt. e +V t CORSO DI LABORATORIO DI OTTICA ED ELETTRONICA Scopo dell esperenza è valutare l ampezza dell steres d un trgger d Schmtt al varare della frequenza e dell ampezza del segnale d ngresso e confrontarla con

Dettagli

La Regressione X Variabile indipendente o esplicativa. La regressione. La Regressione. Y Variabile dipendente

La Regressione X Variabile indipendente o esplicativa. La regressione. La Regressione. Y Variabile dipendente Unverstà d Macerata Dpartmento d Scenze Poltche, della Comuncazone e delle Relaz. Internazonal La Regressone Varable ndpendente o esplcatva Prezzo n () () 1 1 Varable dpendente 15 1 1 1 5 5 6 6 61 6 1

Dettagli

Probabilità cumulata empirica

Probabilità cumulata empirica Probabltà cumulata emprca Se s effettua un certo numero d camponament da una popolazone con dstrbuzone cumulata F(y), s avranno allora n campon y, y,, y n. E possble consderarne la statstca d ordne, coè

Dettagli

REALTÀ E MODELLI SCHEDA DI LAVORO

REALTÀ E MODELLI SCHEDA DI LAVORO REALTÀ E MODELLI SCHEDA DI LAVORO 1 Le tabelle d crescta Nella tabella sono rportat dat relatv alle altezze mede delle bambne dalla nascta fno a un anno d età. Stablsc se esste una relazone lneare tra

Dettagli

Esercitazioni del corso: STATISTICA

Esercitazioni del corso: STATISTICA A. A. 0-0 Eserctazon del corso: STATISTICA Sommaro Eserctazone : Moda Medana Meda Artmetca Varabltà: Varanza, Devazone Standard, Coefcente d Varazone ESERCIZIO : UNIVERSITÀ DEGLI STUDI DI MILANO BICOCCA

Dettagli

Metodi e Modelli per l Ottimizzazione Combinatoria Progetto: Metodo di soluzione basato su generazione di colonne

Metodi e Modelli per l Ottimizzazione Combinatoria Progetto: Metodo di soluzione basato su generazione di colonne Metod e Modell per l Ottmzzazone Combnatora Progetto: Metodo d soluzone basato su generazone d colonne Lug De Govann Vene presentato un modello alternatvo per l problema della turnazone delle farmace che

Dettagli

DIPARTIMENTO TEMATICO RADIAZIONI Struttura Semplice Radiazioni ionizzanti

DIPARTIMENTO TEMATICO RADIAZIONI Struttura Semplice Radiazioni ionizzanti DIPARTIMENTO TEMATICO RADIAZIONI Struttura Semplce 21.01 Radazon onzzant TITOLO Interconfronto Consorzo Eraclto Msure d rateo d dose gamma n campo - Cuncolo esploratvo de la Maddalena Allneamento msure

Dettagli

Esercitazione 12 ottobre 2011 Trasformazioni circuitali. v 3. v 1. Per entrambi i casi, i valori delle grandezze sono riportati in Tab. I.

Esercitazione 12 ottobre 2011 Trasformazioni circuitali. v 3. v 1. Per entrambi i casi, i valori delle grandezze sono riportati in Tab. I. Eserctazone ottobre 0 Trasformazon crcutal Sere e parallelo S consderno crcut n Fg e che rappresentano rspettvamente un parttore d tensone e uno d corrente v v v v Fg : Parttore d tensone Fg : Parttore

Dettagli

La verifica delle ipotesi

La verifica delle ipotesi La verfca delle potes In molte crcostanze l rcercatore s trova a dover decdere quale, tra le dverse stuazon possbl rferbl alla popolazone, è quella meglo sostenuta dalle evdenze emprche. Ipotes statstca:

Dettagli

CAPITOLO IV CENNI SULLE MACCHINE SEQUENZIALI

CAPITOLO IV CENNI SULLE MACCHINE SEQUENZIALI Cenn sulle macchne seuenzal CAPITOLO IV CENNI SULLE MACCHINE SEQUENZIALI 4.) La macchna seuenzale. Una macchna seuenzale o macchna a stat fnt M e' un automatsmo deale a n ngress e m uscte defnto da: )

Dettagli

Statistica Descrittiva ed Inferenziale

Statistica Descrittiva ed Inferenziale Statstca Descrttva ed Inferenzale 1 Why Statstcs? A? A B Descrpton and Predcton Samples Analyss A1 A A B C Pared Samples Analyss MultSamples Analyss 1 Why Statstcs? Formal defnton of Probablty σ-feld 3

Dettagli

Analisi statistica di dati biomedici Analysis of biologicalsignals

Analisi statistica di dati biomedici Analysis of biologicalsignals Anals statstca d dat bomedc Analyss of bologcalsgnals I Parte Inferenza statstca Agostno Accardo (accardo@unts.t) Master n Ingegnera Clnca LM Neuroscenze 2013-2014 e segg. Altman Practcal statstcs for

Dettagli

Questo è il secondo di una serie di articoli, di

Questo è il secondo di una serie di articoli, di DENTRO LA SCATOLA Rubrca a cura d Fabo A. Schreber Il Consglo Scentfco della rvsta ha pensato d attuare un nzatva culturalmente utle presentando n ogn numero d Mondo Dgtale un argomento fondante per l

Dettagli

Ricerca Operativa e Logistica Dott. F.Carrabs e Dott.ssa M.Gentili. Modelli per la Logistica: Single Flow One Level Model Multi Flow Two Level Model

Ricerca Operativa e Logistica Dott. F.Carrabs e Dott.ssa M.Gentili. Modelli per la Logistica: Single Flow One Level Model Multi Flow Two Level Model Rcerca Operatva e Logstca Dott. F.Carrabs e Dott.ssa M.Gentl Modell per la Logstca: Sngle Flow One Level Model Mult Flow Two Level Model Modell d localzzazone nel dscreto Modell a Prodotto Sngolo e a Un

Dettagli

La retroazione negli amplificatori

La retroazione negli amplificatori La retroazone negl amplfcator P etroazonare un amplfcatore () sgnfca sottrarre (o sommare) al segnale d ngresso (S ) l segnale d retroazone (S r ) ottenuto dal segnale d uscta (S u ) medante un quadrpolo

Dettagli

Potenzialità degli impianti

Potenzialità degli impianti Unverstà degl Stud d Treste a.a. 2009-2010 Impant ndustral Potenzaltà degl mpant Impant ndustral Potenzaltà degl mpant 1 Unverstà degl Stud d Treste a.a. 2009-2010 Impant ndustral Defnzone della potenzaltà

Dettagli

La taratura degli strumenti di misura

La taratura degli strumenti di misura La taratura degl strument d msura L mportanza dell operazone d taratura nasce dall esgenza d rendere l rsultato d una msura rferble a campon nazonal od nternazonal del msurando n questone affnché pù msure

Dettagli

Appunti di Econometria

Appunti di Econometria Appunt d Econometra ARGOMENTO [4]: VARIABILI DIPENDENTI BINARIE Mara Lusa Mancus Unverstà Boccon Novembre 200 Introduzone Ne modell econometrc studat fno ad ora la varable dpendente, y, è sempre stata

Dettagli

COMPORTAMENTO DINAMICO DI ASSI E ALBERI

COMPORTAMENTO DINAMICO DI ASSI E ALBERI COMPORTAMENTO DNAMCO D ASS E ALBER VBRAZON TORSONAL Costruzone d Macchne Generaltà l problema del progetto d un asse o d un albero non è solo statco Gl ass e gl alber, come sstem elastc, sotto l azone

Dettagli

{ 1, 2,..., n} Elementi di teoria dei giochi. Giovanni Di Bartolomeo Università degli Studi di Teramo

{ 1, 2,..., n} Elementi di teoria dei giochi. Giovanni Di Bartolomeo Università degli Studi di Teramo Element d teora de goch Govann D Bartolomeo Unverstà degl Stud d Teramo 1. Descrzone d un goco Un generco goco, Γ, che s svolge n un unco perodo, può essere descrtto da una Γ= NSP,,. Ess sono: trpla d

Dettagli

(B1) IL RUOLO DELL ANALISI STATISTICA DEI DATI NELLA GESTIONE AZIENDALE DATI GREZZI E INFORMAZIONI INDICI STATISTICI, TABELLE E GRAFICI

(B1) IL RUOLO DELL ANALISI STATISTICA DEI DATI NELLA GESTIONE AZIENDALE DATI GREZZI E INFORMAZIONI INDICI STATISTICI, TABELLE E GRAFICI Unverstà C. Cattaneo Luc, Corso d Statstca, 9 Ottobre 2013 Laboratoro Excel Sessone n. 1 Venerdì 041013 Gruppo PZ Lunedì 071013 Gruppo AD Martedì 081013 Gruppo EO VERSIONE DEFINITIVA (9 Ottobre 2013) degl

Dettagli

Esercizi sulle reti elettriche in corrente continua (parte 2)

Esercizi sulle reti elettriche in corrente continua (parte 2) Esercz sulle ret elettrche n corrente contnua (parte ) Eserczo 3: etermnare gl equvalent d Thevenn e d Norton del bpolo complementare al resstore R 5 nel crcuto n fgura e calcolare la corrente che crcola

Dettagli

- Riproduzione riservata - 1

- Riproduzione riservata - 1 Razze: Setter Inglese Bracco Francese tpo Prene D Franco Barsottn Va Bugallo 1b 56040 Crespna (PI) www.allevamentodelbugallo.t nfo@allevamentodelbugallo.t Parentela e consangunetà; Parentela; genetcamente

Dettagli

Modelli con varabili binarie (o qualitative)

Modelli con varabili binarie (o qualitative) Modell con varabl bnare (o qualtatve E( Y X α + βx + ε quando Y è una varable benoullana Y 1 0 s ha l modello lneare d probabltà Pr( Y 1 X α + βx + ε dove valor stmat della Y assumono l sgnfcato d probabltà.

Dettagli

Esercizio statistica applicata all ingegneria stradale pag. 1

Esercizio statistica applicata all ingegneria stradale pag. 1 ESERCIZIO STATISTICA APPLICATA ALLA PROGETTAZIONE STRADALE SINTESI S supponga d avere eseguto 70 sure della veloctà stantanea de vecol che transtano nelle sezon d due strade A e B. S supponga che tal sure

Dettagli

V n. =, e se esiste, il lim An

V n. =, e se esiste, il lim An Parttore resstvo con nfnte squadre n cascata. ITIS Archmede CT La Fg. rappresenta un parttore resstvo, formato da squadre d restor tutt ugual ad, conness n cascata, e l cu numero n s fa tendere ad nfnto.

Dettagli

Algebra 2. 6 4. Sia A un anello commutativo. Si ricorda che in un anello commutativo vale il teorema binomiale, cioè. (a + b) n = a i b n i i.

Algebra 2. 6 4. Sia A un anello commutativo. Si ricorda che in un anello commutativo vale il teorema binomiale, cioè. (a + b) n = a i b n i i. Testo Fac-smle 2 Durata prova: 2 ore 8 1. Un gruppo G s dce semplce se suo unc sottogrupp normal sono 1 e G stesso. Sa G un gruppo d ordne pq con p e q numer prm tal che p < q. (a) Il gruppo G può essere

Dettagli

Quattro passi nella statistica per chimici

Quattro passi nella statistica per chimici Quattro pass nella statstca per chmc Lo scopo dell anals statstca applcata a sere d dat spermental è quella d ottenere nformazon per valutare la valdtà d una procedura o la accettabltà d un dato analtco.

Dettagli

LA REGRESSIONE LINEARE MODELLO II E LEAST-PRODUCTS. IL CONFRONTO TRA DUE METODI QUANTITATIVI. IL SEI-SIGMA NEL CONTROLLO DI QUALITA'

LA REGRESSIONE LINEARE MODELLO II E LEAST-PRODUCTS. IL CONFRONTO TRA DUE METODI QUANTITATIVI. IL SEI-SIGMA NEL CONTROLLO DI QUALITA' CAPITOLO XXIV LA REGREIONE LINEARE MODELLO II E LEAT-PRODUCT. IL CONFRONTO TRA DUE METODI QUANTITATIVI. IL EI-IGMA NEL CONTROLLO DI QUALITA' 4.. I modell I e II nella regressone lneare; l caso d Berkson

Dettagli

IL RUMORE NEGLI AMPLIFICATORI

IL RUMORE NEGLI AMPLIFICATORI IL RUMORE EGLI AMPLIICATORI Defnzon S defnsce rumore elettrco (electrcal nose) l'effetto delle fluttuazon d corrente e/o d tensone sempre present a termnal degl element crcutal e de dspostv elettronc.

Dettagli

Circuiti dinamici. Circuiti del secondo ordine. (versione del ) Circuiti del secondo ordine

Circuiti dinamici. Circuiti del secondo ordine.  (versione del ) Circuiti del secondo ordine rcut dnamc rcut del secondo ordne www.de.ng.unbo.t/pers/mastr/ddattca.htm (versone del 9-6- rcut del secondo ordne rcut del secondo ordne: crcut l cu stato è defnto da due varabl x ( e x ( Per un crcuto

Dettagli

Circuiti elettrici in regime stazionario

Circuiti elettrici in regime stazionario rcut elettrc n regme stazonaro Metod d anals www.de.ng.unbo.t/pers/mastr/ddattca.htm ersone del -0-00 Premessa Nel caso pù generale è possble ottenere la soluzone d un crcuto rsolendo un sstema formato

Dettagli