CONFRONTI TRA RETTE, CALCOLO DELLA RETTA CON Y RIPETUTE, CON VERIFICA DI LINEARITA E INTRODUZIONE ALLA REGRESSIONE LINEARE MULTIPLA

Documenti analoghi
Classi di reddito % famiglie Fino a Oltre Totale 100

Indipendenza in distribuzione

SIMULAZIONE DI ESAME ESERCIZI. Cattedra di Statistica Medica-Università degli Studi di Bari-Prof.ssa G. Serio 1

Elementi di Statistica descrittiva Parte III

La classe che mostra la distribuzione più elevata è quella 60-90, che corrisponde a un uso elevato dell automobile. f i fr (= f i/n) fr% (=fr*100)

TRATTAMENTO STATISTICO DEI DATI ANALITICI

frazione 1 n dell ammontare complessivo del carattere A x

Le misure di variabilità

DI IDROLOGIA TECNICA PARTE II

b) Relativamente alla variabile PREZZO, fornire una misura della variabilità della distribuzione attraverso

Design of experiments (DOE) e Analisi statistica

ESERCIZI SU DISTRIBUZIONI CAMPIONARIE

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER ATTRIBUTI

Indici di asimmetria. Elementi di Statistica descrittiva Parte IV. Simmetria di una distribuzione di frequenze. Primo indice di asimmetria (1/3)

Stim e puntuali. Vocabolario. Cambiando campione casuale, cambia l istogramma e cambiano gli indici

ARGOMENTO: MISURA DELLA RESISTENZA ELETTRICA CON IL METODO VOLT-AMPEROMETRICO.

Formulario e tavole. Complementi per il corso di Statistica Medica

COMPLEMENTI DI STATISTICA. L. Greco, S. Naddeo

La volatilità storica, le misure di rischio asimmetrico e la tracking error volatility

Analisi di dati vettoriali. Direzioni e orientazioni

Elementi di Statistica descrittiva Parte II

Dimostrazione della Formula per la determinazione del numero di divisori-test di primalità, di Giorgio Lamberti

UNI CEI ENV (GUIDA ALL ESPRESSIONE DELL INCERTEZZA DI MISURA)

RISOLUZIONE ENO 10/2005 GUIDA PRATICA PER LA CONVALIDA, IL CONTROLLO QUALITÀ, E LA STIMA DELL INCERTEZZA DI UN METODO ALTERNATIVO DI ANALISI ENOLOGICA

Il modello di regressione lineare semplice (1) Studio della dipendenza riepilogo

STATISTICA DESCRITTIVA

CORSO DI LAUREA IN ECONOMIA AZIENDALE Metodi Statistici per le decisioni d impresa (Note didattiche) Bruno Chiandotto

Incertezza di misura

STATISTICA DESCRITTIVA - SCHEDA N. 4 VARIABILI QUANTITATIVE Trasformazioni lineari Indici di covarianza e correlazione

13 Valutazione dei modelli di simulazione

Indici di Posizione. Gli indici si posizione sono misure sintetiche ( valori caratteristici ) che descrivono la tendenza centrale di un fenomeno

Capitolo 2 APPROSSIMAZIONI DI DATI E FUNZIONI CON MATHCAD

Modello dinamico nello spazio dei giunti: relazione tra le coppie di attuazione ai giunti ed il moto della struttura

ALCUNI ELEMENTI DI TEORIA DELLA STIMA

Marco Riani - Analisi delle statistiche di vendita 1

Corso TFA - A048 Matematica applicata. Didattica della matematica applicata all economia e alla finanza

CORSO DI LAUREA IN ECONOMIA AZIENDALE Metodi Statistici per le decisioni d impresa (Note didattiche) Bruno Chiandotto

17. FATICA AD AMPIEZZA VARIABILE

Organizzazione del corso. Elementi di Informatica. Orario lezioni ed esami. Crediti. Dispense e lucidi. Ricevimento studenti

CORSO DI LAUREA IN ECONOMIA AZIENDALE Metodi Statistici per le decisioni d impresa (Note didattiche) Bruno Chiandotto

Esercizi di Statistica per gli studenti di Scienze Politiche, Università di Firenze

ALCUNI ELEMENTI DI STATISTICA DESCRITTIVA

Algoritmi e Strutture Dati. Alberi Binari di Ricerca

SCHEDA DIDATTICA N 5

Leasing: aspetti finanziari e valutazione dei costi

Corso TFA - A048 Matematica applicata. Didattica della matematica applicata all economia e alla finanza

Lezione 1. I numeri complessi

Obiettivi. Statistica. Variabili casuali. Spazio di probabilità. Introduzione

STATISTICA Lezioni ed esercizi

RAPPRESENTAZIONE ANALITICA DELLE DISTRIBUZIONI STATISTICHE CON R

Modelli di Flusso e Applicazioni: Andrea Scozzari. a.a

= = stimatori degli indici statistici di variabilità. Definizione della varianza campionaria. Definizione dello scarto quadratico medio.

CAPITOLO III SISTEMI DI EQUAZIONI LINEARI

In questo capitolo vedremo solamente un caso di rendita, che useremo poi per generalizzare le rendite e dedurre tutti gli altri casi.

Possibilità e limiti delle previsioni! Concetto di previsione! Concetto di previsione/2! Concetto di previsione/3!

Autori. Versione 2.0. Giorgio Della Rocca (*) Marco Di Zio (*) Orietta Luzi (*) Giorgia Simeoni (*) (*) ISTAT - Servizio MTS (**) ISTAT - Servizio PSM

L assorbimento e lo strippaggio

Regime di capitalizzazione composta

Analisi economica e valutazione delle alternative

Modelli descrittivi, statistica e simulazione

per il controllo qualità in campo tessile ing. Piero Di Girolamo

DIPARTIMENTO DI ECONOMIA

ESERCIZIO 4.1 Si consideri una popolazione consistente delle quattro misurazioni 0, 3, 12 e 20 descritta dalla seguente distribuzione di probabilità:

ammontare del carattere posseduto dalle i unità più povere.

Statistica degli estremi

Le 7 fasi dell AMD (PAG.6 M.Fraire-Metodi di AMD CISU, Roma 1994)

Attualizzazione. Attualizzazione

Copyright Esselibri S.p.A.

STUDIO DEL LANCIO DI 3 DADI

Appunti: elementi di Statistica

Università di Firenze Corso di Laurea in Statistica Prova scritta di Statistica II Prof. B. Chiandotto

METODOLOGIA SPERIMENTALE IN AGRICOLTURA

Lezioni del Corso di Fondamenti di Metrologia

Modelli di Schedulazione

Lezione 3. Funzione di trasferimento

STATISTICA DESCRITTIVA

«MANLIO ROSSI-DORIA»

Avvertenza. Rendite frazionate

Capitolo 5: Fattorizzazione di interi

Appunti di STATISTICA corso di recupero Docente Sciacchitano ANTONIA MARIA

Premessa Equazioni i differenziali lineari

Problema della Ricerca

RENDITE. Le singole rate possono essere corrisposte all inizio o alla fine di ciascun periodo e precisamente si ha:

LA VARIABILITA. Nella metodologia statistica si distinguono due aspetti della variabilità:

MINICORSO: Controllo Statistico di Processo (parte 2/5) di Andrea Saviano

CALCOLO ECONOMICO E FINANZIARIO

Ministero della Salute D.G. della programmazione sanitaria --- GLI ACC - L ANALISI DELLA VARIABILITÀ METODOLOGIA

La valutazione dei credit derivatives. ed una sua applicazione a dati di mercato.

* * * Nota inerente il calcolo della concentrazione rappresentativa della sorgente. Aprile 2006 RL/SUO-TEC 166/2006 1

Vantaggi della stratificazione

CORSO STATISTICA MATEMATICA LUCIO BERTOLI BARSOTTI

Parte I (introduzione)

Alcuni concetti di statistica: medie, varianze, covarianze e regressioni

Le variabili casuali semplici

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI CONFRONTO DI PIU MEDIE IL METODO DI ANALISI DELLA VARIANZA

MATEMATICA E STATISTICA. Dai dati ai modelli, alle scelte: rappresentazione, interpretazione e previsione

Relazioni tra variabili: Correlazione e regressione lineare

MANUALE DI BEST PRACTICE

PROBLEMI INVERSI NELLA MECCANICA DEL

Manuale di Estimo Vittorio Gallerani, Giacomo Zanni, Davide Viaggi Copyright 2004 The McGraw-Hill Companies srl

Transcript:

APITOLO VII ONFRONTI TRA RETTE, ALOLO DELLA RETTA ON Y RIPETUTE, ON VERIFIA DI LINEARITA E INTRODUZIONE ALLA REGRESSIONE LINEARE MULTIPLA 7.. ofroto tra due rette d regressoe co l test t d Studet e calcolo della retta comue 7.. ofroto tra put su due rette d regressoe 4 7.3. ofroto tra pu rette d regressoe co l test F, calcolo della retta comue e tervall d cofdeza 7 7.4. ofrot multpl tra pù coeffcet agolar 7 7.5. Aals della relazoe dose-effetto co y rpetute: calcolo della retta d regressoe e test per la learta' 8 7.6. alcolo de term della regressoe, medate coeffcet polomal 40 7.7. Test d learta co y rpetute, campo o blacat 47 7.8. e sulla regressoe pesata e della sua calbrazoe 55 7.9. La regressoe ell aals della varaza a pu crter 58 7.0. odzo d valdta della regressoe co l aals de resdu; test per la costaza della varaza d errore (Levee modfcato e Breusch-Paga o oo-wesberg), trasformazo per la retta 6 7.. Scelta de valor d x, per ua regressoe sgfcatva 69 7.. La regressoe leare multpla e l modello geerale d regressoe leare 7

APITOLO VII ONFRONTI TRA RETTE, ALOLO DELLA RETTA ON Y RIPETUTE, ON VERIFIA DI LINEARITA E INTRODUZIONE ALLA REGRESSIONE LINEARE MULTIPLA 7.. ONFRONTO TRA DUE RETTE DI REGRESSIONE ON IL TEST t DI STUDENT E ALOLO DELLA RETTA OMUNE I coeffcet agolar delle rette d regressoe possoo essere post a cofroto, co cocett e metod del tutto aalogh a quell utlzzat per le mede. Ache sotto l'aspetto cocettuale, le rette soo mede, quato - dcao la rsposta meda d Y per u dato valore d. Quest test, dett d parallelsmo poché le rette co lo stesso coeffcete agolare soo parallele, servoo per - verfcare la sgfcatvtà delle dffereze tra due o pù coeffcet d regressoe, medate la dstrbuzoe t o la dstrbuzoe F. Grupp J P Id. Y Y... Y... p Y p x y y... x y... p y p x y y... x y... p y p ---.............................. I x y x Y... x y... p y p ---.............................. M x m y m x m y m x m Y m mp y mp Mede Y Y... Y... p Yp

Quado s dspoe d dat d regressoe che soo stat classfcat due o pù grupp, all'tero d oguo d ess è possble ammettere l'essteza d ua regressoe leare d Y su. ome esempo, può essere cosderato l cofroto - della relazoe tra l peso e l'altezza u gruppo d masch ( b ) - u altro della relazoe tra l peso e l'altezza u gruppo d femme ( b ) oppure tra pù grupp classfcat per classe d età (gova( b ), adult( b ), aza( b 3 )). I dat d p grupp, oguo co osservazo spermetal, possoo essere rportat ua tabella come la precedete, utle per la presetazoe de dat e per la compresoe delle formule. I essa per og gruppo soo rportat valor sa della varable sa della varable Y. Due o pù rette d regressoe possoo dfferre per - la pedeza o coeffcete agolare b, - la poszoe (elevato), che rappreseta u cocetto leggermete dfferete da quello dell tercetta, ache se fodametalmete cocdete Metre - per la pedeza l cofroto utlzza valor de coeffcet agolar b, - per l tercetta l cofroto utlzza valor a, - per la poszoe (elevato) l cofroto verfca la stessa potes dell tercetta, ma seza utlzzare l cofroto tra valor delle tercette a perché per 0 l valore d Y potrebbe essere prvo d sgfcato o comuque o segure la legge leare stmata u campo d osservazo lotao da esso. Ad esempo, ella stma della relazoe tra altezza () e peso (Y) u gruppo d persoe, o esste ua persoa co altezza 0. Se s msura la relazoe tra la capactà respratora (Y) persoe d vare età () ma sempre adulte, o è detto che la stessa relazoe sa valda ache per u eoato (co 0). Ioltre, l uso statstco dell tercetta a elle dscple bologche s scotra co l grave lmte che - ha u errore stadard molto grade, come mostrato el captolo precedete. D cosegueza, per valutare la sgfcatvtà della dffereza tra due poszo (elevatos), var autor rtegoo pù corretto e vataggoso rcorrere a altr metod. Il rsultato de cofrot tra rette mplca scelte successve. Se l test sulla pedeza tra pù grupp o rfuta l potes ulla (β β β 3 ), può essere utle stmare u coeffcete agolare comue.

Se ache l test sulla poszoe o rfuta l potes ulla (α α α 3 ), per gl stess grupp s può calcolare ua retta comue, che esprma la relazoe tra le e le Y d tutta la popolazoe. Il cofroto per l parallelsmo tra due rette d regressoe, - la prma co coeffcete agolare b calcolato su u campo d dat - la secoda co coeffcete agolare b calcolato su u campo d dat può essere realzzato co l test t d Studet, per verfcare l potes ulla H 0 : β β cotro ua delle potes alteratve (che possoo essere sa blateral che ulateral) H : β β ; oppure H : β < β oppure H : β > β Questo test t d Studet ha u umero d gdl ( ) + ( ), quato utlzza le varaze d errore delle due rette; spesso gdl complessv soo dcat come N - 4, dove N è l umero totale d osservazo de due grupp. Il valore d t (N-4) è calcolato co b b t (N-4) es dove - ( b b) ( bb ) es è l'errore stadard della dffereza tra due coeffcet agolar b e b e è otteuto da dove es ( b b ) S( bb ) + ( Y Y ) + ( Y Y ) S ( b b) + + ( ) ( ) Se l potes ulla H 0 : β β o vee respta, partcolare quado la probabltà P rsulta alta, maggore d 0.0-0.0, è accettable assumere che due coeffcet agolar b e b sao ugual. 3

Se s rfuta l potes ulla, a volte è utle cooscere quale sa l loro puto d tersezoe, che ha coordate e Yˆ : - dapprma s calcola l valore d - successvamete da esso s rcava la stma d Yˆ a a b b co oppure co Yˆ Yˆ a b + a b + Quado o s rfuta l potes ulla, molto frequetemete s rchede ache d calcolare - l coeffcete agolare medo o comue b che è otteuto el modo pù rapdo dal rapporto tra - la somma delle due codevaze e - la somma delle due devaze d b ( ) ( Y Y ) + ( ) ( Y Y ) ( ) + ( ) La sua varaza S b( ) è uguale alla S rportata sopra. ( b b ) ome è stata verfcata l potes ulla sulla pedeza, pure co lmt evdezat precedeza può essere verfcata quella sulla tercetta, co l potes ulla H 0 : α α cotro potes alteratve che possoo essere sa blateral che ulateral: H : α α ; oppure H : α < α oppure H : α > α S utlzza acora u test t, sempre co gdl N - 4 t N 4 a a S aa 4

5 dove ( ) ( ) + + + ) ( e a a S S Per stmare la sgfcatvtà della dffereza tra le due poszo (elevatos), co u test t che può essere sa ulaterale sa blaterale, s può applcare (co gdl N 3) ( ) ( ) ( ) + + + e A S b Y Y t ) ( 3) ( dove - e( ) S rappreseta la varaza d errore comue, rcavata da due grupp ( e ) de dat orgar co la sere d passagg logc e calcol successv. Dapprma dalle devaze e codevaze s stmao - ( ) ( ) + A - ( ) ( ) ( ) ( ) + Y Y Y Y B - ( ) ( ) + Y Y Y Y Da quest s rcavao - l coeffcete agolare comue b A B b - la devaza d errore comue ) SQ e( e A B SQ ) (

cu gdl soo N-3 e fe la varaza d errore comue S e( ) S e( ) SQe( ) N 3 sempre co gdl N-3 s applca l test t, che ha DF N 3(come la devaza e la varaza d'errore), co t ( N 3) S ( Y Y ) b ( ) ( ) e ( ) + + A Se le due rette a cofroto o soo sgfcatvamete dfferet (co ua probabltà alta, o prossma al valore crtco sgfcatvo) - é per l coeffcete agolare - é per la poszoe (elevato) s può dedurre che appartegoo alla stessa popolazoe e qud hao la stessa equazoe d regressoe o la regressoe comue: Yˆ a + b dove - b è calcolato come dcato precedeza, metre - a è rcavato da a Y P b P co Y P e P che soo le mede poderate de due grupp Y + Y Y P + e + P + ESEMPIO. ome dmostrazoe d tutt passagg logc e metodologc descrtt precedeza, s assumao due campo ( e ) o blacat d dvdu adult che svolgoo ua attvtà fsca dversa, per valutare se hao u valore d pressoe saguga dfferete (Y), rapporto all'età (). Svluppado tutt suo passagg l esempo tratto dal testo d Zar, 6

) calcol prelmar dedott dalla sere d dat (due sere campoare d,y e,y ) hao forto seguet rsultat: Stme prelmar dalle dstrbuzo de dat ampoe ampoe ( ) ( Y Y ) ( ) ( Y Y ).0.659 Y.68 3.849 Y Y Y.585.475 54,6 56,9 Y 70, 6,9 3 5 ) Da ess s rcavao due coeffcet agolar co le loro tercette e qud le rette Rette ampoe ampoe b.585,566.0.475,.659 49 a 70,,566 54,6 84, 7 6,9,49 56,9 78, 0 Yˆ a + b Yˆ 84,7 +, 566 Yˆ 78,0 +, 49 3) Per gugere al test d sgfcatvtà della dffereza tra due coeffcet agolar e la poszoe, 7

s rcavao le devaze d errore e df relatv ampoe ampoe Devaza d errore.585.68 36.0.475 3.849 57.659 DF 3 5-3 e da ess s pervee alla varaza d errore assocata o comue che è S e ( ) 36 + 57 93, + 3 4 4) Ife l test per l parallelsmo, coè per la verfca dell potes H 0 : β β cotro H : β β (potrebbe ache essere ulaterale, ma questo caso la domada è d tpo blaterale), può essere effettuato co l test t d Studet t (+ 3),566,49,.0 +,.659 t 0,074 0,074 0,095 0,396 ( 4) e s ottee (t 4 )0,53 E' u rsultato o sgfcatvo, poché l valore d t calcolato (0,53) è ettamete ferore a quello crtco per α 0.05 ua dstrbuzoe blaterale co gdl 4. Az, l valore è addrttura vco a quello per α 0.5; la probabltà P così alta che s può affermare che le due rette soo parallele. 0,53 5) Successvamete s passa al cofroto tra le due poszo, per verfcare l potes H 0 : le due rette hao la stessa poszoe cotro H : le due rette o hao la stessa poszoe 8

Dopo aver calcolato - ( ) + ( ) A.0 +.659.67 - ( ) ( Y Y ) + ( ) ( Y Y ) B.585 +.475 4.060 - ( Y Y ) + ( Y Y ).68 + 3.849 6.467 s rcavao - l coeffcete agolare comue b B 4.060 b, 500 A.67 - la devaza d errore comue SQ e( ) SQ B 4.060 6.467 6.467 6.7 96 A.67 e ( ) cu gdl soo N-3, coè 7-3 4 - e fe la varaza d errore comue S e( ) SQ e( ) 96 Se ( ), 3333 N 3 4 6) Per la verfca s applca l test t co DF N 3 (coè 7 3) 4 t ( N 3) S ( Y Y ) b ( ) ( ) e ( ) + + A ( 70, 6,9),5 ( 54,6 56,9) ( 54,6 56,9),33 + + 3 5.67 7,3 ( 3,5) 0,8,33 0,46,34 ( 4) t 8,06 otteedo (t 4 )8,06. 9

Poché la tabella de valor crtc per α 0.00 blaterale (a causa della domada sulla essteza della sola dffereza) rporta 3,745 s rfuta l potes ulla co probabltà P ettamete more d 0.00. 7) S deve qud cocludere che esstoo due rette d regressoe, che - hao lo stesso coeffcete agolare b - ma o hao la stessa poszoe (elevato). I altr term, due grupp soo caratterzzat da due rette dfferet, che hao lo stesso coeffcete agolare b ma due tercette a dfferet. La rappresetazoe grafca evdeza l loro parallelsmo: - hao coeffcet agolar b ugual, ma tercette a dfferet. Le statstche delle due rette stmate soo - per l gruppo - per l gruppo Yˆ Yˆ a + b 84,7 +, 5 a + b 78,0 +, 5 0

8) Se l ultmo test o fosse rsultato sgfcatvo, s sarebbe dovuto cocludere che esste ua sola retta d regressoe, che ha - l coeffcete agolare comue b,5 - e la poszoe d Y comue (o tercetta a comue poché l cocetto rmae valdo, ache se l metodo o le ha utlzzate per l cofroto). Questa tercetta comue può essere calcolata a partre dalle due mede poderate - delle Y, coè YP Y P Y + Y + 3 70, + 5 6,9,6 + 443,5 3 + 5 8 66,3 - e delle, coè P e rsulta uguale a 8,5. P a + + 3 54,6 + 5 56,9 709,8 + 853,5 3 + 5 8 YP b P 55,8 66,3,5 55,8 66,3 84,8 8,5 I coclusoe, se essuo de due test (l prmo sulla dffereza tra b, l secodo sulla dffereza fra a) fosse rsultato sgfcatvo, la retta comue sarebbe stata ˆ a + b coè Yˆ 8,5 +, 5 Y Altr test lmtao l cofroto delle rette a due coeffcet agolar. Ifatt l'tercetta quas sempre o ha sgfcato bologco. Qualuque sa l rsultato statstco d b e a, è sempre mportate evdezare l terpretazoe bologca e ambetale. ESEMPIO. S cofrota la capactà respratora (Y, msurata ltr) d 40 soggett espost da a alle esalazo d admo (gruppo ) co quella d 44 lavorator o espost (gruppo ), cosderado l effetto dell età (, msurata a). ) Dalla dstrbuzoe de dat s rcavao le stme prelmar per l test, otteedo

Stme prelmar dalle dstrbuzo de dat ampoe ampoe ( ) ( Y Y ) ( ) ( Y Y ) 4.397 6.97 Y 6,58 0,6 Y Y Y -36,39-89,7 4,38 39,80 Y 3,9 4,46 40 44 ) Da ess s rcavao due coeffcet agolar, co le loro tercette e qud le due rette Rette ampoe ampoe b 36,39 0,0538 4.397 89,7 0,0306 6.97 a 3,9 ( 0,0538 4,38) 6, 5 4,46 ( 0,0306 39,80) 5, 68 Y ˆ a + b Yˆ 6,5 + ( 0,0538 ) Yˆ 5,68 + ( 0,0306 ) 3) Per gugere al test d sgfcatvtà della dffereza tra due coeffcet agolar, s devoo rcavare le loro devaze d errore (d solto co la formula abbrevata come per calcol rportat) e df relatv come ella tabella seguete

Devaza d errore ( ) ampoe ampoe Y Yˆ 36,39 89.7 6,58 3, 87 0,6 4, 80 4.397 6.97 DF 40 38 44-4 e da ess pervere alla loro varaza assocata o comue S e( ) che è 3,87 + 4,80 8,76 38 + 4 80 S e ( ) 0,3584 4) Ife l test per l parallelsmo, coè la verfca dell potes H 0 : β β cotro H : β β (potrebbe ache essere ulaterale, ma questo caso la domada era d tpo blaterale), può essere effettuato co l test t d Studet t (38+ 4) 0,0538 ( 0,0306) 0,3584 4.397 + 0,3584 6.97 t 0,03 80 0,0004,966 Poché valore assoluto l rsultato (,966) è more del valore crtco (,990) rportato ella tabella del test t d Studet co gdl 80 per la probabltà α 0.05 blaterale, - o è possble rfutare l potes ulla. Tuttava, dato l umero o molto alto d osservazo e la vcaza al valore crtco, s può parlare d sgfcatvtà tedezale. Acora ua volta è utle sottoleare l mportaza dell potes che s vuole verfcare e qud della esatta coosceza del problema dscplare, che o deve ma essere dsguta dalla coosceza della tecca statstca: se la domada fosse stata d tpo ulaterale, la probabltà stmata sarebbe stata leggermete maggore d 0.05 e qud s sarebbe evdezata ua dffereza sgfcatva tra due coeffcet agolar. 3

7.. ONFRONTO TRA PUNTI SU DUE RETTE DI REGRESSIONE Quado el cofroto tra due rette s è rfutata l potes ulla per uo solo de parametr ( α, β ) o per etramb, qud s hao due rette sgfcatvamete dfferet, può essere utle - verfcare se soo tra loro sgfcatvamete dfferet due put Yˆ collocat sulle due rette dfferet, ma avet lo stesso valore d. Ad esempo, ella rcerca applcata può essere chesto d verfcare - medca se la capactà respratora ( Yˆ ) d due persoe della stessa età ( ), l prmo apparteete al gruppo degl ammalat ( Y ˆ ) e l secodo al gruppo d cotrollo ( Yˆ ), soo statstcamete dfferet e loro valor med; - chmca se l volume ( Yˆ ) d due sostaze dfferet ( e ), per le qual esste ua crescta leare dfferete al varare della temperatura, è sgfcatvamete dverso alla stessa temperatura ( - farmacologa se l effetto d due farmac ( Yˆ e ma sempre d tpo leare, è sgfcatvamete dfferete alla stessa dose ( Yˆ ); ) co ua relazoe dose - effetto dfferete, ). I term pù formal, s vuole verfcare H 0 : µ ˆ µ Y Yˆ cotro H : µ ˆ µ Y Yˆ co u test t che può essere sa blaterale che ulaterale. Il valore del t co df N - 4 è dove t N 4 Yˆ ˆ Y S Yˆ Yˆ S S + + ( ) ( ) Yˆ Y e ( ) + ( ) ( ) co la stessa smbologa utlzzata el paragrafo precedete. 4

ESEMPIO. Relaborado dat d Jerrold H. Zar el testo del 999 Bostatstcal Aalyss (4 th ed. Pretce Hall, Upper Saddle Rver, Ney Jersey II + 663 + App. pp.), s suppoga d aver stmato la relazoe dose - effetto d due farmac ( e ) Y 97 ˆ 0,57 +, Y 7 ˆ 4,9 +, co due campo ( e ) cu valor hao dato Stme prelmar dalle dstrbuzo de dat ampoe ampoe ( ) ( Y Y ).47.7 3.300 0.964 ( ) ( Y Y ) 4.363 499,93 8,95 6 30 S vuole sapere se per la dose 3, l effetto de due farmac è sgfcatvamete dfferete. Rsposta. ) o valor gà calcolat e due grupp per stmare le due rette, s rcavao le due devaze d errore e df relatv ampoe ampoe Devaza d errore ( SQ e ) 4.363 3.300 359,3.47 4.99 0.964 70,8.7 DF 6 4 30-8 5

e da ess s pervee alla loro varaza assocata o comue che è S e ( ) 359,3 + 70,8 630,, 4 + 8 5 ) Successvamete, per la dose potzzata ( 3), s calcola - l effetto sulle dverse rette ( Y ˆ e Y ˆ ) che s vogloo cofrotare Y 0,57 +,97 3 49,8 ˆ Y 4,9 +,7 3 53, ˆ otteedo Y ˆ 49,8 e Y ˆ 53, 3 ) Ife co l test t t 4 + 8, 6 + 30 49,8 53, + ( 3,93) ( 3 8,95).47 +.7 t 3,94 3,94, 0,544,37 5,87 s ottee t -,87 co gdl 5. La tabella de valor crtc co df 5 rporta -,674 per α 0.0 u test blaterale e per α 0.005 u test ulaterale. D cosegueza, - s rfuta l potes ulla alle due probabltà dcate. Ovvamete tra esse deve essere utlzzata quella collegata al tpo d potes alteratva che è stata formulata al mometo dell eucazoe del problema. Acora ua volta rtora l problema d o effettuare e u test per ua sgfcatvtà geerca, ma rapporto stretto co l potes che s tede verfcare. 6

7.3. ONFRONTO TRA PIU RETTE DI REGRESSIONE ON IL TEST F, ALOLO DELLA RETTA OMUNE E INTERVALLI DI ONFIDENZA Tutt test attuat e due paragraf precedet su due campo dpedet possoo essere estes al caso d pù campo. ome el cofroto tra mede, s passa dall uso del t d Studet al test F d Fsher. La sgfcatvtà delle dffereze tra pù coeffcet d regressoe può essere verfcata medate l aals della varaza, co potes ulla H β β... β... β 0 : p ed potes alteratva H β β β β o soo tutt ugual :,,...,,..., p ella codzoe che - le varaze d errore de var grupp sao omogeee. I passagg logc soo: ) Se s assume come vera l'potes ulla che soo tra loro tutt ugual, var coeffcet agolar calcolat ( b ) rappresetao varazo casual dell'uco vero coeffcete agolare ( β ), la cu stma mglore è forta dal coeffcete d regressoe comue ( b ), calcolato come rapporto tra la sommatora delle codevaze e quella delle devaze total d : b c ( ) ( Y Y ) ( ) ) A questo coeffcete agolare comue è assocata ua quota d devaza della Y (Dev. c devaza comue) par a Dev b ( ( ) ( Y Y ) ( ) 3) Per og -esmo gruppo la retta d regressoe è data da ( ) $Y Y + b 7

Y Y^ Y^ (c) _ Y Y Se le vare rette a cofroto possoo essere cosderate tra loro parallele, ello stesso modo la stma del valore medo comue della Y ( Y $ c ) per è data da Yˆ c Y + b ( ) 4 ) ome rportato el grafco precedete, lo scostameto d og sgola osservazoe Y dalla meda del propro gruppo Y può essere dvso tre quote: - del puto dalla retta del suo gruppo (Y Y ), - della retta del gruppo da quella comue ( Y $ Y $ ), - della retta comue dalla meda geerale ( Y $ Y ) c c ( ) ( $ $ ) ( $ ) Y Y Y Y + Y Y + Y Y J c c 8

5) Le rspettve devaze, ossa la somma de quadrat d quest scart, co grupp o rette a cofroto e co u umero totale d osservazo par a N possoo essere rpartte modo del tutto smle a quato gà fatto ell ANOVA a u crtero: I - devaza totale etro grupp co gdl N- corrspodete alla somma delle devaze total d og gruppo, II - devaza resdua toro alle rette separate co gdl N- corrspodete alla somma delle devaze d errore d og retta, III - devaza della regressoe d og retta co gdl otteuta sottraedo la alla, IV - devaza dovuta alla retta comue, co gdl o d parallelsmo, data dal rapporto tra l quadrato della somma delle codevaze e le devaze d, V - devaza dovuta alle dffereze tra rette, co gdl - o d scostameto dal parallelsmo, otteuta sottraedo la 4 alla 3. 6) Idcado - la somma de quadrat degl scart d rspetto alla sua meda el gruppo -esmo co ( Sx ) ( ) - la somma de quadrat degl scart d Y rspetto alla sua meda Y co ( Sy ) ( Y Y ) - la somma de prodott degl scart d e Y rspetto alle loro mede co l calcolo delle devaze è mostrato co semplctà. ( xy) ( ) ( Y Y ) Utlzzado, per semplctà d calcolo, le formule abbrevate s ottee - la devaza etro grupp co ( Sy ) 9

co gdl N- (dove è l umero d grupp o rette) - la devaza dovuta alla retta comue o al coeffcete agolare comue co co gdl ( Sxy) ( Sx ) - la devaza dovuta alle dffereze tra coeffcet o alle dffereze tra rette: co gdl. ( Sxy) ( Sx ) ( Sxy) ( Sx ) Dal loro rapporto s rcava la varaza dovuta alle dffereze tra coeffcet agolar ( S ) b - la devaza resdua toro alle rette separate: co gdl N. ( Sy ) ( Sxy) ( Sx ) Dal loro rapporto s ottee la varaza d errore toro alle rette separate ( S ) e 7) L'aals della varaza per verfcare la sgfcatvtà delle dffereze tra coeffcet d regressoe è u test F co gdl - e N-. E otteuto medate l rapporto tra S F, N S - la varaza delle dffereze tra coeffcet d regressoe leare scostameto dalla regressoe - la varaza del resduo toro alle rette separate b e S e o varaza d errore. S b detta ache varaza d ESEMPIO. Svluppado u esempo rportato u testo a grade dffusoe terazoale (Armtage e Berry rpetutamete ctato come testo d rfermeto), s suppoga d voler verfcare se esste ua dffereza sgfcatva tra coeffcet agolar d tre rette dfferet, stmate ella relazoe tra 0

capactà respratora ( ltr) e età ( a tre grupp (o blacat) d persoe dversamete esposte a fattor d rscho. Rsposta. ) Per verfcare l potes ulla H 0 : β β β3 cotro l potes alteratva H : β, β, β3 o soo tutt ugual dalla dstrbuzoe de dat Grupp 3 Id. Y Y 3 Y 3 y x y x 3 y 3 y x y x 3 y 3 ---.................. m y m x m y m x m3 Y m3 Mede Y Y 3 Y3 soo stat rcavat seguet valor Stme prelmar da dat ampoe ampoe ampoe 3 ( ) ( Y Y ) ( ) ( Y Y ) 9.8 6.97,74,55 0,6-77,64-06, -89,7 b 77,64-0,085 9 06, -0,0465.8 89,7-0,0306 6.97 8 44

) Da ess, per semplce somma delle devaze e delle codevaze de var grupp, s ottegoo valor total e l coeffcete agolare comue b Somme d Devaze e odevaze de grupp Valor e Total ( ) J ( Y Y ) J 9 +.8 + 6.97 9.39,74 +,55 +,6 44,90 ( ) ( Y Y ) J b (-77,64)+ (-06,) + (-89.7) -373,57 373,57-0,0398 9.39 N 84 evdezado che la devaza d errore totale è SQ e(tot ) 44,90 e ha gdl N - coè 84 3 8 4) Da quest Total de grupp s rcavao: I - La devaza dovuta alla retta comue o al coeffcete agolare comue ( SQ ); co b ( Sxy) ( Sx ) 9. 39 373,57 4,86 è SQ b 4,86 e ha gdl II La devaza d errore per le rette separate ( SQ ); co b

ampoe ALOLI SQ b 77,64,74,74 6, 6 5,3 9 06,,55.8,55 4,94 7,6 3 89,7 0,6 0,6 5, 8 6.97 4,80 TOTALE ------------- 7,54 è SQ b 7,54 e ha gdl N coè 84 6 78 III La devaza dovuta alla dffereza tra coeffcet agolar SQ b può essere otteuta (D) due mod dfferet: a) per sottrazoe da quella d errore totale delle due dovuta alla regressoe comue e alle sgole rette d regressoe SQ e(tot ) - SQ b - SQ b SQ b ( D ) co gdl ugual a 44,90 4,86 7,54,50 (N ) (N ) - 8 78 coè 3 b) da sgol valor delle codevaze de coeffcet agolar e quello comue 77,64 9 06, +.8 89,7 + 6.97 373,57 9.38 6,6 + 4,95 + 5,8 4,87,50 5) Allo scopo d avere ua vsoe geerale e per meglo compredere successv test F, è sempre utle costrure la tabella dell ANOVA 3

Fote d varazoe Devaze DF S F P Etro grupp 44,90 8 --- --- --- oeff. Ag. omue 4,86 4,86 4,09 < 0.00 Fra oeff. Ag.,50,5 3,54 > 0.05 Errore per oeffcete 7,54 78 0,353 --- --- S verfca - la sgfcatvtà del coeffcete agolare comue b medate l test F F 4,86 0,353,78 4,09 Poché l valore crtco co df e 70 (78 è rportato poche tabelle) alla probabltà α 0.00 blaterale è 3,3 s rfuta l potes ulla: esste ua tedeza comue altamete sgfcatva, ella relazoe tra età e capactà respratora. - la sgfcatvtà della dffereza tra coeffcet agolar b medate l test F F,5 0,353,78 3,54 Poché l valore crtco co df e 70 (78 è rportato poche tabelle) - alla probabltà α 0.0 blaterale è 3,3 - alla probabltà α 0.05 blaterale è 3,89 o s può rfutare l potes ulla, ache se la probabltà abbastaza vca al 5%. S può affermare, apputo perché è collocato tra l 55% e l 0%, che - o è dmostrata ma potrebbe esstere ua tedezale dffereza tra coeffcet agolar a cofroto. E sempre mportate osservare attetamete l grafco: la o sgfcatvtà della retta potrebbe suggerre che essta ua relazoe d tpo curvleo. Se questo metodo fosse stato applcato al caso precedete d due sol campo, s sarebbe otteuto u valore d F uguale a t. 4

Il cofroto tra tre coeffcet agolar è avveuto seza calcolarl e seza stmare é rappresetare grafcamete le tre rette. I vare stuazo, può essere utle pervere ache alla stma delle rette. Per questo dalla dstrbuzoe de dat e dalle stme precedet s rcavao Stme prelmar da dat ampoe ampoe ampoe 3 Totale Y 3,95 4,47 4,46 4,39 49,75 37,79 39,80 40,55 b - 0,085-0,0465-0,0306-0,0398 8 44 84 e co la formula geerale s stmao prma a Y b ampoe ALOLI a 3,95 (-0,085) 49,75 8,8 4,47 (-0,0465) 37,79 6,3 3 4,46 (-0,0306) 39,80 5,68 omue 4,39- (-0,0398) 40,55 6,00 e fe le rette ampoe 3 omue Y Retta 8,8 + ( 0,085) ˆ Y 6,3 + ( 0,0465) ˆ Y 5,68 + ( 0,0306) ˆ3 Y 6,00 + ( 0,0398) ˆ 5

U ulterore aspetto mportate per meglo compredere e terpretare rsultat è l calcolo dell tervallo d cofdeza de coeffcet agolar stmat. A questo scopo s utlzza - la varaza d errore 0,353 co suo 78 gdl - l valore d t che, scelto dalla tabella co gdl 78 e per α 0.05 blaterale, è uguale a,99 - la devaza della del gruppo oggetto otteedo per og gruppo e comue ampoe Lmt d cofdeza d b per α 0.05 L b L 3 omue 0,085 ±,99 0,353 9-0,4-0,085-0,0460 0,0465 ±,99 0,353.8-0,73-0,0465-0,07 0,0306 ±,99 0,353 6.97-0,0456-0,0306-0,056 0,0398 ±,99 0,353 9.39-0,0437-0,0398-0,0359 l lmte ferore L e quello superore L de rspettv coeffcete agolare b. Ua lettura atteta degl tervall d cofdeza mostra che l coeffcete agolare del campoe 3 è fuor dell tervallo d cofdeza d quello del campoe. Ma trattados d cofrot tra valor, o è corretto dedure ua dffereza sgfcatva, peraltro o dmostrata co l aals della varaza. Per valutare tra qual coeffcet agolar la dffereza campoara sa sgfcatva, è ecessaro - prma rfutare l potes ulla co l test F tra tutt campo, - successvamete rcorre a cofrot multpl, llustrat el paragrafo successvo. La lettura delle età mede ( 49,75; 37,79; 3 39,80) evdeza u forte effetto della dversa età meda e tre grupp sulla capactà respratora. Per cofrotare le mede delle Y 6

elmado l effetto delle età, s deve rcorrere all aals della covaraza, rporta ella parte fale del captolo dedcato alla regressoe. E la parte coclusva de test parametrc: abba l aals della regressoe a quella dell ANOVA. ome mostrato el caso d due campo, ache quello co campo l aals statstca può essere estesa a altre caratterstche della retta. E possble cofrotare - oltre a coeffcet agolar, - le tercette o poszo (elevatos), - l valore medo atteso su rette dverse, per la stesso valore della, - e valutare se soo complessvamete ugual (test for cocdetal regressos) oppure o. Per quest approfodmet s rva a altr test, tra qual - Zar Jerrold H., 999, Bostatstcal Aalyss, (fourth ed., Pretce Hall, Eglewood lffs, New Jersey, USA, pp.663 + 03app) 7.4. ONFRONTI MULTIPLI TRA PIU OEFFIIENTI ANGOLARI Rfutata l potes ulla H 0 : β β β p s tratta d verfcare tra qual coppe de p coeffcet agolar b la dffereza sa sgfcatva. La rsposta può vere da cofrot multpl a posteror, co metod del tutto aalogh a quell descrtt per l cofroto tra p mede, qual: - l metodo d Tuey, per cofrot semplc; - l metodo d Scheffé, per cofrot compless; - l metodo d Duett, per l cofroto d u cotrollo co p trattamet. Tra p coeffcet agolar (b, b,, b p ) è possble verfcare la sgfcatvtà della dffereza tra due qualsas b e b co potes ulla e potes alteratva blaterale H 0 : β β H : β β co l metodo d Tuey q α, ν, p b b s dove - q è l valore crtco rportato ella tabella del q studetzzato o ua sua evoluzoe, che cosdera ache pass d dstaza tra ragh de valor a cofroto, bb 7

- α è la probabltà prefssata per la sgfcatvtà, - ν soo gdl d sb b - p è l umero d grupp a cofroto. Il valore d sb b è sb b p s e [ ( ) + ( ) ] co gdl corrspodet a quell della varaza d errore, ell aals della varaza tra p coeffcet agolar a cofroto. Nel test d Scheffé e el test d Duett, vara solo la stma della probabltà α d og cofroto. 7.5. ANALISI DELLA RELAZIONE DOSE-EFFETTO ON Y RIPETUTE: ALOLO DELLA RETTA DI REGRESSIONE E TEST PER LA LINEARITA'. Nella rcerca d laboratoro e ella verfca d u prodotto farmacologco, spesso s rchede d saggare la rsposta bologca a dos varabl d u prcpo attvo, sa esso u farmaco o u tossco. S mpostao espermet e qual vegoo sommstrate quattà progressvamete crescet, per verfcare come vara la rsposta meda grupp d cave o pazet. I altr cas, s aalzza come - gl effett d ua dose varao el tempo o come ua sostaza attva s degrada. o valor d Y rpetut per la stessa dose, l aals della regressoe prevede che, per attuare la scelta pù adeguata fra var tp d curve, s rspoda a 4 domade: Il farmaco ha u azoe che vara co la dose? La rsposta è proporzoale alla dose? I term pù tecc, esste regressoe della rsposta sulla dose? 3 La regressoe è d tpo leare oppure può essere meglo espressa da ua curva d grado superore? 4 Se o è leare, quale è l tpo d curva pù adeguato? Queste quattro domade rchedoo l applcazoe d quattro test. 8

A - Il prmo è u'aals della varaza ad crtero d classfcazoe. Affché l aals della regressoe sa gustfcata, deve esstere varabltà elle rsposte mede: l test sulla dffereza tra le mede deve rsultare sgfcatvo. B - Il secodo è l test per la leartà, che ha lo scopo d valutare se ua retta d regressoe s avvca a put med delle rsposte ( Y ), forte per la stessa dose ( ), modo sgfcatvo rspetto alla meda geerale (Y ) delle Y. Ache questo caso, sempre per gustfcare l calcolo della retta, l test deve rsultare sgfcatvo. - Il terzo è l test per la o-leartà, allo scopo d verfcare se curve d grado superore passo pù vco a put med delle rsposte ( Y ) per la stessa dose ( ) modo sgfcatvo rspetto alla retta. S parla d verfca de term o lear o degl scart dalla regressoe. Per poter cocludere che la retta è la stma mglore della relazoe dose - rsposta, questo test deve rsultare o-sgfcatvo. D - Se vece rsulta sgfcatvo, medate l uso de coeffcet polomal per l aals delle regresso, co u quarto test s deve valutare quale sa l tpo d curva pù adeguata, ache se quas sempre s scegle quella d secodo grado. A causa della semplctà d terpretazoe e al fatto che solo esse soo geeralmete valde quas tutte le stuazo spermetal, le prefereze de rcercator vao alla retta e alla curva d secodo orde. Quelle pù complesse, d orde superore, soo regresso troppo specfche, soo troppo legate a dat campoar per esprme ua legge uversalmete valda. I questo paragrafo, soo presetat cocett e metod che rspodoo alle prme tre domade. Per la quarta, su come valutare quale sa la curva pù adeguata, è possble utlzzare coeffcet polomal, che rappresetao l metodo pù semplce e rapdo. I cocett e metod soo espost el paragrafo successvo. Nella mpostazoe d u espermeto cu s rcheda l aals della regressoe co Y rpetute, l prmo problema è quat grupp formare. Se, oltre al calcolo della retta d regressoe leare semplce, s tede effettuare ache le aals successve su term o lear, è vataggoso che grupp sao almeo 4. Spesso come massmo soo 6, quato le formazo aggutve soo rdotte e o gustfcao temp e cost dell espermeto. 9

Per la scelta del umero d grupp, è ecessaro decdere atcpatamete quale sa l tpo d curva desderato e l lvello della verfca. Ifatt - tra due sol put passa ua retta, rappresetata da u equazoe d prmo grado: Y a + b - fra tre put s può fare passare ua lea, rappresetata da u equazoe d secodo grado: Y a + b + c - tra quattro put s può fare passare ua lea, rappresetata da u equazoe d terzo grado: Y a + b + c + d 3 - e così d seguto, fo a 5-6 put med programmat. Nell aals della regressoe leare semplce, l operazoe rchesta cosste ell solare l terme leare. Tra le applcazo della regressoe, lo studo delle rsposte a dos progressve d ua sostaza attva è la pù frequete e forse la pù mportate. Otteere, come desderato, ua retta o sempre è facle. La lea che esprme la relazoe tra gl effett med ( Y ) d dos crescet d ua sostaza attva ( ) raramete è perfettamete leare, ache su tervallo breve, se la scelta de dosagg o è predsposta modo accurato e cetrata. Spesso se e dscosta modo rlevate, poché - dos molto pccole producoo effett ull o dffclmete rlevabl, quato collocat sotto l lvello d sogla; - solo dos mede producoo effett crescet; - dos elevate forscoo spesso la rsposta massma, avedo ragguto la saturazoe. Per otteere la leartà, è vataggoso che - le dos sommstrate seguao ua progressoe pertete al problema duscplare che s affrota. Essa può essere scelta etro ua varetà ampa. Nel paragrafo successvo, dedcato all uso de coeffcet polomal, sarà rchesto ecessaramete. Ad esempo, può essere d tpo - leare, 4, 6, 8, 0 (, +.. ); 3, 6, 9,, 5 (3, +3 ); - espoezale o logartmca, 4, 8, 6, 3 (,, 3, 4, 5 ) - o acora, 4, 9, 6, 5 (,, 3, 4, 5 ), - ma ache,4;,00;,45;,83; 3,6 (, 4, 6, 8, 0 ) 30

oppure qualsas altra progressoe. Tra queste, per otteere u arco suffcetemete ampo d rsposte co poche dos, spesso è preferto l logartmo della dose (, 4, 8, 6, 3). Ifatt è dmostrato che, ella maggor parte delle attvtà bologche, l effetto aumeta co progressoe artmetca, qud leare, quado la sostaza attva è sommstrata proporzoe geometrca. Ma o sempre questa legge è vera; o per tutt prcp attv, o per tutt dosagg sommstrat, é per tutt feome bologc. Da qu l mportaza d testare sempre la leartà della regressoe dell effetto sulla dose o su ua trasformazoe qualsas della dose. I molte dscple, - l calcolo e l aals della regressoe o clude ecessaramete l cocetto d ua relazoe d causaltà tra la e la Y, é che essa sa ella drezoe segalata mplctamete dalla dcazoe d varable (la causa) e varable Y (l effetto). Spesso, s vuole semplcemete - utlzzare la capactà predttva della regressoe per stmare Y cooscedo, allo scopo d otteere la descrzoe d ua relazoe emprca u campoe; successvamete s effettua l test, come cotrollo della sua essteza ache ella popolazoe. Nel caso cu s abbao pù osservazo Y per lo stesso valore d dalla retta Y $ (qud Y Yˆ ) può essere separata due part: - lo scostameto dell'osservazoe Y dalla meda del suo gruppo Y (qud, lo scarto d og puto Y Y Y ), - lo scostameto della meda Y del gruppo dal valore stmato sulla retta Y $ per la stessa (qud Y ˆ ). Y Tra ess esste la relazoe ( ) ( ) Y Y$ Y Y + Y Y$ Da questa relazoe derva che la devaza resdua o d errore della retta d regressoe, che el caso d sgole Y per og el caso d Y rpetute è scompoble è ( ) Y Yˆ, - ua prma devaza, dovuta alla dspersoe de sgol valor toro alla meda del loro gruppo, coè ( Y Y ) e che rappreseta l errore 3

- e ua secoda devaza, dovuta alla dspersoe delle mede dalla retta d regressoe e che rappreseta term o lear, $. coè ( Y Y ) o Y rpetute per lo stesso, tra queste devaze esste la relazoe ( Y Y ) ( Y Y ) + ( Y Y ) $ $ Quado l'aals della varaza porta alla coclusoe che esste ua dffereza altamete sgfcatva tra le mede Y de grupp, sussste la codzoe logca per verfcare, medate ua ulterore specfca aals della varaza, se sa d tpo leare. Per quest test sulla leartà, s rchedoo le seguet stme: - la devaza tra grupp (df -) otteuta co l'aals della varaza; - la devaza dovuta alla regressoe (df ), chamata ache della regressoe leare, medate ( od. Y) Dev. 3 - la devaza delle mede dalla regressoe (df -), chamata ache della regressoe oleare, è rcavable dalla relazoe Devaza delle mede dalla regressoe Devaza tra grupp - Devaza della regressoe; 4 - la devaza resdua etro grupp o errore (df -) rcavable da Devaza d errore o resduo Devaza totale - Devaza tra grupp rcordado che, co la cosueta smbologa, - umero d grupp - umero d replche del gruppo ; - umero totale d osservazo Le devaze soo calcolate pù faclmete e rapdamete co le formule abbrevate. Ua presetazoe stetca e chara d quest metod è forta dalla tabella 3

DEVIANZA FORMULA ABBREVIATA DF Totale Y Y - Tra grupp Y Y - Della regressoe Y Y Delle mede dalla regressoe Tra grupp Della regressoe - Resduo (etro grupp) Totale - Tra grupp - Dopo l calcolo delle varaze relatve, co le ultme tre (della regressoe, delle mede dalla regressoe e resduo etro grupp) s effettuao test F. Il prmo F co df e - F, - Varaza della regressoe Varaza resdua o etro grupp per verfcare l'potes ulla β0 ovvero se la regressoe leare sa sgfcatva (rspetto alla meda). Il secodo F co df - e - F -, - Varaza delle mede dalla regressoe Varaza resdua etro grupp 33

per verfcare l'potes se esstao curve d orde superore che sao grado d rappresetare modo sgfcatvamete mglore della retta la relazoe esstete tra dose e rsposte mede. Per gl tervall d cofdeza della retta, coè per l calcolo - dell tervallo d cofdeza del coeffcete agolare β β e b ± t( α /, ) S ( ) - dell tervallo d cofdeza della tercetta α α a ± t ( α /, ) + Se ( ) - dell tervallo d cofdeza d u valore medo d Yˆ per la specfca dose Yˆ l ± t ( α /, ) S + ( ) ( ) e - dell tervallo d cofdeza d u sgolo valore d Yˆ Yˆ ± t ( α /, ) S + + ( ) ( ) e s utlzza la varaza d errore o resduo Nell esempo successvo S e e la devaza delle ( ) S e 0,3783 e la devaza delle è ( )..000. ESEMPIO E dmostrato che l'quameto da cromo dos subletal agsce modo egatvo sull'accrescmeto somatco d molte spece acquatche. 34

o u espermeto d laboratoro, s vuole stablre la relazoe che tercorre tra la cocetrazoe della sostaza e la rsposta bologca alcu grupp d crostace della stessa spece, de qual vegoo forte le dmeso dopo ua settmaa dalla schusa delle uova. Le dos soo crescet modo leare: 5, 0, 5, 0, 5. Le replche (da I a IV) cosderao 4 cas per gruppo Dose () Replche 5 0 5 0 5 I II III IV 0,5,3,,4 8,4 8,6 9, 9, 7,7 6,9 5,8 7, 5,3 4,3 4,8 5,0 4,6 5,6 3,9 4,8 Verfcare se l effetto rsete della sommstrazoe d dos dverse; caso postvo, stmare se la retta è adeguata a descrvere la relazoe dose-effetto. Rsposta. Per rspodere a quest propost, la prma verfca è l'aals della varaza ad u crtero d classfcazoe. Dopo aver calcolato le somme delle Y per og gruppo e la somma totale de quadrat delle Y (le mede servoo per l grafco) Dose () 5 0 5 0 5 TOTALI Y 45,3 35,3 7,6 9,4 8,9 46,5 Y,35 8,85 6,900 4,850 4,75 7,35 ( Y ) 54,3 3,97 9,38 94,6 90,77 04,05 s rcavao - la devaza totale co df 9 35

SQ Tot 04,05 ( 46,5) 0 30,94 - la devaza tra grupp co df 4 SQ Tra ( 45,3) ( 35,3) ( 7,6) ( 9,4) ( 8,9) ( 46,5) 4 + 4 + 4 + 4 + 4 0 5,65 - la devaza etro grupp o errore co df 5 SQ Errore 30,940 5, 65 I rsultat soo rportat el solto schema dell aals della varaza DEVIANZA DF VARIANZA F P Totale 30,940 9 --- --- --- Tra grupp 5,65 4 3,36 8,7 <0.00 Errore 5,675 5 0,3783 --- --- Per valutare se esste u effetto dfferete alle vare dos, s calcola u test F che rsulta uguale a 8,78 co df 4 e 5. F 3,35 0,3783 4,5 8,78 Se l test F o rsultasse sgfcatvo e pertato o permettesse d rfutare l'potes ulla, s deve gugere alla coclusoe logca che, al varare della dose, le rsposte mede de grupp a cofroto o mafestao dffereze sgfcatve. D cosegueza, la meda geerale rappreseta la stma leare mglore dell'effetto medo delle vare dos ed è utle procedere al calcolo della retta d regressoe. I questo caso, poché l valore tabulato d F (4,5) per α 0.0 è uguale a 4,89 s deve cocludere che le rsposte dfferscoo modo sgfcatvo al varare della dose. I modo pù precso, la probabltà è ferore a 0.00. 36

Le due domade successve soo: - La retta rappreseta ua stma accettable dell effetto bologco al crescere della dose? - Oppure è pù adeguata ua curva d grado superore? Alla prma s rspode medate l test per la leartà, per l quale è ecessaro calcolare la devaza dovuta alla regressoe leare SQ dovuta alla regressoe leare Y Y o dat dell esempo Y (5 x 45,3) +(0 x 35,3)+ (5 x 7,6)+ (0 x 9,4)+ (5 x 8,9).854 4(5 + 0 + 5 + 0 + 5) 300 4(5 + 0 + 5 + 0 + 5 ) 5500 Y 46,5 s ottee SQ dovuta alla regressoe leare 46,5 300 854 0 ( 343,5) 300 000 5500 0 7,99 Rportado questo rsultato ella tabella precedete, s ottee ua uova tabella che evdeza: 37

Fote d varazoe DEVIANZA DF S F Totale 30,940 9 --- --- Tra grupp 5,65 4 3,36 --- Dovuta alla regressoe leare 7,99 7,99 3,90 Dovuta alla regressoe o-leare 5,65-7,99 7,73 3,44 6,4 Resduo o etro grupp 30,940-5,65 5,675 5 0,3783 --- - la scomposzoe della devaza tra grupp (5,65) co df 4 - devaza dovuta alla regressoe leare (7,99) co df - e, per dffereza, devaza dovuta alla regressoe o-leare (7,73) co df 3 Per valutare se la retta d regressoe rappreseta u mglorameto sgfcatvo rspetto alla meda geerale delle Y, s effettua u test F F 7,99 0,3783,5 3,90 o dat dell esempo, s ottee F 3,9 co df e 5. Esso dmostra che la regressoe leare semplce è altamete sgfcatva: la retta passa molto pù vco alle mede de 5 grupp d quato facca la meda geerale. D cosegueza, è molto vataggoso calcolare la retta, per evdezare la relazoe tra dose e rsposta meda. Per valutare se ua curva d grado superore rappreseta ua stma statstcamete mglore s effettua u secodo test F F,44 0,3783 3,5 6,4 o dat dell esempo, s ottee F 6,4 co df 3 e 5 che rsulta sgfcatvo. E statstcamete dmostrato che ua curva d grado superore s avvca alle mede delle 5 dos modo sgfcatvamete mglore della retta. 38

Rassumedo cocett llustrat el paragrafo, all zo è stato evdezato che co Y rpetute l aals della varaza permette d rspodere a 4 domade Il farmaco ha u azoe che vara co la dose? La rsposta è proporzoale alla dose? I term pù tecc, esste regressoe della rsposta sulla dose? 3 La regressoe è d tpo leare oppure può essere meglo espressa da ua curva d grado superore? 4 Se d grado superore quale è l tpo d curva pù adeguato? o le aals fo a ora codotte s è rsposto alle prme tre, arrvado alle cocluso seguet: - Le rsposte bologche alle vare dos soo sgfcatvamete dfferet. Le rsposte soo proporzoal alle dos e ua retta descrve modo sgfcatvamete pù accurato della meda la relazoe tra dose e rsposta. 3 Ma ua curva d grado superore la descrve modo sgfcatvamete mglore della retta. 4 0 8 6 4 0 5 0 5 0 5 30 39

La rappresetazoe grafca delle sgole rsposte alle vare dos e delle loro mede evdeza vsvamete come la retta pass effettvamete molto pù vco a put med, d quato facca la meda geerale delle Y. (I cerch vuot rappresetao le sgole osservazo. Soo quattro per gruppo, ma appaoo umero more poché alcu cas rsultao sovrappost. I cerch er soo le mede de sgol grupp) I valor med o soo collocat esattamete sulla retta. Questa o esatta leartà lasca oltre ture come - ua curva d grado superore possa effettvamete passare pù vco a ess d quato facca la retta. Ma per rspodere modo dettaglato alla quarta domada (Se è d grado superore, quale è l tpo d curva pù adeguato?) - è ecessaro valutare l cotrbuto che ogua delle 3 curve d orde superore forsce alla devaza dovuta a term o lear: Questa rsposta rchede calcol lugh e compless, molto pù d quato sa stato fatto per la regressoe leare. Nel paragrafo successvo, soo presetat coeffcet polomal, che soo l metodo pù semplce e rapdo - sa per calcolare la devaza dovuta alla regressoe leare, foredo lo stesso rsultato gà otteuto, - sa per calcolare la devaza dovuta a og curva d grado superore. 7.6. ALOLO DEI TERMINI DELLA REGRESSIONE, MEDIANTE I OEFFIIENTI POLINOMIALI I coeffcet polomal facltao la scomposzoe ortogoale de trattamet, - per cofrot tra le mede. I cocett e metod soo gà stat llustrat ella scomposzoe della devaza tra grupp per cofrot multpl a pror. Nel caso della regressoe, - grad d lbertà della devaza tra grupp soo scompost altrettat term, passado progressvamete dalla retta a curve d orde superore. 40

OEFFIIENTI POLINOMIALI PER IL ALOLO DELLA REGRESSIONE OEFFIIENTI Grupp 3 A B Grado - 0 + Grado + - + Grupp 4 A B D Grado -3 - + +3 Grado + - - + Grado 3 - +3-3 + Grupp 5 A B D E Grado - - 0 + + Grado + - - - + Grado 3 - + 0 - + Grado 4 + -4 +6-4 + Grupp 6 A B D E F Grado -5-3 - + +3 +5 Grado +5 - -4-4 - +5 Grado 3-5 +7 +4-4 -7 +5 Grado 4 + -3 + + -3 + Grupp 7 A B D E F G Grado -3 - - 0 + + +3 Grado +5 0-3 -4-3 0 +5 Grado 3 - + + 0 - - + Grado 4 +3-7 + +6 + -7 +3 Grupp 8 A B D E F G H Grado -7-5 -3 - + +3 +5 +7 Grado +7 + -3-5 -5-3 + +7 Grado 3-7 +5 +7 +3-3 -7-5 +7 Grado 4 +7-3 -3 +9 +9-3 -3 +7 4

Nella paga precedete soo rportat coeffcet polomal dal caso d 3 grupp fo a 8 grupp, per le prme 4 regresso (leare, quadratca, cubca e d quarto orde). Gà oltre quella d secodo orde l uso è raro e o sempre gustfcato, ella rcerca della curva pù adeguata. I prcp baslar del metodo de coeffcet polomal, soprattutto d come soo stat otteut, rchedoo ua llustrazoe luga e complessa. Ma all utete della statstca serve soprattutto capre l loro uso, che è semplce. Ess godoo delle due propretà gà ctate: - la somma de coeffcet della stessa rga è uguale a 0; - due rghe qualsas forscoo rsultat tra loro ortogoal, poché la somma de prodott de coeffcet è uguale a 0. Ad esempo, co 5 grupp per qual coeffcet soo A B D E Grado - - 0 + + Grado + - - - + Grado 3 - + 0 - + Grado 4 + -4 +6-4 + è semplce osservare che la retta o curva d grado è ortogoale a quella d grado, poché (- x +) + (- x ) + (0 x ) + (+ x ) + (+ x +) (-4) + (+) + (0) + (-) + (+4) 0 Lo stesso rsultato è otteuto tra due sere d coeffcet qualsas. Per l aals delle regresso, o sempre è possble l uso de coeffcet polomal. Ifatt devoo essere soddsfatte due codzo: - l umero d replche deve essere detco tutt grupp, valor della devoo avere ua progressoe regolare (come quelle gà llustrate el paragrafo precedete). Medate total delle Y d og gruppo ( T ) e coeffcet - la devaza d og terme: d og regressoe, s calcola 4

SQ r T dove r è l umero d dat o replche d og gruppo e è l umero d grupp. ESEMPIO. Rprededo lo stesso esempo del paragrafo precedete Dose () Replche 5 0 5 0 5 I II III IV 0,5,3,,4 8,4 8,6 9, 9, 7,7 6,9 5,8 7, 5,3 4,3 4,8 5,0 4,6 5,6 3,9 4,8 calcolare le devaze dovute alla regressoe leare e alle curve d orde superore. Rsposta. Poché grupp soo 5, è possble calcolare 4 devaze, dal terme leare a quello d quarto grado. Dopo aver calcolato total ( T ) e cosderado che le replche per gruppo soo r 4 Dose () 5 0 5 0 5 TOTALI T 45,3 35,3 7,6 9,4 8,9 46,5 co coeffcet polomal Grupp 5 A B D E Grado - - 0 + + Grado + - - - + Grado 3 - + 0 - + Grado 4 + -4 +6-4 + 43

- per l terme leare s ottee T ( 45,3) + ( 35,3) + ( 0 7,6) + ( + 9,4) + ( + 8,9) 68, 7 r 4 [( ) + ( ) + ( 0) + ( + ) + ( + ) ] 4 ( 0) 40 SQ ( 68,7) 40 7,99 - per l terme quadratco s ottee T ( + 45,3) + ( 35,3) + ( 7,6) + ( 9,4) + ( + 8,9) + 8, 5 r 4 [( + ) + ( ) + ( ) + ( ) + ( + ) ] 4 ( 4) 56 (,5) 8 SQ 6, 56 - per l terme cubco s ottee T ( 45,3) + ( + 35,3) + ( 0 7,6) + ( 9,4) + ( + 8,9) + 5, 4 r 4 [( ) + ( + ) + ( 0) + ( ) + ( + ) ] 4 ( 0) 40 SQ ( 5,4) 40 0,79 - per l terme alla quarta s ottee T ( + 45,3) + ( 4 35,3) + ( + 6 7,6) + ( 4 9,4) + ( + 8,9) +, 0 r 4 [( + ) + ( 4) + ( + 6) + ( 4) + ( + ) ] 4 ( 70) 80 (,0) SQ 0,43 80 E semplce osservare che - la devaza dovuta al terme leare o d I grado (7,99) è detca a quella calcolata co la formula classca, molto pù luga; 44

- la somma delle 4 devaze cocde esattamete co quella tra grupp: 7,99 + 6, + 0,79 + 0,43 5,65 Sulla base d quest rsultat, s può rscrvere la tabella delle devaze, co la scomposzoe completa della devaza tra grupp: Fote d varazoe DEVIANZA DF S F Totale 30,940 9 --- --- Tra grupp 5,65 4 --- --- Dovuta al terme leare 7,99 7,99 3,9 Dovuta al terme quadratco 6, 6, 6, Dovuta al terme cubco 0,79 0,79,93 Dovuta al terme alla quarta 0,43 0,43,4 Resduo o etro grupp 30,940-5,65 5,675 5 0,3783 --- Nel test F che valuta la sgfcatvtà - per la devaza dovuta al terme leare rspetto alla meda s ottee ua rsposta altamete sgfcatva; F 7,99 0,3783 (,5) 3,9 - per la devaza dovuta al terme quadratco rspetto a quello leare s ottee ua rsposta sgfcatva; F 6, 0,3783 (,5) 6, - per la devaza dovuta al terme cubco rspetto a quello quadratco s ottee ua rsposta o sgfcatva; F 0,79 0,3783 (,5),93 - per la devaza dovuta al terme alla quarta rspetto a quello alla terza 45

F 0,43 0,3783 (,5),4 s ottee ua rsposta o sgfcatva. o quest rsultat, per la regressoe (coè per predre Y sulla base d ) è corretto calcolare ua curva d secodo grado. Tuttava può essere accettata ache ua coclusoe dfferete, quale la scelta della retta, se motvata etro la dscpla sulla base d altre rcerche o d ua dfferete terpretazoe del feomeo bologco. La retta è pù semplce da terpretare; questo caso, passa molto vco put, ache se la curva forsce u mglorameto statstcamete sgfcatvo. La procedura presetata è llustrata el testo d L. Lso, dal ttolo Statstca Applcata alla Bologa Spermetale (asa Edtrce Ambrosaa, 99, Mlao), ella parte scrtta da G. A. Maccacaro. Ad essa s rmada per approfodmet. Il metodo, dscusso egl a 50, o ha rscosso l successo atteso. I quel perodo e egl a successv, era dffusa la covzoe che l aals de term della regressoe per dvduare la curva pù adatta fosse u problema d estrema mportaza e che ella pratca spermetale dovesse essere sempre applcata. Uo degl artcol pù mportat sul metodo de coeffcet polomal è del 953, dovuto a Wshart e Metades, dal ttolo Orthogoal Polyomal Fttg (pubblcato su Bometra, Vol. 40, pp. 36 369). La codzoe d uguaglaza degl tervall e sull uso corretto de coeffcet polomal è dscusso ache ell artcolo Orthogoal oeffcet for Uequal Itervals pubblcato sulla rvsta Bometrcs dell ao 958, (Vol. 4, -4, pp. 87 89), della quale era edtore George Waddel Sedecor, statstco matematco amercao, ato ell ao 88 e morto 974. I suo cotrbut pù mportat soo relatv al dsego spermetale, al campoameto e all aals della varaza, per la quale ha modfcato la proposta d Fsher ella forma attuale. Nel 937 ha pubblcato la prma versoe del volume Statstcal Methods, uo de test terazoal pù dffus, fo alla settma edzoe del 980. I modo polemco, o credble per la sua alta competeza statstca, afferma d o cooscere l metodo de coeffcet ortogoal per tervall egual e d spegarglelo: I a expermet performed here, I used four levels of a utret: 0, 5, 0, 0 mg. I caot fd a method for calculatg the three sets of orthogoal coeffcets for these uequal tervals. If t ca be doe, please advse me. Nella rsposta, A. Gradage rmada all artcolo d Wshart e Metades, valdo o solo per tervall egual ma ache per pes dfferet a var lvell. Gradage afferma che l metodo è semplce quado l umero d lvell è pccolo, come 4 lvell utlzzat da Sedecor, oppure quado 46

soo rcheste regresso fo al terzo grado; ma gà regresso d terzo grado soo ecessare raramete: I pratce, the coeffcets for the thrd degree regresso are rarely eeded. Su come costrure coeffcet ortogoal geerale e el caso d tervall egual e su come stmare coeffcet per la regressoe leare, quella quadratca e quella cubca, s rva pubblcazo specfche. I programm formatc hao reso obsolete queste tecche maual; hao mposto u approcco fodato pù su cocett e meo sulle modaltà d calcolo. 7.7. TEST DI LINEARITA ON Y RIPETUTE, IN AMPIONI NON BILANIATI No sempre campo soo blacat. I var espermet d laboratoro e farmacologa, può sempre succedere che almeo ua cava o u pazete o permettao d msurare l effetto della dose sommstrata. Le cause possoo essere umerose, dal decesso alla macata rsposta bologca, per motv fsologc o geetc. L aals dveta meo semplce e o permette d calcolare tutt term della regressoe, che o è pù cetrata sulla dose e sulla rsposta mede. Nell dustra farmaceutca, la regressoe leare semplce co Y rpetute è spesso utlzzata per la covalda d metod aaltc, att alla determazoe quattatva d prcp attv e de possbl degradat forme farmaceutche. Uo degl passagg mportat della covalda cosste el verfcare la leartà della rsposta al varare della cocetrazoe. Per tal test, s preparao cocetrazo scalar (almeo 5) della sostaza da quatfcare, replcado u certo umero d volte (da tre a se) la determazoe per og cocetrazoe. Nell esempo successvo è llustrata modo dettaglato questa metodologa, applcata al caso pù geerale d campo o blacat. ESEMPIO. S assuma che per 5 cocetrazo crescet () sao state effettuate msure sul tempo d effcaca (Y) d u farmaco. Per og dose soo state prese 5 cave, ma per alcue o è stato possble otteere la rsposta bologca. ocetrazo Rsposte 30 06, 08, 0 40 8, 0, 5, 9 50 37, 34, 3 60 44, 47, 5, 48, 46 70 59, 6, 56, 64, 58 47