APPUNTI DI STATISTICA DESCRITTIVA 2 Con applicazioni nell ambiente statistico R Versione preliminare agosto 2006

Documenti analoghi
LA MODA: Unità: è il valore della variabile X osservato il maggior numero di volte;

Caso studio 4. La media geometrica. Esempio

Introduzione. La regressione logistica

Dott.ssa Marta Di Nicola

Trasformatore. Parte 2 Trasformatori trifase (versione del ) Trasformatore trifase (1)

MEDIA DI Y (ALTEZZA):

Università di Cassino. Esercitazioni di Statistica 1 del 26 Febbraio Dott. Mirko Bevilacqua

I metodi di costruzione degli indici sintetici

Università di Camerino Corso di Laurea Fisica Indirizzo Tecnologie per l Innovazione Appunti di Calcolo Prof. Angelo Angeletti

Lezione 4. La Variabilità. Lezione 4 1

Indipendenza in distribuzione

CAP. 6 INFERENZA STATISTICA BAYESIANA

LIUC ebook. Analisi Matematica. Anna Maria Mascolo Vitale

Esercizio 1. Costruire un esempio di variabili casuali X ed Y tali che Cov(x,y) = 0, ma X ed Y siano dipendenti.

La distribuzione Normale

CORSO DI STATISTICA I (Prof.ssa S. Terzi)

La classe che mostra la distribuzione più elevata è quella 60-90, che corrisponde a un uso elevato dell automobile. f i fr (= f i/n) fr% (=fr*100)

Due distribuzioni, stessa media ma in quale delle due la media rappresenta, sintetizza meglio la situazione?

Principi ed applicazioni del metodo degli elementi finiti. Formulazione base con approccio agli spostamenti

S O L U Z I O N I + 100

b) Relativamente alla variabile PREZZO, fornire una misura della variabilità della distribuzione attraverso

Caso studio 10. Dipendenza in media. Esempio

EffePi Srl. Valore immobiliare: gestire ed amministrare per creare il valore degli immobili. EffePi S.r.l. Valore Immobiliare. EffePi S.r.l.

Esercitazioni di Elettrotecnica: circuiti in regime stazionario

LA REGRESSIONE LINEARE SEMPLICE

Stim e puntuali. Vocabolario. Cambiando campione casuale, cambia l istogramma e cambiano gli indici

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 9: Covarianza e correlazione

Limiti di successioni - svolgimenti

frazione 1 n dell ammontare complessivo del carattere A x

Esercizi su Rappresentazioni di Dati e Statistica

Indici di Posizione. Gli indici si posizione sono misure sintetiche ( valori caratteristici ) che descrivono la tendenza centrale di un fenomeno

Capitolo 11 Regressione con variabile dipendente binaria

Matematica elementare art.1 di Raimondo Valeri

ESAME DI STATO DI LICEO SCIENTIFICO

Dimostrazione della Formula per la determinazione del numero di divisori-test di primalità, di Giorgio Lamberti

Funzioni di più variabili Massimi e Minimi una funzione definita in un insieme E. Un punto ( x0, y0)

3 - Trasformata di Fourier discreta Discrete Fourier Transform ( DFT)

Limite Inferiore per l Ordinamento. Algoritmi e Strutture Dati (Mod. A) Limite Inferiore per l Ordinamento. Limite Inferiore per l Ordinamento

Elementi di Statistica descrittiva Parte III

ESERCIZI SU DISTRIBUZIONI CAMPIONARIE

Variabili casuali ( ) 1 2 n

INDICI DI VARIABILITA

III Esercitazione: Sintesi delle distribuzioni semplici secondo un carattere qualitativo ordinale.

BASI TEORICHE DEL METODO DEGLI ELEMENTI FINITI (MEF)

FUNZIONI LOGICHE FORME CANONICHE SP E PS

Statistiche quantiche

Indici di asimmetria. Elementi di Statistica descrittiva Parte IV. Simmetria di una distribuzione di frequenze. Primo indice di asimmetria (1/3)

Il modello di regressione lineare semplice (1) Studio della dipendenza riepilogo

dei quali si conoscono solo la media x e la deviazione standard σ e dato un valore reale positivo K, possiamo affermare che:

Voti Diploma Classico Scientifico Tecn. E Comm Altro

I motori a COMBUSTIONE INTERNA ALTERNATIVI sono classificati in

1. Particelle con spin semi-intero: distribuzione di Fermi-Dirac

Sommario. Facoltà di Economia. Obiettivo. Quando studiarla? Lezione n 7. X: carattere quantitativo tra le unità statistiche. Quando studiarla?

Interpolazione. Definizione: per interpolazione si intende la ricerca di una funzione matematica che approssima l andamento di un insieme di punti.

3 Variabilità. variabilità. Senza deviazione dalla norma il progresso non è possibile. (Frank Zappa) Statistica - 9CFU

corrispondenza della generica i-esima modalità. Indicando con #(.) la cardinalità di un insieme, per esse si ha, rispettivamente:

Università degli Studi di Napoli Parthenope. Facoltà di Scienze Motorie a.a. 2011/2012. Statistica. Lezione IV

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER ATTRIBUTI

FACOLTA DI INGEGNERIA. Corso di Fisica Tecnica Ambientale ESERCIZI SVOLTI CONDUZIONE

Classi di reddito % famiglie Fino a Oltre Totale 100

DI IDROLOGIA TECNICA PARTE II

Statistica multivariata Donata Rodi 04/11/2016

A Z I O N A M E N T I E L E T T R I C I

Relazioni tra variabili: Correlazione e regressione lineare

Modello dinamico nello spazio dei giunti: relazione tra le coppie di attuazione ai giunti ed il moto della struttura

Analisi di dati vettoriali. Direzioni e orientazioni

Associazione tra due variabili quantitative

ALCUNI ELEMENTI DI TEORIA DELLA STIMA

1 Studio di funzioni, sviluppi di Taylor e serie

Sommario. Corso di Statistica Economia e Commercio. Distribuzioni (cont Distribuzioni di frequenza. Distribuzioni

ARGOMENTO: MISURA DELLA RESISTENZA ELETTRICA CON IL METODO VOLT-AMPEROMETRICO.

Appunti sulle disequazioni frazionarie

Il campione. Il campionamento. Il campionamento. Il campionamento. Il campionamento

Il diagramma di dispersione è

0.1. CIRCONFERENZA 1. La 0.1.1, espressa mediante la formula per la distanza tra due punti, diviene:

Scienze Geologiche. Corso di Probabilità e Statistica. Prove di esame con soluzioni

Esame di Statistica tema A Corso di Laurea in Economia Prof.ssa Giordano Appello del 15/07/2011

STATISTICA DESCRITTIVA - SCHEDA N. 4 VARIABILI QUANTITATIVE Trasformazioni lineari Indici di covarianza e correlazione

Topografia e Tecniche di Rilevamento

La distribuzione statistica doppia (o bivariata)

Test di autovalutazione

Calcolo delle Probabilità e Statistica. Prova scritta del III appello - 7/6/2006

Teoria dell integrazione secondo Riemann per funzioni. reali di una variabile reale.

Calore Specifico

SOMMARIO. I Motori in Corrente Continua

FOTODIODI. La fotorivelazione è basata sull effetto fotoelettrico.

Modelli equivalenti del BJT

Alessandro Ottola matr lezione del 11/3/2010 ora 10:30-13:30. Parete omogenea sottoposta a differenze termiche e diffusione

ESERCIZIO 4.1 Si consideri una popolazione consistente delle quattro misurazioni 0, 3, 12 e 20 descritta dalla seguente distribuzione di probabilità:

CORSO DI STATISTICA I (Prof.ssa S. Terzi) 1 STUDIO DELLE DISTRIBUZIONI SEMPLICI. Esercitazione n 3

Corso TFA - A048 Matematica applicata. Didattica della matematica applicata all economia e alla finanza

COMPLEMENTI DI STATISTICA. L. Greco, S. Naddeo

Le misure di variabilità

Verifica e scelta del modello probabilistico

Propagazione di errori

Numeri complessi Pag. 1 Adolfo Scimone 1998

Sommario. Facoltà di Economia francesco mola. Distribuzioni (cont.) Distribuzioni di frequenza. Distribuzioni Distribuzioni di quantità

Lezione 1. I numeri complessi

Consentono di descrivere la variabilità all interno della distribuzione di frequenza tramite un unico valore che ne sintetizza le caratteristiche

Tecniche per la ricerca delle primitive delle funzioni continue

Transcript:

APPUNTI DI TATITICA DECRITTIVA Co applcazo ll ambt statstco R Vrso prlmar agosto 006 Vttoro Colagrad TUDIO DELLE RELAZIONI TRA DUE CARATTERI TATITICI Nll aals d dat s è spsso trssat a studar s tra du carattr X Y, ch s prstao cogutamt sull utà statstch ch formao ua data popolazo, s possa stablr u qualch lgam, l caso, qual sa l grado d tal rlazo. possoo avr cas cu la cooscza d ua dll du varabl o dà alcua formazo sull altra (dpdza) cas d prftta dpdza cu ua dll varabl dtrma ach l altra. tratta ovvamt d cas lmt, lla pratca c s può pù o mo avvcar alla stuazo d dpdza. Il grado d rlazo fra du varabl v msurato co var dc statstc ch, sostaza, soo opportu dstaz tra la stuazo ffttvamt ossrvata qulla rlatva al caso d dpdza. ottgoo così msur d assocazo. l varabl soo tramb quattatv è possbl studar lgam d trdpdza tramt la corrlazo la dpdza d ua dll varabl dall altra co l aals d rgrsso. Nl s trattrà d assocazo; mtr la rgrsso la corrlazo sarao oggtto d 3.. Assocazo tra varabl statstch Esmpo. U collttvo d 9 studt, 9 masch (M) 00 fmm (F), v sottoposto ad u tst atttudal. L atttud prs sam soo: A: dscpl artstch; B: dscpl umastch; C: matr sctfch. I rsultat soo rportat Tab. Tab. Frquz pr ssso dscpl cogtv atttud ssso A B C Tot M 35 40 44 9 F 7 5 00 Tot 57 67 95 9 C s po l problma d studar l assocazo tra ssso atttud. I prma fas s può ossrvar ch l prctual d masch d fmm l collttvo prso sam soo: 9 00 % d M 54 % % d F 46 %. 9 9 c foss dpdza tra ssso atttud s dovrbb rscotrar l stss % d M F pr l atttud A, B C. otto l pots d dpdza, allora, s dovrbb ottr u valor attso o torco d frquza MA pr masch co l atttud A tal ch:

MA Tot d M (Tot d M) (Tot d A) 9 57 MA 30.97. Tot d A Tot Tot 9 I modo aalogo possoo ssr dtrmat l altr 5 frquz torch: 9 67 9 95 MB 36.4 ; MC 5.6 ; 9 9 00 57 00 67 00 95 FA 6.03 ; FB 30.59 ; FC 43.38. 9 9 9 ulla bas d tal rsultat è possbl costrur la Tab sgut. Tab. Tablla d dpdza atttud ssso A B C Tot M 30.97 36.4 5.6 9 F 6.03 30.59 43.38 00 Tot 57 67 95 9 L assocazo tra l du varabl può ssr aalzzata cosdrado ua dstaza tra l frquz ossrvat (Tab. ) qull torch (Tab. ). All uopo s cosdrao l dffrz tra tal frquz, com rportato Tab. 3: Tab. 3 Tablla dll dffrz atttud ssso A B C Tot M 35 30.97 4.03 40 36.4 3.59 44 5.6 7.6 0 F 6.03 4.03 7 30.59 3.59 5 43.38 7.6 0 Tot 0 0 0 0 s troduc l dc ch-quadrato χ com msura d assocazo: χ 4.03 3.59 ( 7.6) ( 4.03) ( 3.59) (7.6) + + + + + 4. 39. () 30.97 36.4 5.6 6.03 30.59 43.38 Com s può ossrvar l dc è costtuto dalla somma d 6 frazo ch prstao a umrator quadrat dll dffrz tra l frquz ossrvat qull torch a domator l frquz torch. Utlzzado l lguaggo R, dat possoo ssr mmorzzat ua matrc: > sssoc("m","f") > atttudc("a","b","c") > datmatrx(c(35,,40,7,44,5),,3,dmamslst(ssso,atttud)) # gra la matrc dll frquz > dat A B C M 35 40 44 F 7 5 > tabas.tabl(dat)

> chsummary(tab)$statstc > ch [] 4.38774. La costruzo dll dc χ è gralzzabl al caso d du carattr X Y, co modaltà x, x, x 3,, x r y, y, y 3, y c, rlvat cotmporaamt su utà statstch. I tal caso la tablla dll frquz ossrvat o j (pr,,,r j,,,c ) assum la forma dlla tablla d cotgza Tab. 4 formata da r rgh c colo: Nlla tablla l quattà Tab. 4 Tablla d cotgza pr X Y Y X y y y c Tot x o o o c x o o o c x r o r o r o rc r Tot c c o j j r j o j soo l frquz margal dlla X, rspttvamt, dlla Y. otto l pots d dpdza d X Y, la frquza torca rlatva alla modaltà x d X alla modaltà y j va dtrmat scodo la: j j. uccssvamt vao calcolat l dffrz tra l frquz ossrvat qull torch o j j, qud, aalogamt alla (), l dc ch-quadrato: (o j j χ. (), j j ossrv ora ch l dc χ dpd dalla umrostà dl collttvo, l suo valor, a partà d assocazo tra du carattr prs sam, aumta all aumtar d. può allora prdr sam l dc d cotgza quadratca mda: Φ χ assumr com msura d assocazo la radc quadrata Φ d tal quattà. Così pr l smpo s ott: 4.39 Φ 0.4. 9 Φ vara tra 0 r c (Appdc ); u valor prossmo a 0 porta ad scludr u assocazo tra du carattr. U valor d Φ par a 0.4 portrbb ad potzzar ua o dpdza tra l sso l Atttud, tuttava la problmatca va samata co pù attzo facdo rfrmto ach ad ultror strumt d aals. ) 3

psso, lla msura d assocazo, s fa rfrmto ach all dc d assocazo oralzzato V d Cramr: Φ V. m {(r ),(c ) } La V vara tra 0 (Appdc ); valor prossm a dotao ua fort assocazo tra l du varabl, ma tuttava o dao dcazo sull modaltà d assocazo. Pr l smpo s ott: V 0.4, valor cocdt, qusto caso, co qullo d Φ quato l mmo v calcolato tra ( ) (3 ). Utlzzado R: > Vsqrt(ch/(sum(dat)m(row(dat)-,col(dat)-))) # ch è l oggtto dfto sopra > V [] 0.45458.. Rgrsso lar smplc Esmpo. I u campo d 5 dvdu soo stat rlvat carattr quattatv tà (ETA ) prsso sstolca (PA). I valor d du carattr soo rportat Tab. 5 grafcat mdat l dagramma d dsprso d Fg.. Tab. 5 Valor d tà prsso sstolca rlvat su 5 dvdu Idvduo ETA (a) PA (mm Hg) 3 8 4 3 67 76 4 47 5 56 45 6 70 57 7 8 7 8 03 9 33 30 0 5 30 47 4 9 3 3 35 4 73 54 5 60 48 PA 50 00 50 00 50 0 0 30 40 50 60 70 80 90 ETÀ Fg. - Dagram ma d dsprso ETA'-PA vuol dvduar ua fuzo ch dscrva, modo sttco, l carattrstch d ua possbl rlazo statstca tra du carattr prs sam. Parlado d rlazo statstca va prcsato ch o s tratta, gral, d trovar ua fuzo matmatca ch prmtta d rcavar sattamt l valor d u carattr fuzo d u altro: o s può psar, ad smpo, ch sa possbl dtrmar sattamt la prsso sstolca d u dvduo ua volta ota l tà!! può comuqu potzzar ua rlazo tra ua varabl statstca Y d ua scoda varabl X dl tpo: Y f (X) + ε, (3) 4

dov f (X) è ua fuzo d X ε rapprsta l sm dgl fftt casual ch altr varabl, o cosdrat ll aals, possoo avr sulla Y. La varabl X è dtta varabl dpdt o splcatva la Y varabl dpdt o rsposta. La fuzo f (X) d (3) sprm u adamto mdo d Y dpdza dlla varabl X: f (X) E(Y X) mda d Y pr og fssato valor d X. Così, rfrmto all smpo, s può supporr ch, pr og valor dlla varabl ETA (X), s possa rlvar ua dstrbuzo d PA (Y) lo studo abba com obttvo qullo d dvduar ua forma fuzoal pr la mda dll prsso sstolch dgl dvdu co fssata tà. La fuzo f (X), gral, prsta alcu paramtr ch, ll aals codotta, vao opportuamt stmat. tal fuzo può ssr scrtta com ua fuzo lar paramtr, ovvro: f (X) a f (X) + a f (X) + a 3 f 3 (X) + + a h f h (X), dov a, a, a 3,, a h dcao paramtr, allora l sprsso (3) dfsc l modllo d rgrsso lar smplc. Ad smpo s possoo avr l sgut fuzo: f (X) a + b X co paramtr a b; f (X) a + b X 3, co paramtr a b; f (X) a log(x), co paramtro a; f (X) a log(x) + b s(x), co paramtr a b. tratta d stmar l modllo ch pù s adatta a dat. La Fg. suggrsc, prma aals, d rcrcar ua fuzo dl tpo: f (X) a + b X (4) quato put sul grafco a dsprso mostrao u adamto approssmatvamt lar. Pù gral, s vuol studar u modllo d rgrsso lar smplc tra du varabl quattatv X Y dl tpo (4), partcolar, stmar l paramtro a, dtto trctta, d l paramtro b, dtto coffct d rgrsso lar. suppoga, allora, ch su ogua dll utà statstch prs sam sa stata rlvata la coppa d valor (x,y ), pr,,3,,, (ll smpo, 5), l prmo d qual è rlatvo alla varabl X d l scodo alla varabl Y. Impodo la proprtà d mmo dlla somma dgl scart quadratc (y f(x )), altr trm facdo rcorso al Mtodo d Mm Quadrat, s prova ch l stm dl coffct d rgrsso lar dll trctta soo fort dall sgut: CODEV(X,Y) xy b a y b x, DEV(X) dov y x soo, rspttvamt, la mda artmtca d Y d X, DEV(X) la dvaza d X CODEV(X,Y) xy (x x) (x x)(y y) è la codvaza d X Y (Appdc ). ossrv ch la dvaza d Y ( ) può ssr dfta mara aaloga a qulla d X. è 5

Nlla Tab. 6 sgut è svluppato u procdmto maual (ma ch può ssr faclmt codotto co l utlzzo d u foglo lttroco) pr l calcolo d du paramtr d rgrsso. Tab 6 Calcolo d md, dvaz codvaz d ETA (X) PA (Y) oggtto ETA (X) PA (Y) X x Y y (X x ) (Y y ) (X x ) (Y y ) 3-6.07-8.47 679.47 7.68 0.70 8 4-0.07-5.47 40.67 648.55 5.03 3 67 76 8.93 36.53 358.47 334.68 69.70 4 47 -.07-8.47.4 80.35 30.36 5 56 45 7.93 5.53 6.94 30.6 43.90 6 70 57.93 7.53 48.07 307.4 384.56 7 8 7 3.93 77.53 084.60 60.4 553.43 8 03-6.07-36.47 679.47 39.8 950.56 9 33 30-5.07-9.47 7.00 89.6 4.63 0 5 30.93-9.47 8.60 89.6-7.77 47 4 -.07.53.4 6.4 -.70 9 3-9.07-6.47 363.54 700.48 504.63 3 35-3.07-8.47 70.74 34.0 4.30 4 73 54 4.93 4.53 6.67. 36.36 5 60 48.93 8.53 4.40 7.8 0.83 omma 7 09 584.93 055.73 6708.53 Mda 48. 39.5 Ossrvato ch la DEV(X), la DEV(Y) la CODEV(X,Y) soo, rspttvamt, l somm rportat ll colo 6, 7 8 d Tab. 6, s ott: CODEV(X, Y) 6708.53 b. 7, a y b x 39.5.7 48. 78.5 DEV(X) 584.93, qud, la rtta d rgrsso ha quazo: Y 78.5 +.7 X. Utlzzado l pacchtto R, dat d ETA PA vgoo mmorzzat du vttor: > tàc(,8,67,47,56,70,8,,33,5,47,9,35,73,60) > pasc(3,4,76,,45,57,7,03,30,30,4,3,,54,48) l coffct d rgrsso l trctta s calcolao co l struzo: > rglm(pas ~ tà) > rg$coff (Itrcpt) tà 78.45305.69370 ottdo l valor dll trctta sotto al trm Itrcpt qullo dl coffct d rgrsso sotto la voc tà. I Fg. vgoo rapprstat, smpr utlzzado R, valor rlvat d tà prsso la rtta d rgrsso. 6

> plot(tà,pas,pch9,col,ylmc(0,50),xlmc(0,90), + xaxpc(0,90,9) sub"fg. 3 - cattr ETA'-PA rtta + d rgrsso",xlab"eta'",ylab"pa") > abl(rg) > txt(70,70,xprsso(y78.5+.7x),cx0.7) > txt(70,40,xprsso(rsquar0.7),cx0.7) Il sgfcato dll dc Rsquar prst lla Fg. vrrà llustrato l paragrafo ch sgu, ma s può dr subto, mara formal, ch sso è u dc dlla botà dl modllo d rgrsso lar pr dat prs sam. Da u puto d vsta statstco l coffct d rgrsso b rapprsta la varazo mda dlla varabl dpdt cosgut ad ua varazo utara dlla varabl dpdt; l paramtro a rapprsta, vc, l valor dlla varabl dpdt corrspodt al valor ullo d qulla dpdt. Nll smpo, ssdo b.7 s può dr ch, mda, la prsso sstolca aumta d crca.3 mmhg pr og ao d tà; l valor dll trctta a 78.5 rapprsta l valor torco dlla PA alla ascta (ma o è corrtto ffttuar strapolazo sulla bas d dat a dsposzo!). Quato aalzzato sopra è rlatvo alla dpdza dlla varabl Y dalla X (rgrsso d Y su X); modo aalogo s può studar la dpdza d X da Y. ottgoo tal caso sgut paramtr d rgrsso: b CODEV(X, Y) DEV(Y) a x b y la rtta d rgrsso d X su Y: X a + b Y. Pr l smpo o ha sso studar la dpdza dll tà dalla prsso sstolca. Tuttava, a ttolo smplcmt smplfcatvo, s rportao l coffct d rgrsso dll ETA sulla PA la rlatva trctta: CODEV(X, Y) 6708.53 b 0. 56 ; a 9.5. DEV(Y) 055.73 C s può chdr, ora, s l approssmazo ottuta col modllo lar è buoa. U mtodo d studo dll adattamto fa rfrmto all Aals d Rsdu. Y è la varabl rsposta co valor ossrvat y, y,, y f(x) a + b X è l modllo rgrssvo co valor prdtt y a + bx, y a + bx,..., y a + bx, s dfsc rsduo rs, pr,,,, lo scarto tra l valor ossrvato y d l corrspodt valor prdtto y : rs y - y, mtr l rsduo rlatvo è dato dal rapporto rs y. l modllo lar è buoo, rsdu rlatv soo pccol. La Tab. 7 rporta valor dlla varabl ETA (varabl splcatva 7

X), dlla prsso PA (varabl dpdt Y), qull stmat co la rtta d rgrsso 78.5 +.7 X, rsdu d rsdu rlatv. Y Tab. 7 Valor d ETA, PA, prdtt dal modllo lar, rsdu rsdu rlatv ETA PA y rs rs /y 3 06,38 4,6 0,88 8 4 3,99 0,0 0,000 3 67 76 63,50,50 0,07 4 47 38, -7, -0,44 5 56 45 49,54-4,54-0,03 6 70 57 67,3-0,3-0,066 7 8 7 8,7 35,73 0,65 8 03 06,38-3,38-0,033 9 33 30 0,34 9,66 0,074 0 5 30 43,9-3,9-0,0 47 4 38, 3,89 0,07 9 3 5,6 -,6-0,00 3 35,88 -,88-0,06 4 73 54 7, -7, -0, 5 60 48 54,6-6,6-0,045 Va codotta ach u aals grafca. La Fg. 3 mostra l dagramma d dsprso d rsdu. l modllo è adguato, l dagramma dovrbb apparr ch valor d ua dll coordat o fluscoo su qull dll altra (dstrbuzo casual d put). dovrbb rscotrar ua vcaza d rsdu al valor 0 d u qua dstrbuzo d rsdu postv rsdu gatv. Ossrvado rsdu rlatv d Tab. 7 d l grafco d rsdu, s può dr ch ll smpo aalzzato l modllo lar è sostazalmt accttabl. Co l comado d R: > plot(rg) vgoo vsualzzat squza quattro grafc, l prmo d qual è qullo d rsdu, pr l aals grafca dl modllo lar. È cssaro putualzzar, comuqu, ch pr cocludr sulla buoa adattabltà dl modllo lar a dat è cssaro utlzzar altr mtodch statstch; quato proposto è smplcmt u aals qualtatva dlla problmatca. 3. Corrlazo lar smplc Ua msura dlla botà dl modllo lar può ssr ottuta studado l trdpdza tra du carattr statstch quattatv X Y. Uo dgl dc molto oto pr ua tal msura è l coffct d corrlazo lar R (d Parso): CODEV(X, Y) xy R. DEV(X) DEV(Y) Tal quattà vara tra (Appdc 3). U valor d R vco a dca ua assocazo strtta o molto strtta tra l du varabl; s parla tal caso d corrlazo lar postva tra X I raltà va cosdrato ach l fatto ch s tratta d dat bomdc. 8

Y: all aumtar d ua varabl aumta ach l altra. U valor d R vco a dota u alta o molto alta corrlazo lar gatva (dscordaza) tra X Y: all aumtar d ua d ss l altra dmusc. U valor d R 0 o prossmo a 0 dca dffrza (dpdza) tra l varabl. La Fg. 4 llustra alcu stuazo rlatv a dagramm d dsprso d du varabl X Y. Va ossrvato ch ll ambto dlla corrlazo s studa l trdpdza tra l du varabl o la dpdza d ua d ss dall altra (com lla rgrsso). Nll smpo dll tà PA (smpo ), utlzzado calcol d Tab. 6, s ha: 6708.53 R 0.84, 584.93 055.73 s rgstra, qud, u apprzzabl grado d corrlazo lar postva tra l tà la prsso sstolca pr dat prs sam. Nl lguaggo R, rcosdrado vttor tà pas, soo suffct sgut comad pr l calcolo dl coffct d corrlazo lar: > cor(tà,pas) [] 0.8404483 Il coffct d corrlazo può ssr calcolato ach utlzzado coffct d rgrsso d Y su X (b) d X su Y (b ): xy xy R ± ± b b'. I rfrmto acora alla rgrsso lar è possbl ffttuar u ultror ossrvazo. La Fg. 5 llustra l dvazo d u grco valor ossrvato dalla rtta d rgrsso stmata. 9

Podo: Dvaza Total TOT ; (y y ) Dvaza Rsdua RE ; (y y) Dvaza d Rgrsso REG. può scrvr (Appdc 4): TOT REG + RE. D altra part rsulta: (y y ) (y y ) (y y) xy R REG TOT L dc R è dtto coffct d dtrmazo; vara tra 0, pr valor prossm ad, dca u buo adattamto d dat al modllo lar. Il coffct d dtrmazo sprm la part d varazo dlla varabl rsposta Y spgata dal modllo rgrssvo Y a + bx o, altr trm, la part d varaza d Y mputabl alla varabltà d X. può calcolar ach la quattà R ch dca la part d varabltà dlla varabl rsposta mputabl ad altr fattor dvrs dall altra varabl. Nl caso dll smpo s ott: R Rsquar 0.7 7% R 9%, duqu, pr dat prs sam, l 7% dll aumto dlla PA è dtrmata dall ETA, mtr pr l 9% tal aumto rscotrato è dovuto ad altr fattor (dvrs dall ETA ). Ua rgola mprca porta a rtr u buo adattamto dl modllo a dat qualora rsult Rsquar > 0.70, allora s può rtr ammssbl pr dat cosdrat ua dpdza lar tra PA d ETA. rbadsc, og caso, ch ua aals adguata cssta d ultror approfodmt. Nl pacchtto R, ua volta dfto l oggtto rg (modllo d rgrsso lar), l comado: > summary(rg) prmtt d ottr l valor Rsquar: > summary(rg)$r.squard [] 0.7063534 ma forsc ach altr formazo sul modllo d rgrsso cssar a f frzal. Tal asptt o soo trattat, tuttava, qust Apput. 4. Esrcz ) Pr vrfcar gl fftt d u atprtsvo, soo stat rclutat 00 prso prts suddvs casualmt du grupp d ugual umrostà. Al Gruppo A v sommstrato l Farmaco, al Gruppo B u Placbo. otto tutt gl asptt dl trattamto du grupp soo stat curat mara dtca. V rlvato u fftto postvo su 75 soggtt dl Gruppo A su 65 dl Gruppo B. Aalzzar l assocazo tra Farmaco rsultato postvo. 0

) suppoga d volr cofrotar l'ffcaca d du dvrs farmac, A B. A tal f vgoo cosdrat 5 soggtt: 68 co l farmaco A 53 co l farmaco B. L'fftto dl trattamto v msurato trm d soggtt mglorat o mglorat. I rsultat soo sprss lla sgut tablla: Mglorat No Mglorat Total Farmaco A 5 6 68 Farmaco B 64 89 53 Total 6 405 5 chd s la frquza d soggtt o mglorat sa la stssa ll ambto d du grupp, coè s la frquza d o mglorat sa la stssa dpdtmt dal trattamto cu soggtt soo stat sottopost. 3) I u gruppo d 80 pazt s soo rscotrat sgut st rfrmto ad u dato trattamto mdco: Guarto No guarto Total Trattato 5 5 30 No trattato 0 30 50 total 35 45 80 C è assocazo tra trattamto guargo? 4) u u gruppo d 50 soggtt vaccat cotro u vrus fluzal, s soo rgstrat 65 cas d fluza; su 0 soggtt o vaccat, vc, 4 hao cotratto la malatta. Cosa s può ossrvar sull assocazo tra vacco fluza? 5) Nl laboratoro d ua clca mdca uvrstara ua coltura d battr v sottoposta a dos dvrs d atbotco pr vrfcar s sst ua rlazo lar tra dvrs dosagg l umro d battr rsdu. I dat sao sgut: Atbotco (dos mglaa) 300 800 00 500 000 3000 Battr (umro mlo) 35 30 5 5 7 Calcolar l coffct d corrlazo lar commtar; dtrmar la rtta d rgrsso, calcolar R commtar l rsultato; dtrmar la coctrazo mma d atbotco ch dovrbb lmar battr. 6) Ad 8 pazt è stato sommstrato u quattatvo d glucoso (gramm) dopo crca 90 mut soo stat rlvat valor d glcma (g/dl). La quattà d glucoso grto valor d glcma soo rportat tablla: Pazt A B C D E F G H Glucoso (g) 40 80 50 35 60 5 0 50 Glcma (g/dl) 90 00 60 6 0 00 80 5 Rapprstar grafcamt dat; calcolar l coffct d corrlazo tra l du varabl; dtrmar la rtta d rgrsso d trprtar coffct. 7) La tablla sgut rporta l dstrbuzo dll tà dlla colstrolma (g/dl) pazt: Pazt 3 4 5 6 7 8 9 0 Età (a) 50 40 60 45 55 50 60 65 45 49 55 Colstrolma (g/dl) 35 45 5 80 60 55 5 300 00 5 80 Calcolar l coffct d corrlazo d Parso qullo d dtrmazo: commtar rsultat ottut.

APPENDICE. Dsuguaglaz pr l dc ch-quadrato I rfrmto alla Tab. 4 dl all dc ch-quadrato dfto dalla (), c s propo d provar ch: (oj ) j a) χ (r c ) ;, j j (o ) χ. j j b) m{ (r );(c ) }, j j ossrv aztutto: (o j ) o o o j j j j χ + j o j +. (A), j j, j j, j, j, j j, j j D altra part, pr,,,r j,,,c, rsulta: o j o j j da cu: o j, j j o j o, j j o j o, j j j j, j j j, j j oj oj d ach r., j j Prtato, co l utlzzo d (A):, j j j, j j j j oj o j r c ; j oj, j j j j j j ; j c χ r c (r c ); χ c (c ); χ r (r ). La prma rlazo è propro la a); la dsuguaglaza b), vc, s ott dalla scoda trza sprsso quato tramb vr: χ m{ (r ); (c )} m{(r ); (c )}.. tma d paramtr d rgrsso Il Mtodo d Mm Quadrat rchd ch la somma dgl scart quadratc [y f(x )] (y a bx ) sa mma. Cosdrata la varabl Y a bx, la sua dvaza può ssr sprssa dalla: DEV(Y a bx) (y a bx ) (y a bx) (y a bx) ;

duqu: DEV(Y a bx) + (y a bx). Ossrvato ch trm dlla somma a scodo mmbro dll uguaglaza appa scrtta soo tramb o gatv, rsulta: MIN MIN(DEV(Y a bx)) + MIN( (y a bx), qud, valor d a b vao rcrcat tra qull ch mmzzao sa l ua ch l altra quattà dlla somma. La scoda: (y a bx) assum mmo quado è ugual a 0, duqu: y a bx 0 a y bx. Pr l aals dlla prma quattà va svluppata la dvaza: DEV(Y a bx) DEV(Y bx) DEV(Y) + DEV(bX) bcodev(x, Y) b DEV(X) bcodev(x, Y) + DEV(Y). Rcordado ch DEV(X), DEV(Y) CODEV(X,Y) xy, rsulta: ) DEV(Y a bx) b bxy +, prtato, l mmo dlla dvaza al varar d b cocd col mmo dlla fuzo: Q (b) b bxy +. (A) D altra part, su u pao cartsao ortogoal co b sull ascss, la Q(b) rapprsta ua parabola co ass paralllo all ass dll ordat cocavtà vrso l alto ( quato >0), duqu, com llustrato fgura a lato, ssa assum l valor mmo corrspodza dl vrtc, la cu ascssa è data da: b xy CODEV(X,Y) DEV(X) (x x)(y (x x) y) può allora cocludr ch stm d coffct dlla rtta d rgrsso soo: b CODEV(X, Y) DEV(X) a y b x. 3

3. Dsuguaglaza d Chauchy-chwartz Cosdrat l varabl statstch X Y dcato co E( ) la mda d ua varabl, rsulta: [E(X Y)] E(X) E(Y) (A3) vrfca l uguaglaza s Y λx, pr qualch valor ral λ. Pr la prova d quato affrmato s cosdr ch, pr λ ral, s ha: d ssdo E((λX Y) ) 0 rsulta: E((λX Y) ) E(λ X λx Y+Y ) λ E(X ) λ E(X Y) + E(Y ) λ E(X ) λ E(X Y) + E(Y ) 0 Affché la forma quadratca a prmo mmbro dll sprsso sopra scrtta sa ovuqu o gatva, l suo dscrmat dv ssr gatvo o ullo: [E(X Y)] E(X ) E(Y ) 0, da qu la dsuguaglaza (A3). 0, s ott E((λX Y) ) 0 pr qualch λ, da cu: Y λ X. Pr provar ch l coffct d rgrsso R è comprso tra, è suffct ossrvar ch: E((X x ) ); E((Y y ) ); xy E((X x ) (Y y )) sosttur lla (A4) cascua varabl co l suo scarto dalla mda, ottdo: xy. 4. composzo dlla Dvaza total I Appdc s è vsto ch la quattà (y y ) (y f(x )) ha valor mmo corrspodza dl mmo dlla fuzo Q(b) dfta dalla (A), ovvro pr l valor dll ordata dl vrtc dlla parabola rapprstata da tal fuzo: 4 4 xy xy (y y ) + 4. Rsulta qud: (y y ) (y y ) + + xy (bx (y y ) bx) + xy (y y ) 4 + (y y ) (y y). + b (x x)