STATISTICA DESCRITTIVA modulo 1 Corso di Laurea SMID Elda Guala e Ivano Repetto Dipartimento di Matematica - Università degli Studi di Genova

Documenti analoghi
MEDIA DI Y (ALTEZZA):

Caso studio 12. Regressione. Esempio

Variabilità = Informazione

LEZIONI DI STATISTICA MEDICA

Caso studio 10. Dipendenza in media. Esempio

Lezione 4. La Variabilità. Lezione 4 1

Università di Cassino. Esercitazioni di Statistica 1 del 26 Febbraio Dott. Mirko Bevilacqua

Classi di reddito % famiglie Fino a Oltre Totale 100

Due distribuzioni, stessa media ma in quale delle due la media rappresenta, sintetizza meglio la situazione?

Caso studio 2. Le medie. Esercizio. La media aritmetica. Esempio

Gli indici sintetici Forma. Un caso studio. Gli indici sintetici. Qualche considerazione. Qualche considerazione. Tendenza centrale Forma

CORSO DI STATISTICA I (Prof.ssa S. Terzi)

Università di Cassino Esercitazioni di Statistica 1 del 5 Febbraio Dott. Mirko Bevilacqua

I percentili e i quartili

Istogrammi e confronto con la distribuzione normale

Statistica descrittiva per l Estimo

Gli indici sintetici Forma. Gli indici sintetici. Gli indici sintetici. Qualche considerazione. Qualche considerazione. Tendenza centrale Forma

LE MEDIE. Le Medie. Medie razionali. Medie di posizione

Voti Diploma Classico Scientifico Tecn. E Comm Altro

LE MEDIE. Quadratica. Italo Nofroni. Statistica medica. Medie. Le medie vengono classificate in due gruppi

Analisi dei Dati. La statistica è facile!!! Correlazione

INDICI DI VARIABILITA

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 9: Covarianza e correlazione

Capitolo 6 Gli indici di variabilità

LA REGRESSIONE LINEARE SEMPLICE

Esercitazione 5 del corso di Statistica (parte 1)

LE MEDIE. Quadratica. Italo Nofroni. Statistica medica. Medie. Le medie vengono classificate in

CORSO DI STATISTICA I (Prof.ssa S. Terzi) 1 STUDIO DELLE DISTRIBUZIONI SEMPLICI. Esercitazione n 3

Dott.ssa Marta Di Nicola

MISURE DI TENDENZA CENTRALE. Psicometria 1 - Lezione 2 Lucidi presentati a lezione AA 2000/2001 dott. Corrado Caudek

La classe che mostra la distribuzione più elevata è quella 60-90, che corrisponde a un uso elevato dell automobile. f i fr (= f i/n) fr% (=fr*100)

Facoltà di Farmacia Corso di Matematica con elementi di Statistica Docente: Riccardo Rosso

Esercizi su Rappresentazioni di Dati e Statistica

STATISTICA DESCRITTIVA - SCHEDA N. 3 VARIABILI QUANTITATIVE Indici di centralità, dispersione e forma

Il termine regressione fu introdotto da Francis Galton ( ), antropologo (promotore dell eugenetica).

Indici di asimmetria. Elementi di Statistica descrittiva Parte IV. Simmetria di una distribuzione di frequenze. Primo indice di asimmetria (1/3)

III Esercitazione: Sintesi delle distribuzioni semplici secondo un carattere qualitativo ordinale.

b) Relativamente alla variabile PREZZO, fornire una misura della variabilità della distribuzione attraverso

frazione 1 n dell ammontare complessivo del carattere A x

Regressione e Correlazione

dei quali si conoscono solo la media x e la deviazione standard σ e dato un valore reale positivo K, possiamo affermare che:

Matematica elementare art.1 di Raimondo Valeri

Università degli Studi di Napoli Parthenope. Facoltà di Scienze Motorie a.a. 2011/2012. Statistica. Lezione IV

Funzioni di più variabili Massimi e Minimi una funzione definita in un insieme E. Un punto ( x0, y0)

x... Gli indici sintetici La media aritmetica Gli indici sintetici Indici assoluti Indici relativi Indici normalizzati Forma

Le misure di variabilità

Indici di Posizione. Gli indici si posizione sono misure sintetiche ( valori caratteristici ) che descrivono la tendenza centrale di un fenomeno

Lezione 4. Metodi statistici per il miglioramento della Qualità

valido se i dati E dato da max(x i )-min(x i )

Stima puntuale Quando un parametro della popolazione incognito è valutato (stimato) da una sola statistica (parametro) tratto da un campione

Indipendenza in distribuzione

Università della Calabria

Variabili casuali ( ) 1 2 n

Stim e puntuali. Vocabolario. Cambiando campione casuale, cambia l istogramma e cambiano gli indici

STATISTICA DESCRITTIVA - SCHEDA N. 4 VARIABILI QUANTITATIVE Trasformazioni lineari Indici di covarianza e correlazione

Aritmetica 2016/2017 Esercizi svolti in classe Quarta lezione

Lezione 13. Anelli ed ideali.

Elementi di Statistica descrittiva Parte II

Interpolazione. Definizione: per interpolazione si intende la ricerca di una funzione matematica che approssima l andamento di un insieme di punti.

6. LA CONCENTRAZIONE

3 Variabilità. variabilità. Senza deviazione dalla norma il progresso non è possibile. (Frank Zappa) Statistica - 9CFU

Associazione tra due variabili quantitative

Sommario. Facoltà di Economia. Obiettivo. Quando studiarla? Lezione n 7. X: carattere quantitativo tra le unità statistiche. Quando studiarla?

Statistica descrittiva

Generalmente sia l ampiezza che il valore medio della sollecitazione sono variabili nel tempo.

Lezione 3. Gruppi risolubili.

Premessa. Abbiamo più volte enfatizzato come questo processo di sintesi comporta un prezzo da pagare in termini di perdita di informazioni.

Il campionamento e l inferenza

Capitolo 4 Le Misure di Centralità

TRATTAMENTO STATISTICO DEI DATI ANALITICI

Design of experiments (DOE) e Analisi statistica

ELABORAZIONE DEI DATI

La distribuzione statistica doppia (o bivariata)

STATISTICA DESCRITTIVA

Elementi di Statistica descrittiva Parte III

Propagazione di errori

DI IDROLOGIA TECNICA PARTE II

STATISTICA DESCRITTIVA

SERVIZIO DAF: FONTI STATISTICHE

corrispondenza della generica i-esima modalità. Indicando con #(.) la cardinalità di un insieme, per esse si ha, rispettivamente:

ESERCIZI SU DISTRIBUZIONI CAMPIONARIE

Lezione 24. Campi finiti.

Laboratorio di Fisica I: laurea in Ottica e Optometria. Misura di una resistenza con il metodo VOLT-AMPEROMETRICO

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER ATTRIBUTI

Def. Si dice variabile aleatoria discreta X una variabile che può assumere valori X1, X

Francesco Ciatara ELEMENTI STATISTICA

SIMULAZIONE DI SISTEMI CASUALI 1 parte. Variabili casuali e Distribuzioni di variabili casuali. Calcolo delle probabilità

Capitolo 2 Errori di misura: definizioni e trattamento

Modelli di accumulo del danno dovuto a carichi ciclici

Il modello di regressione lineare semplice (1) Studio della dipendenza riepilogo

Dimostrazione della Formula per la determinazione del numero di divisori-test di primalità, di Giorgio Lamberti

FUNZIONI LOGICHE FORME CANONICHE SP E PS

Formulario e tavole. Complementi per il corso di Statistica Medica

Sommario. Corso di Statistica Economia e Commercio. Distribuzioni (cont Distribuzioni di frequenza. Distribuzioni

Elementi di statistica descrittiva Parte III

ESERCITAZIONE NUMERO 4

Consentono di descrivere la variabilità all interno della distribuzione di frequenza tramite un unico valore che ne sintetizza le caratteristiche

Calcolo delle Probabilità: esercitazione 4

ARGOMENTO: MISURA DELLA RESISTENZA ELETTRICA CON IL METODO VOLT-AMPEROMETRICO.

SIMULAZIONE DI ESAME ESERCIZI. Cattedra di Statistica Medica-Università degli Studi di Bari-Prof.ssa G. Serio 1

Transcript:

- -. Varabl statstche STATISTICA DESCRITTIVA modulo Corso d Laurea SMID Elda Guala e Ivao Repetto Dpartmeto d Matematca - Uverstà degl Stud d Geova I dat rportat sotto s rferscoo a studet uverstar che hao frequetato u corso d Statstca e soo stat raccolt facedo complare ad og studete l seguete modulo: SESSO ALTEZZA PESO CORSO LAUREA NUMERO SCARPA COLORE OCCHI COLORE CAPELLI ATT SPORTIVA DIPLOMA CORSO LAUREA : M= matematca B = bologa I = formatca COLORE OCCHI = scur = verd = azzurr COLORE CAPELLI = scur = casta = bod Tabella de dat : ATT.SPORTIVA = ulla = meda = alta DIPLOMA : = lceo scetfco = lceo classco = st. tecco 4 = st. magstrale 5 = altro N SESSO ALTEZZA PESO CORSO NUMERO COLORE COLORE ATT DIPLOMA (cm) (kg) LAUREA SCARPA OCCHI CAPELLI SPORTIVA M 79 5 I 4 M 8 I 4 F 5 5 I 9 4 F 49 I 7 5 F 47 M 7 5 F 48 M 7 F 4 5 M 8 8 F 7 57 M 8 9 M 8 7 M 4 M 8 8 M 45 M 7 M 4 M 8 8 I 4 M 8 85 I 4 4 F 7 5 I 7 5 M 7 7 I 4 5 M 8 5 I 4 7 M 7 75 I 4 8 M 7 7 I 4 9 M 78 8 I 45 F 49 B 7 VARIABILI QUALITATIVE : SESSO CORSO LAUREA COLORE OCCHI COLORE CAPELLI ATT SPORTIVA DIPLOMA VARIABILI QUANTITATIVE : ALTEZZA (cm) PESO (kg) NUMERO SCARPA

- -. Statstca descrttva per varabl qualtatve Geere cotegg percetuale M F 8 4 totale CLaurea cotegg percetuale B 5 I M 7 5 totale Dploma cotegg percetuale 7 5 9 45 4 5 totale Att.Sport. cotegg percetuale 5 5 totale Occh cotegg percetuale 4 7 4 totale Capell cotegg percetuale 7 5 5 5 totale. Relazo fra varabl qualtatve : tabelle Tabella d cotgeza (varabl sesso e corso d laurea) Tabella percetuale Tabella profl rga Tabella profl coloa SESSO/C.LAUREA B I M Totale F 4 8 M 9 Totale 7 SESSO/C.LAUREA B I M Totale F 5 5 4 M 45 5 Totale 5 5 GENERE/C.LAUREA B I M Totale F.5 7.5 5 M 75 5 SESSO/C.LAUREA B I M F 5 57 M 75 4 Totale

- -. Rappresetazoe grafca d varabl qualtatve : grafc a barra CLaurea cotegg percetuale Bologa 5 Iformatca Matematca 7 5 totale Occh cotegg percetuale scur 4 7 verd 4 azzurr totale Attvtà Sportva cotegg percetuale ulla meda 5 alta 5 totale

- 4 - Eserczo. La tabella seguete rporta dat d = dvdu. La varable Reddto e suddvsa elle tre class, a reddto crescete,, e ; la varable Auto dca l umero d auto possedute dal ucleo famlare d cu la persoa fa parte. N GENERE REDDITO AUTO FUMATORE M NO M NO F NO 4 F SI 5 F NO F NO 7 M NO 8 F SI 9 F SI F NO M SI M NO M SI 4 M NO 5 F NO M NO 7 M NO 8 F SI 9 F SI F NO. Costrure le tabelle d cotgeza e percetual per ogua delle varabl.. Costrure u grafco a barre de cotegg per ogua delle varabl.. Costrure u grafco a barre percetuale per ogua delle varabl. 4. Costrure la tabella coguta (cotegg e percetuale) per le varabl Sesso e Fumo. 5. Costrure la tabella coguta (cotegg e percetuale) per le varabl reddto e Auto.. Costrure u grafco a barre della varable reddto rpartto per la varable Auto. Rsoluzoe d alcue part dell eserczo Put e Geere cotegg percetuale M 9 45 F 55 totale

- 5 - Reddto cotegg percetuale 8 4 totale fumator cotegg percetuale o 5 s 7 5 totale Auto cotegg percetuale 4 7 5 5 totale Puto 4 Tabella de cotegg SESSO/FUMO SI NO Totale F 5 M 7 9 Totale 7 Tabella percetuale Puto SESSO/FUMO SI NO Totale F 5 55 M 5 45 Totale 5 5

- - 9 8 7 umero auto cotegg 5 4 reddto Numero auto Reddto Totale 4 8 Totale 4 7 9 8 7 AUTO Cotegg 5 4 REDDITO

- 7 -. Statstca descrttva per varabl quattatve S effettuao = 4 msurazo d ua varable quattatva (umero d for d ua pata rlevat og 4 ore) e s ottegoo seguet rsultat (l orde d lettura e da sstra a destra e dall alto basso) : 4 8 5 5 4 4 4 5 5 4 4 Questa varable puó assumere solo valor ter. La tabella seguete rappreseta la dstrbuzoe d frequeza: um. for Freq. Assoluta Freq. Relatva Freq. percetuale Freq. % cumulata.5.5.5.5 5 7.5.7 7.5 45.75 7.5 7.5 4.5 5 87.5 5 4. 97.5 8.5.5 totale 4 * Per varabl che hao valor o solo ter (ad esempo altezza e peso) la scelta de valor della prma coloa della tabella deve essere effettuata da ch fa l aals. Grafco a barre percetuale umero d for 5 percetuale 5 5 umero for 4 5 8

- 8-4. Idc d poszoe S dca co x, x,..., x l valore d ua varable quattatva rlevata su dvdu (osservazo). Nelle dstrbuzo d varabl quattatve s possoo utlzzare dc stetc med che servoo a stablre quale valore meglo rappreseta la varable quattatva. Possamo pesare a valor med come a output d fuzo che hao gresso valor della varable quattatva. x x x f ( ),,..., f x, x,..., x = valore medo La scelta della fuzoe f dovrà portare ad u valore tale che, sosttuedolo a cascuo de valor x,x,,x, rmaga varato l aspetto che teressa del problema. Se s è teressat a mateere varata la somma de valor, s deve utlzzare la meda artmetca x quato s deve avere x= x + x +... + x e qud la meda artmetca vale x = x=. Defzoe 4.: dato u seme fto d dat quattatv x, x,..., x s defsce meda artmetca la quattà x = x= geometrca Se s è teressat a mateere varato l prodotto de valor, s deve utlzzare la meda x G = x... x x. x G quato s deve avere ( G ) x = x x... x e qud la meda geometrca vale Defzoe 4.: dato u seme fto d dat quattatv postv x, x,..., x s defsce meda geometrca la quattà x G = x Esempo 4. Dato u rettagolo d dmeso x e x : se s vuole determare u valore L tale che l permetro d u quadrato co questo lato sa uguale a quello del rettagolo s usa la meda artmetca: 4L = x+ x da cu x+ x L = ; se s vuole determare u valore L tale che la superfce d u quadrato co questo lato sa uguale a quella del rettagolo s usa la meda geometrca: L = x x da cu L = x x.

- 9 - Esempo 4. I u azeda lavorao persoe cascua co uo stpedo x, =,...,. La somma d tal stped vale S = x. Se l azeda, avedo a dsposzoe la somma S, volesse che l mporto degl stped fosse uguale per tutt, dovrebbe assegare a cascuo uo stpedo par alla meda artmetca degl stped, coè Esempo 4. x = x=. I u cclo d lavorazoe tre apparecchature lavorao sere: la prma ha u redmeto del 9%, la secoda dell 8% e la terza del %. Quale è l redmeto percetuale medo complessvo? pezz 9% 9 pezz 8% 7 pezz % pezz Qud da pezz teorc s ottegoo realtà, co l terveto sere delle tre macche, pezz. Il problema è allora quello d trovare tre macche, tutte co lo stesso redmeto x, che, messe sere, dao partedo da pezz, alla fe de tre passagg pezz. Il valore d x s ottee moltplcado redmet delle tre macche :,9,8, =, e rsolvedo l equazoe x =,, e qud x =, =,. I altre parole se sosttussmo alle tre macche zal tre macche ugual, tutte co u redmeto del %, otterremmo la stessa percetuale d pezz uscta. pezz % pezz % pezz % pezz U altro dce che vee utlzzato è la meda armoca. U esempo d utlzzo della meda armoca è l seguete : se u auto s muove da A a B, che dstao 8 km, alla veloctà d 8 km/h e successvamete da B ad A alla veloctà d km/h, quale sarà la veloctà meda sull'tero tragtto adata-rtoro? Se s facesse la meda delle due veloctà s otterrebbe 5 km/h, rsultato o corretto. Ifatt s deve otare che l'tero tragtto è d km, che vee percorso 5 ore ( all'adata e 4 al rtoro): la veloctà meda corretta è duque /5, coè km/h, be dversa da 5 calcolat co la meda artmetca delle veloctà. I realtà la dstaza d 8 km o cota ulla, come mostra l seguete ragoameto. Se s dcao co d la dstaza AB, co t e t temp d adata e rtoro, co v e v le veloctà all'adata e al rtoro, allora la meda A x cercata è: x A d d vv = = = t + t d d + v + v v v, che è propro la meda armoca delle due veloctà.

- - Questa coclusoe è legata al fatto che l recproco della veloctà rappreseta l tempo ecessaro a percorrere l'utà d spazo (ua veloctà d 8 km/h sgfca che m serve /8 d ora per fare u km!). Se s tee coto che la veloctà meda rchesta s può ache scrvere come d x A =, l problema potrebbe essere formulato el seguete modo: a quale veloctà costate t+ t deve muovers l corpo se s vuole che l tempo d adata e rtoro sa uguale ed uguale alla meda degl effettv temp t e t? Nota. I questo caso og tragtto lo spazo percorso è lo stesso metre l tempo mpegato camba e qud l dce da utlzzare è la meda armoca delle due veloctà. Ivece se, og tragtto, lo spazo percorso cambasse e l tempo rmaesse uguale allora l dce da utlzzare sarebbe la meda artmetca delle due veloctà. Ad esempo, se u auto s muove per u ora ad ua veloctà d 8 km/h e per u altra ora ad ua veloctà d km/h, la sua veloctà meda s ottee calcolado la meda delle due veloctà, coè 8+ km/h=5 km/h. I altre parole, dat due umer a e b, la loro meda armoca x A è defta modo che la sua versa sa la meda artmetca degl vers d a e b; s poe coè: = + o, l che x A xa a b è lo stesso, = +. É mmedato che la meda armoca può essere calcolata ache co la xa a b formula: ab x =. A a + b U secodo esempo è legato al cocetto d potere d acqusto della moeta. Se u certo oggetto costa ogg e u tempo successvo 8, a quale prezzo dovrebbe essere veduto se s vuole che l potere d acqusto della moeta sa uguale ed uguale alla meda de due poter d acqusto? Per rspodere alla domada rcordamo che l potere d acqusto della moeta può essere defto come l recproco del prezzo: / (coè.5) rappreseta quata parte dell'oggetto posso ogg comprare co, /8 (coè.5) rappreseta la frazoe d oggetto che posso comprare el mometo successvo sempre co. Per avere l prezzo medo devo duque calcolare tato la meda de poter d acqusto: (.5+.5)/=.5 e po fare l recproco, otteedo, rsultato che cocde esattamete co la meda armoca de prezz. Defzoe 4.: dato u seme fto d dat quattatv postv x, x,..., x s defsce meda armoca la quattà xa = = + +... + + +... + x x x x x x

- - Altr dc d poszoe soo la moda e percetl (o quatl). Defzoe 4.4: dato u seme fto d dat quattatv x, x,..., x s defsce moda l dato che s verfca co frequeza maggore. Esempo 4.4 : Nella tabella seguete è rportata la dstrbuzoe delle famgle per umero d compoet u Comue talao. Il valore della moda è 4. Numero Famgle compoet 5 5 5 4 54 5 4 7 75 8 49 Defzoe 4.5: dato u seme fto d dat quattatv ordat x, x,..., x s defsce quatle d orde p, co p compreso fra e e s dca co Q p, l mmo valore per cu vale almeo p la frequeza de dat mor o ugual ad esso. Se s vuole calcolare l quatle d orde p s può, ad esempo, fra molt algortm d calcolo possbl, procedere el seguete modo: a) ordare valor delle osservazo seso crescete. b) calcolare l valore p. c) se p é u tero k l quatle d orde p é la meda fra x k e x k+. d) se p o é tero e k é l tero successvo a p allora l quatle d orde p é x k. Il p-esmo quatle vee detto ache p-esmo percetle. Il 5, 5 e 75 percetle, dett prmo, secodo e terzo quartle, vegoo dcat co Q,Q e Q rspettvamete. Esempo 4.5 = osservazo ordate.8..9.9 5. 5. 5.4 7. percetle 5 5 75 valore..95 5.

- - Il quatle Q è detto Medaa ed è l valore che dvde part ugual dat ordat: coe meta d ess soo mor o ugual a Q e meta soo maggor o ugual. I partcolare, per calcolare l valore della medaa : s ordao modo crescete dat; se é dspar la medaa é l valore cetrale; se é par la medaa é la meda de due valor poszoe cetrale. Esempo 4. : = osservazo 5.. 5..8 7..9.9 5.4 Dat ordat:.8..9.9 5. 5. 5.4 7. Medaa :.9 + =.95 Esempo 4.7 : =9 osservazo 5.. 5..8 7..9.9 5.4 Dat ordat:.8..9.9 5. 5. 5.4 7. Medaa :.9 5. Idc d dspersoe Varaza campoara σ x ( x x) oppure σ = ( x ) = Scarto quadratco medo σ ( x x) x σ = = ( x ) S ot che s utlzza l valore medo x quato soddsfa la seguete propretà : ( x x) ( x a) per og valore d a reale.

- - Dffereza fra quatl S defsce dstaza terquartle e la s dca co IQR l ampezza dell tervallo delmtato dal e quartle [IQR=Q- Q]. Fra Q (5 percetle) e Q (75 percetle) è coteuto l 5% de dat. Nell esempo seguete s vuole mettere evdeza l sgfcato d IQR quale dce d varabltà. Esempo (calcol fatt a mao ) A faco soo rportat valor delle altezze cm rlevat su uom e doe. D seguto soo rportat valor de tre quartl, d IQR e ua semplce rappresetazoe grafca. Varable Q Medaa Q IQR Altezza M 7,5 8, 85,5 9, Altezza F, 8, 7,5,5 9 85 8 75 7 5 55 Altezza M Altezza F Il fatto che per masch l valore d IQR sa d 9 cm, per le femme d,5 cm sgfca che l 5% de valor dell altezza s dsperde su u tervallo d ampezza maggore per le femme rspetto a masch. Per eserczo provate a rfare calcol elmado l osservazoe umero. Obs 4 5 7 8 9 4 5 7 8 9 Altezza Masch 8 8 7 75 75 78 8 8 8 8 8 8 8 85 85 8 87 88 88 88 Altezza Femme 55 57 57 59 5 8 8 8 8 7 7 7 74 75 75 75 78 Scarto assoluto medo rspetto alla meda : rspetto alla medaa: x = = x x Q S ot che s utlzza l valore d Q ella formula che permette d calcolare lo scarto assoluto medo rspetto alla medaa quato tale valore soddsfa la seguete propretà: x Q x a per og a reale.

- 4 - Dmostrazoe. S dcho co x, x, x,... x dat orgar e co x( ), x( ) x, ( ),... x ( ) dat ordat seso o decrescete. Sa F(a) ua fuzoe defta, per og a, el modo seguete : F( a ) = S vuole provare che F(a) è mma per a = Q. Suddvdamo la dmostrazoe due cas : caso : par, = k co k tero Sa ( ) ( ) ( + ) F a = x a + x a per og =,,..k È facle vedere che rsulta: F( a) F ( a) Ad esempo, se = 4, k =, s ha: ( ) ( ) ( ) F a = x a + x a 4 ( ) ( ) ( ) F a = x a + x a ( ) = ( ) + ( ) F a F a F a k =. x a D seguto soo rportat l espressoe aaltca e l relatvo grafco d cascua fuzoe F ( a ) : ( ) ( ) ( + ) F a = x a + x a = x( ) + x( ) a se a < x + ( ) x x se x a x ( + ) ( ) ( ) ( + ) a ( x( ) + x ( ) ) se a > x + ( + )

- 5 - F (a) x ( ) ( ) + + x x ( ) ( ) + x x ( ) x( + ) a Dal grafco s vede che cascua ( ) Allora l puto am d mmo d ( ) F a è mma per x( ) a x ( + ), per og =,,.k. F a deve apparteere a x( ) x + ( ), coè: x am x ( ) ( + ) Qud a m è propro, per defzoe, la medaa de dat x, x, x,... x. Per evtare l determazoe, s scegle po come valore per la medaa l valore Q = x x + ( ) ( + ). Ifatt precedetemete abbamo detto che: se é par la medaa é la meda de due valor poszoe cetrale e tal valor soo propro x e x ( ) ( + ) caso : dspar, = k- co k tero k La dmostrazoe è detca al caso precedete, co l uca dffereza che: x( ), x ( + ) cocde co l solo valore x ( +, che è, per defzoe, la medaa de dat x, x, x,... x ). Ifatt precedetemete abbamo detto che: se é dspar la medaa é l valore cetrale e tale valore è propro x ( +. ) CVD k

- - Eserczo 5. La tabella rportata sotto s rfersce alle seguet varabl rferte a = dvdu: Pulse = pulsazo cardache rlevate a rposo Pulse = pulsazo cardache rlevate dopo aver percorso 5m a passo veloce Fumo : =fumatore =o fumatore Altezza = altezza cm Peso = peso kg Sport ( attvtà sportva) : =bassa =meda =alta Pulse Pulse Fumo Altezza Peso Sport 4 88 7 4 58 7 8 7 87 7 78 85 8 4 8 75 7 74 84 85 75 84 84 8 8 8 7 88 8 75 8 89 7 8 8 9 94 88 7 8 9 8 7 9 84 78 9 8 7 7 7 8 77 58 8 79 8 75 79 7 7 85 77 8 7 88 8 7 8 7. Calcolare meda e varaza per le varabl quattatve.. Calcolare Q, Q e Q per le varabl quattatve.. Costrure ua tabella percetuale per ogua delle varabl qualtatve. 4. Calcolare meda e varaza per Puls e Puls per oguo de valor d Fumo.. Calcolo d meda e varaza per dat raggruppat class Nella tabella seguete soo rportat dat de rsultat d u esame uverstaro e l relatvo stogramma: voto Numero studet 8 8 4 5 8 9 9 9

- 7 - Come posso calcolare la meda de vot avedo a dsposzoe ucamete quest dat e o le sgole osservazo? S devoo pesare vot rspetto al umero d studet che hao otteuto quel voto. La formula per l calcolo della meda sarà qud : x = k x dove : x rappreseta l -esmo valore della varable k rappreseta l umero de valor assut dalla varable rappreseta l umero d elemet che assumoo l valore x é l umero totale d osservazo Nel caso de dat rportat tabella l valore d k é 9, l umero d studet vale e s avrà : k x 8* + *8 + * 4 + * + 5*+ * + 8*9 + 9*+ *9 x = = 4.5 Il caso esamato sopra é l pú semplce quato la varable VOTO assume solo valor ter. Come s calcola l valore della meda se la varable é quello della tabella dell eserczo precedete e la varable é Altezza? I questo caso, avedo a dsposzoe valor d tutte e le osservazo s ha che: x x x = = = 8.95 Se vece dat soo fort attraverso la seguete tabella come posso calcolare la meda? Altezza x 7-74 7 74-78 7 78-8 8 8-88 84 No é possble calcolare l valore esatto della meda ma s puó calcolare ua approssmazoe costruedo ua uova coloa che cotee valor cetral d ogua delle class d Altezza e po procedere come el caso precedete. I questo caso la uova tabella dveta : Altezza x x * 7-74 7 5 74-78 7 58 78-8 8 8-88 84 8 totale E l valore della meda é k x x = = = 8. S osserv che valor della meda calcolata su dat sgol o su dat tabella soo dfferet.

- 8 - Ache l calcolo della varaza el caso d varabl dvse class forsce u rsultato approssmato e lo s effettua utlzzado la formula seguete : σ = = k k ( x x) x ( x) dove : x rappreseta l -esmo valore della varable k rappreseta l umero delle class cu é dvsa la varable rappreseta l umero d elemet che assumoo l valor ella classe -esma é l umero totale d osservazo Il modo pú semplce d effettuare cot é costrure ua uova tabella : Altezza x * x x * 7 5 9584 8875 7 58 97 998 8 4 48 84 8 85 47 totale 8 575 Nel caso de dat o dvs class s ha che la varaza vale crca 4.8. Se s utlzza la tabella co dat dvs class s ottee : k k σ = ( x x) x ( x) ( 575 ) ( 8. ).4 = = =

- 9 - Eserczo. La tabella seguete rporta dat d peso e altezza (kg e cm) d = bamb. Peso Altezza 7 5 8 4 8 8 8 8 8 5 4 5 9 8 4 9 5 9 8 5 8 8 8 8 4 4 8 9 7 5 8 8 5 4 9 7. Suddvdere le varabl 4 class d uguale ampezza e costrure la corrspodete tabella.. Calcolare meda e varaza delle due varabl prma co dat della tabella d parteza e po co quella della tabella co quattro class.. Commetare rsultat otteut. Peso Totale Altezza Totale Meda Varaza Dat orgal Dat dvs class

- - Eserczo. Soo rportat d seguto le durate, a, degl stud comput da persoe:, 8, 8,, 8, 8,, 8, 8, 8,, 9, 4, 8, 8, 4, 8,,, 8. Costrure l stogramma degl a d studo Dre quate persoe hao studato almeo a. Completare la tabella seguete: A d studo x 8 4 8 9 Total x x x Utlzzado valor rportat ella tabella precedete, calcolare: l valore medo del umero d a d studo (co ua cfra decmale); m= lo scarto quadratco medo del umero d a d studo (co due cfre decmale) σ =

- - Eserczo. Per u perodo d gor, l umero d scosse del terreo rlevate da u ssmografo; dat soo seguet: 8, 8,, 7, 9, 9, 8,, 8, 9,, 9, 9,,, 9, 7, 9,, 9 Traccare, u opportuo sstema d ass, l stogramma de dat rlevat. Per quat gor s soo rlevate pù d 5 e meo d scosse? Costrure la tabella sotto rportata: x x x x 7 8 9 Total Utlzzado valor determat ella tabella precedete, calcolare la meda e lo scarto quadratco medo del umero d scosse al goro del terreo. Eserczo.4 La fgura rporta l stogramma del umero d putate d u cartoe amato vste da bamb. Dre quat bamb: - hao vsto putata; - hao vsto putate; - hao vsto pù d putate.

- - Costrure la tabella seguete. x x x x 4 5 Total Utlzzado valor determat ella tabella precedete, calcolare la meda e lo scarto quadratco medo del del umero d putate vste da bamb;

- - 7. Relazo fra varabl quattatve Le relazo fra varabl qualtatve vegoo esamate costruedo tabelle cogute o grafc a barre. I che modo puó essere studata la relazoe fra due varabl quattatve X e Y msurate su utà statstche? Covaraza cov( X, Y ) = ( x x )( y y ) = xy xy Coeffcete d correlazoe leare d Pearso ( x x)( y y) Cov( X, Y ) ( XY, ) = = var( X) var( Y) var( X) var( Y) ρ La covaraza e la correlazoe hao lo stesso sego. La dffereza cosste el fatto che la correlazoe é u dce, coé u valore dpedete dalle utà d msura delle varabl X e Y. La covaraza ha vece quale utà d msura l prodotto delle utà d msura d X e Y. Esempo 7. S puo oltre verfcare che ρ( XY, ). Covaraza postva Correlazoe=.89 Meda d X = 58. m Meda d Y = 58. m

- 4 - Covaraza egatva Correlazoe= -.9 Meda d X =.8 kg Meda d Y = 59 m Covaraza postva Correlazoe=.59 Meda d X =.cm Meda d Y =.8 dl Esempo 7. Nella tabella seguete soo rportat valor d =9 coppe (x,x ) cu soo stat cambat gl appaamet fra x e x. A B C D x x x x x x x x 8 4 4 9 4 9 8 9 8 9 4 4 8 8 8 4 8 4 4 4 4 4 4 4 4 4 4 4 4 49 4 49 4 49 4 49 8

- 5 - I grafc seguet rappresetao gl scatterplot d x e x e l coeffcete d correlazoe. covaraza=8.4 correlazoe = covaraza=8.4 correlazoe =.79 covaraza=5. correlazoe =. covaraza=. correlazoe =. Eserczo 7. I dat seguet s rferscoo a cost d produzoe d u prodotto rspetto alla quatta' goralera prodotta : Cost (Y) 8 4 4.pezz (X) 4 4 Calcolare l valore medo e la varaza d X e Y. Dsegare l grafco delle varabl. Calcolare l valore della covaraza e della correlazoe fra X e Y.

- - 8. Relazo fra varabl qualtatve ordal Il rago Sa X ua varable statstca cu valor soo stat rlevat rspetto ad utà, otteedo le osservazo x, x, x,... x. E possble assocare a cascua osservazoe l rago modo da otteere ua graduatora. Il rago d u osservazoe è la poszoe che essa occupa ella sequeza ordata de dat. Esempo 8. La tabella sottostate rporta l puteggo, dcato medate la varable statstca X, otteuto da quattro studet u test. Nella terza coloa soo rportat ragh delle osservazo, ossa la poszoe che cascua d esse occupa ella sequeza ordata. Utà X Rago Paolo 7 Luca Fracesca 4 4 Fabo Medate ragh s ottee la graduatora fra le utà: Fabo al prmo posto, Paolo al secodo, Luca al terzo e Fracesca al quarto. Se a due o pù utà è assocato lo stesso valore della varable X, è prass defre l rago d queste utà come la meda artmetca delle poszo occupate da valor ugual. Esempo 8. La tabella sottostate rporta l puteggo, dcato medate la varable statstca X, otteuto da cque studet u test. Luca e Luca hao coseguto lo stesso puteggo e qud occupao, rspetto alla sequeza ordata de valor, la terza e la quarta poszoe. Ad etrambe queste utà è assocato rago.5. Utà X Rago Paolo 7 Luca.5 Fracesca 4 5 Fabo Luca.5

- 7 - Coeffcete d correlazoe d Spearma. Il coeffcete d correlazoe de ragh d Spearma cosete d cofrotare due graduatore al fe d verfcare se v è assocazoe e, caso postvo, se v è cocordaza oppure dscordaza. S suppoga che base a due varabl X e Y sao state defte due graduatore sulle stesse utà statstche. I dat soo rportat come avvee ella tabella sottostate, dove rx ( ) e r( y ) dcao l rago della -esma utà rspettvamete ella prma e ella secoda graduatora. Utà X Y rx ( ) r( y ) rx ( ) r( y ) rx ( ) r( y ) Per otteere l coeffcete d correlazoe de ragh è ecessaro calcolare, per cascua utà, le dffereze fra ragh elle due graduatore. Ad og utà è assocata la dffereza d = rx ( ) ry ( ) Il coeffcete d correlazoe de ragh d Spearma (dal ome dello pscologo Charles Spearma che lo deò el 94 avedo quale scopo ache ua semplfcazoe de calcol) è dato da: ρ S = d ( ) Il coeffcete d correlazoe de ragh assume valor ell tervallo [,]. Il coeffcete d correlazoe per ragh può ache essere calcolato utlzzado la formula del coeffcete d correlazoe d Pearso dove valor vegoo covertt ragh prma d calcolare l coeffcete. ( rx ( ) r)( ry ( ) r) X Y ρ P = ( rx ( ) rx ) ( ry ( ) ry) rx ( ) ry ( ), co rx = e ry = S può dmostrare che ρs = ρp quado o c soo dat rpetut oppure ρs ρp se l umero d dat rpetut è pccolo rspetto al umero totale de dat [ved allegato.] Perfetta cocordaza fra le graduatore ρ S = + : quado l coeffcete d correlazoe de ragh vale v è perfetta cocordaza fra le graduatore. Cò sgfca che l utà classfcata come prma ella graduatora rspetto ad X lo è ache ella graduatora rspetto a Y, l utà classfcata come secoda ella graduatora rspetto ad X lo è ache ella graduatora rspetto a Y e così va : rx ( ) = ry ( ) per,,...,.

- 8 - Perfetta dscordaza fra le graduatore ( asseza d dat rpetut) ρ S = : quado l coeffcete d correlazoe de ragh vale v è perfetta dscordaza fra le graduatore. Cò sgfca che l utà classfcata come prma ella graduatora rspetto ad X è ultma della graduatora rspetto a Y, l utà classfcata come secoda ella graduatora rspetto ad X è peultma ella graduatora rspetto a Y e così va : rx ( ) = ry ( ) + per,,...,. Nel caso d dat rpetut sa ρs che ρ P possoo o essere ugual a -. Asseza d assocazoe fra le graduatore ρ S = : se l coeffcete d correlazoe de ragh vale zero, cò dca che o v è assocazoe fra le graduatore. Esempo 8. ( ρs = ρp quado o c soo dat rpetut) ρ S X rx ( ) Y r( y ) 5 4 5 5 4 5 (( ) + ( ) + ( ) + ( ) ) ( ) d 4 4 = = = ( ) 4 ( rx ( ) r)( ry ( ) r) X Y ρ P X Y ( rx ( ) rx ) ( ry ( ) ry) [ essedo r = r,5] = = = (,5)( 4,5) + (,5)(,5) + (,5)(,5) + ( 4,5)(,5) (,5) + (,5) + (,5) + ( 4,5) ( 4,5) + (,5) + (,5) + (,5) = = = Esempo 8.4 ( ρs ρp quado c soo dat rpetut) ρ S x rx ( ) y r( y ) 5 5,5 4,5,5 4,5 5 5 (( ) + ( ) + ( ) + ( ) + ( ) ) ( ) d 5,5 4,5,5 4,5 5 = = =.85 ( ) 5 5 ( rx ( ) r)( ry ( ) r) X Y ρ P X Y ( rx ( ) rx ) ( ry ( ) ry) [ essedo r = r ] ( )( 5 ) + (,5 )( 4 ) + (,5 )(,5 ) + ( 4 )(,5 ) + ( 5 )( ) ( ) + (,5 ) + (,5 ) + ( 4 ) + ( 5 ) ( 5 ) + ( 4 ) + (,5 ) + (,5 ) + ( ) =,9 = = = = =

- 9 - Esempo 8.5 ( ρs ρp quado valor rpetut o soo frequet rspetto alla umerostà campoara) I dat seguet s rferscoo a valor de putegg d due gare (A e B) rfert a 8 atlet. Atlet Gara A Gara B Rago Rago Gara A Gara B 4, 7 94 4, 9 4 7 8, 4,5 5 78 4 5 5, 8,5 7 5 8 7, 8 8, ρ S =,54, ρ P =,59 Come s può osservare valor d ρs e ρpdfferscoo d poco essedo la dffereza par a,. Esempo 8. ( ρs ρpquado valor rpetut soo frequet rspetto alla umerostà campoara) Studet Vot matera A Vot matera B Rago vot matera A Rago vot matera B 4 5,5 4,5 4 5,5 4,5 4 5,5 4,5 4 4 5,5 4,5 5 5 5,5 4,5 5 5,5 4,5 7 5 5,5 4,5 8 5 5,5 4,5 9 7,5 7,5 7,5 7,5 7,5 7,5 7,5 7,5 7,5 7,5 4 7,5 7,5 5 7 7,5,5 7 7,5,5 7 7 7,5,5 8 7 7,5,5 9 7 7,5,5 7 7,5,5 ρ S =,5 ρ P =, Come s può osservare valor d ρs e ρpdfferscoo abbastaza essedo la dffereza par a,.

- - Eserczo 8. Nella seguete tabella (estratta dal sto www.morgstar.t) soo rportat l redmeto YTD% (Year To Date) e l rscho Dev Std (a) (calcolato come la devazoe stadard de redmet egl ultm tre a) al maggo d alcu fod azoar gestt da Geeral. Costrure la graduatora de fod rspetto al Redmeto e al Rscho. Costrure l grafco relatvo a ragh delle due varabl. Calcolare l coeffcete d correlazoe de ragh delle varabl del puto. Nome Fodo YTD% Dev Std ( a) Geeral IS AR Credt Strateges AX 9,8, Geeral IS AR Credt Strateges AY 4,9,8 Geeral IS AR Credt Strateges BX 4,9,9 Geeral IS AR Credt Strateges CX 4,9, Geeral IS AR Credt Strateges DX 4,8,54 Geeral IS AR Credt Strateges EX 4,8,4 Geeral IS AR Global Macro AX,8,44 Geeral IS AR Global Macro BX,,44 Geeral IS AR Global Macro CX,57,8 Geeral IS AR Global Macro DX,47,7 Geeral IS AR Global Macro EX,5, Geeral IS AR Mult Strateges AX 4,79,4 Eserczo 8. Nella tabella seguete soo rportat valor del tempo secod su m e m d 8 atlet u meeetg estvo. Atleta m m A.. B 9.98 9.8 C. 9.4 D..5 E 9.89. F 9.9 9.5 G.. H.5. Costrure la graduatora delle due varabl (m e m). Costrure l grafco relatvo a ragh delle due varabl. Calcolare l coeffcete d correlazoe de ragh delle varabl del puto.

- - Allegato. Dmostrazoe dell equvaleza delle formule relatve a coeffcet d correlazoe per ragh d Spearma e Pearso el caso d dat NON rpetut. I questa dmostrazoe s dca, per semplctà d otazoe, co r l rago d x e co s l rago d y. Se le varabl X e Y soo rlevate su N utà statstche e o c soo valor d x e y rpetut, rspettv ragh r e s assumoo valor ter fra e N. Essedo : N N( N + ) = N N( N + )(N + ) = resta facle calcolare: N N( N + ) N + r = s = = = N N N N N N + ( r r) ( N + ) ( N + )(N + ) ( N + ) N σ r = = = = = N N N N N N N + ( s s) ( N + ) ( N + )(N + ) ( N + ) N σ s = = = = = N N N N N N N + Cov(,) r s = ( r r )( s s) = rs rs = rs N N N Qud s ottee N N N + N + ( r r)( s s) rs rs Cov(,) r s N N N ρp (,) rs = = = = σσ r s N N N ( r r) ( s s) N N

- - Co la formula che calcola l coeffcete d correlazoe d Spearma s ottee : ( ) d r s r + s rs ρs (,) rs = = = = N( N ) N( N ) N( N ) N( N + )(N + ) N( N + )(N + ) N( N + )(N + ) + rs rs = = N( N ) N( N ) Resta da dmostrare che: Ifatt: N N + N( N + )(N + ) rs rs N = N N( N ) ( ) N N + N( N + )(N + ) rs rs N = N N( N ) N N N N( N ) ( N( N + )(N + ) ) + rs N = 4 rs + N 4 N N( N ) rs N( N + ) ( ) N N = ( ) ( ) N N N( N + )(N + ) + rs N( N ) N N N = N N ( N + N)(N + ) N N N = N N 4N N 4N N N N N = N N N

- - 9. Regressoe leare fra varabl quattatve S effettua ua regressoe leare quado s vuole stablre se esste u rapporto d dpedeza leare fra due varabl X e Y rlevate sulle stesse uta statstche. S vuole altre parole stablre se la varablta d Y puo essere (ache solo parte) mputata alla varable X. S ot che questo caso o e d teresse stablre se le varabl X e Y varao modo coguto e stablre l loro grado d assocazoe. Teccamete l problema cosste el cercare due valor real a e b tal che la retta y=ax+b pass l pu vco possble a quas tutt put. La determazoe aaltca de valor d a e b s effettua cercado d mmzzare la quatta seguete : ( y -( )) ax + b Nota : perche s mmzzao quadrat delle dffereze e o le dffereze, e o l valore assoluto delle dffereze? S puo otare che la quatta y -( ax + b) rappreseta la dffereza d ordata fra l valore della retta el puto x e l puto y come rportato ella fgura seguete. I valor d a e b che vegoo determat modo aaltco soo : cov( XY, ) cov( XY, ) a = b= y- x var( X) var( X) L equazoe della retta sara qud : cov( XY, ) y = ( x x ) + y var( X ) I valor che s ottegoo sosttuedo valor d x ella formula sopra e che rappresetao valor della varable y stmat dalle retta d regressoe s dcao co y ˆ. Le quatta r = y yˆ s chamao resdu.

- 4 - I grafc seguet rappresetao alcu esemp d scatterplot d varabl X e Y, coeffcet d correlazoe e l grafco delle rette d regressoe y fuzoe d X e vceversa.

- 5 - Ad esempo s vuole effettuare ua regressoe fra le varabl X e Y cu valor soo rportat tabella. X Y 8 4 78 7 555 5 45 55 57 5 58 L equazoe della retta (co valor approssmat agl ter) e : y = 77 - x Per calcolare valor de resdu e bee costrure la tabella seguete : x y ax b 8 4 78 7 555 5 45 55 57 5 58 + y -( ax + b) I segmet vertcal che uscoo la retta e put (x,y) rappresetao valor de resdu.

- - 9. Aals della Varaza Sao (x,y ), (x,y ),,(x,y ) valor d due varabl quattatve X e Y rlevat su utà cov( XY, ) statstche (osservazo) e sa yˆ = ( x x) + y l equazoe della retta d regressoe d Y var( X ) fuzoe d X. x, y e quell sulla retta d regressoe co x, y. I put spermetal s dcao co ( ) ( ) Iaztutto s può faclmete verfcare che ŷ = y se l modello d regressoe preseta l terme costate, ovvero cov( XY, ) ( x) + y. var( X ) cov( XY, ) ( - ) Ifatt y x x + y var( X ) = = cov( XY, ) y = = = (( x - x) ) y y var( X) + =, essedo (( x - x) ) =. S vuole dmostrare algebrcamete che la varaza d Y s decompoe ella somma della varaza d Y e della varaza d r = Y -Y, ovvero che σ = σ + σ. Precsamete s ha: ( ) Y Var( Y ) = σ Y = y y = varaza totale ( ) Var( Y ) = σ = y y varaza spegata dal modello Y = ( ) ( ) Var( r) = var( Y - Y ) = σ ˆ r = r r = y y = varaza resdua essedo COV ( X, Y ) COV ( X, Y ) r = ( y ˆ y) = y ( x x) y = y ( x x) y = VAR( X ) VAR( X ) Y r

- 7 - ( ) (( ˆ ) ( ˆ )) ( ˆ ) ( ˆ Y ) Var( Y) = σ = y y = y y + y y = y y + y y + + = + = + ( y yˆ )( yˆ y) y ( y yˆ ) ( yˆ y) σ σ r Y ˆ ˆ =. essedo ( y y )( y y) Ifatt : ( y ˆ )( ˆ y y y) = y ( x - x) + y ( x - x) + y y cov( XY, ) cov( XY, ) = y y ( x - x) ( x - x) = var( X) var( X) XY cov(, ) cov (, ) = ( y y)( x - x) ( - ) x x = var( X) var ( X) cov( XY, ) cov ( XY, ) = ( cov( XY, )) var( X) = var( X) var ( X) cov( XY, ) cov( XY, ) = var( X) var( X) XY U dce che permette d valutare l adeguatezza del modello è l coeffcete d determazoe σ Y varaza spegata R = =, che rappreseta quale parte della varaza totale è spegata dalla retta σ Y varaza totale d regressoe. Co semplc calcol è facle verfcare che σ r varaza resdua R = =. σ varaza totale Ad esempo se R =,8 sgfca che la regressoe leare fra X e Y spega l 8% della varabltà d Y attoro a Y ed esste u resduo d varabltà par al 9% o spegata dalla retta d regressoe ed attrbuble alla varazoe casuale d r. ( ) ( ) ( ) σ Y L dce R = può essere defto ache come R = ρ YY,. Ioltre el ostro caso, cu v σ Y è ua sola varable esplcatva, vale l uguaglaza ρ YY, = ρ XY,. Y Dmostramo per prma cosa che ρ ( ) YY, = ρ ( XY, ) : a ρ ( YY, ) ρ ( YaX, b) = + = ρ ( XY, ) = ρ ( XY, ). a σ Y Ora provamo che R = = ρ ( XY, ): σ σ Y cov( XY, ) cov ( XY, ) ( ˆ r y y) y y ( x ) x ( y y) ( ) 4 x x σ X σ X = = = + + cov( XY, ) cov ( XY, ) cov ( XY, ) cov ( XY, ) = + = σ σ σ σ ( x x)( y y) σy σ Y X X X X

- 8 - Pertato cov ( XY, ) cov ( XY, ) σ σ σ σ = = = + = ( XY). σ σ σ σ σ Y Y r X X ρ, Y Y Y Y Esempo 9. I dat seguet s rferscoo a due varabl X e Y. Calcolare meda,varaza, mmo, massmo, Q e Q d X e Y. Calcolare l coeffcete d correlazoe fra X e Y. Dsegare l grafco delle varabl. Scrvere l'espressoe della retta d regressoe d Y fuzoe d X e dsegarla el grafco precedete. Costrure la tabella de resdu per oguo de valor assut da X. X Y 8 8 4 9 5 4 Rsoluzoe Per effettuare cot e utle costrure la seguete tabella : X Y X*Y X Y 8 88 5 4 8 89 784 4 88 89 9 4 9 9 9 5 5 4 54 9 5 4 89 5 totale 7 9 57 54 48 7 x x = = = 8.7 y = y =... cov( XY, ) ρ ( XY, ) = =... var( X) var( Y) cov( X, Y) = xy - xy=... Y y ( y) var( ) = - =... Meda Varaza Mmo Massmo Q Q X 8.7 4.9 5 Y 8 9 8.5

- 9 - cov( XY, ) la retta d regressoe e : y = ( x - x ) + y =... var( X ) Tabella de resdu X Y ax+b Y-(aX+b) 8 8 4 9 5 4 4 Esempo 9. Allo scopo d massmzzare la produzoe d ua pata (peso) dalle caratterstche partcolarmete teressat chamata Poplar (ua spece smle al Poppo), rcercator della Pesylvaa State Uversty pataroo alcu esemplar d Poplar Cloe 5. Le varabl esamate furoo dametro(m), altezza (m) e peso (t). D seguto soo rportat grafc bdmesoal delle tre varabl. Peso vs Altezza Altezza vs Dametro 7 Peso 5 4 Altezza 8 4 4 Altezza 8 4 5 Dametro 7 8 9

- 4 - Peso vs Dametro 7 5 Peso 4 4 5 Dametro 7 8 9 Osservado grafc s ota che le varabl che s possoo potzzare legate da ua relazoe leare soo Altezza e Dametro. S effettua allora ua regressoe leare dell altezza fuzoe del dametro. D seguto è rportata ua parte dell output Mtab Altezza =,7 +, Dametro R = 87,8% Source SS Regresso 4,8 Error 59, Total 5,79 Qud: ( y y) ( yˆ y) SS( total) 5,79 σ Y = = = = 4,4 95 SS( regresso) 4,8 σ = = = =,887 Y 95 ( y ˆ ) y SS( error) 59, σ r = = = =,59 95 Altezza =,7 +, Dametro R-Sq 87,8% 8 Altezza 4 4 5 Dametro 7 8 9 Il grafco de resdu rportato sotto evdeza come o sao osservabl relazo fra le due varabl resdu e valor fttat e qud è possble cocludere che samo preseza d ua buoa approssmazoe leare fra altezza e dametro, cofermata ache dal valore elevato d R.

- 4 - Grafco de Resdu (respose s Altezza) Resdu - - - -4 4 5 7 Valor fttat d Y 8 9 Che cosa succede se s vuole effettuare ua regressoe leare se le varabl sembrao o avere ua relazoe d tpo leare? Provamo, ad esempo, ad effettuare ua regressoe leare fra peso e dametro. Peso = -,57 +,95 Dametro R = 8,% Source SS Regresso 77,58 Error 59,79 Total 87,7 Peso = -,57 +,95 Dametro 7 R-Sq 8,% 5 4 Peso - - 4 5 Dametro 7 8 9

- 4 - Il grafco de resdu rportato sotto evdeza come sa osservable ua relazoe d tpo quadratco fra le due varabl resdu e valor fttat e qud è possble cocludere che o samo preseza d ua buoa approssmazoe leare fra altezza e dametro, ache se l valore d R è puttosto elevato. Grafco de Resdu Resdu - - - - Valor fttat d Y 4 5 Per ovvare a cò spesso s effettua ua trasformazoe della varable rsposta utlzzado l versa della fuzoe che sembra legare le due varabl. Pertato effettuamo ua regressoe leare fra le varabl Dametro (X) e Peso. Il rsultato otteuto è: Peso = -,45 +,587 Dametro R = 9,7% Source SS Regresso 9,58 Error 8, Total 8,45,,5 R-Sq 9,7% sqrt(peso) = -,45 +,587 Dametro, sqrt(peso),5,,5, 4 5 Dametro 7 8 9

- 4 - I grafc de resdu rportat sotto (a sstra quello relatvo a dat orgal e a destra quello relatvo a dat trasformat) evdezao come la trasformazoe abba parzalmete elmato la relazoe quadratca fra resdu e valor fttat de dat orgal e qud è possble cocludere che samo preseza d ua buoa approssmazoe leare fra Peso e dametro, cofermata ache dal valore pù elevato d R (da 8,% a 9.7%). Dat orgal Dat trasformat Grafco de Resdu Grafco de resdu,5,5 Resdu Resdu, -,5 - -,5 - - - Valor fttat d Y 4 5 -,75,,5,,5 Valor fttat,,5 Eserczo 9. I dat seguet s rferscoo a cost d produzoe d u prodotto rspetto alla quatta' goralera prodotta : Cost (Y) 8 4 4.pezz (X) 4 4 Calcolare l valore medo d X e Y. Dsegare l grafco delle varabl X e Y. Calcolare l valore della correlazoe fra X e Y. Scrvere l'espressoe della retta d regressoe d Y fuzoe d X. Calcolare l valore del resduo relatvo al valore d x = 4 Eserczo 9. I dat seguet s rferscoo a valor d u parametro chmco del sague prma (CH) e dopo (CH) aver gerto u farmaco. CH CH 7 94 9 4 4 5 78 4 8 7 5 8 8 Calcolare l valore medo d CH e CH. Dsegare l grafco delle varabl CH e CH. Calcolare l valore della correlazoe fra CH e CH. Scrvere l'espressoe della retta d regressoe d CH fuzoe d CH. Costrure la tabella de resdu per oguo de valor assut da CH.