Vogliamo ora riprendere i concetti principali per poi applicarli a qualche esempio concreto.

Documenti analoghi
Caso studio 10. Dipendenza in media. Esempio

Caso studio 12. Regressione. Esempio

Lezione 4. La Variabilità. Lezione 4 1

Gli indici sintetici Forma. Gli indici sintetici. Gli indici sintetici. Qualche considerazione. Qualche considerazione. Tendenza centrale Forma

Gli indici sintetici Forma. Un caso studio. Gli indici sintetici. Qualche considerazione. Qualche considerazione. Tendenza centrale Forma

Università di Cassino. Esercitazioni di Statistica 1 del 26 Febbraio Dott. Mirko Bevilacqua

MEDIA DI Y (ALTEZZA):

Variabilità = Informazione

Due distribuzioni, stessa media ma in quale delle due la media rappresenta, sintetizza meglio la situazione?

I percentili e i quartili

LE MEDIE. Quadratica. Italo Nofroni. Statistica medica. Medie. Le medie vengono classificate in due gruppi

Università di Cassino Esercitazioni di Statistica 1 del 5 Febbraio Dott. Mirko Bevilacqua

Indici di asimmetria. Elementi di Statistica descrittiva Parte IV. Simmetria di una distribuzione di frequenze. Primo indice di asimmetria (1/3)

Analisi dei Dati. La statistica è facile!!! Correlazione

Voti Diploma Classico Scientifico Tecn. E Comm Altro

Istogrammi e confronto con la distribuzione normale

Caso studio 2. Le medie. Esercizio. La media aritmetica. Esempio

Esercitazione 5 del corso di Statistica (parte 1)

LEZIONI DI STATISTICA MEDICA

CORSO DI STATISTICA I (Prof.ssa S. Terzi)

Classi di reddito % famiglie Fino a Oltre Totale 100

INDICI DI VARIABILITA

Capitolo 6 Gli indici di variabilità

Dott.ssa Marta Di Nicola

LE MEDIE. Quadratica. Italo Nofroni. Statistica medica. Medie. Le medie vengono classificate in

Esercizi su Rappresentazioni di Dati e Statistica

La classe che mostra la distribuzione più elevata è quella 60-90, che corrisponde a un uso elevato dell automobile. f i fr (= f i/n) fr% (=fr*100)

Statistica descrittiva per l Estimo

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 9: Covarianza e correlazione

Il termine regressione fu introdotto da Francis Galton ( ), antropologo (promotore dell eugenetica).

Matematica elementare art.1 di Raimondo Valeri

Facoltà di Farmacia Corso di Matematica con elementi di Statistica Docente: Riccardo Rosso

CORSO DI STATISTICA I (Prof.ssa S. Terzi) 1 STUDIO DELLE DISTRIBUZIONI SEMPLICI. Esercitazione n 3

b) Relativamente alla variabile PREZZO, fornire una misura della variabilità della distribuzione attraverso

LE MEDIE. Le Medie. Medie razionali. Medie di posizione

Elementi di Statistica descrittiva Parte III

Interpolazione. Definizione: per interpolazione si intende la ricerca di una funzione matematica che approssima l andamento di un insieme di punti.

Sommario. Facoltà di Economia. Obiettivo. Quando studiarla? Lezione n 7. X: carattere quantitativo tra le unità statistiche. Quando studiarla?

x... Gli indici sintetici La media aritmetica Gli indici sintetici Indici assoluti Indici relativi Indici normalizzati Forma

Funzioni di più variabili Massimi e Minimi una funzione definita in un insieme E. Un punto ( x0, y0)

STATISTICA DESCRITTIVA - SCHEDA N. 3 VARIABILI QUANTITATIVE Indici di centralità, dispersione e forma

LA REGRESSIONE LINEARE SEMPLICE

Associazione tra due variabili quantitative

frazione 1 n dell ammontare complessivo del carattere A x

Università degli Studi di Napoli Parthenope. Facoltà di Scienze Motorie a.a. 2011/2012. Statistica. Lezione IV

Indipendenza in distribuzione

Le misure di variabilità

Elementi di Statistica descrittiva Parte II

Lezione 4. Metodi statistici per il miglioramento della Qualità

Università della Calabria

MISURE DI TENDENZA CENTRALE. Psicometria 1 - Lezione 2 Lucidi presentati a lezione AA 2000/2001 dott. Corrado Caudek

dei quali si conoscono solo la media x e la deviazione standard σ e dato un valore reale positivo K, possiamo affermare che:

STATISTICA DESCRITTIVA

Statistica descrittiva

valido se i dati E dato da max(x i )-min(x i )

La distribuzione statistica doppia (o bivariata)

Aritmetica 2016/2017 Esercizi svolti in classe Quarta lezione

6. LA CONCENTRAZIONE

III Esercitazione: Sintesi delle distribuzioni semplici secondo un carattere qualitativo ordinale.

SIMULAZIONE DI SISTEMI CASUALI 1 parte. Variabili casuali e Distribuzioni di variabili casuali. Calcolo delle probabilità

Il campionamento e l inferenza

Regressione e Correlazione

Variabili casuali ( ) 1 2 n

SERVIZIO DAF: FONTI STATISTICHE

Dimostrazione della Formula per la determinazione del numero di divisori-test di primalità, di Giorgio Lamberti

Lezione 13. Anelli ed ideali.

STATISTICA DESCRITTIVA - SCHEDA N. 4 VARIABILI QUANTITATIVE Trasformazioni lineari Indici di covarianza e correlazione

STATISTICA DESCRITTIVA modulo 1 Corso di Laurea SMID Elda Guala e Ivano Repetto Dipartimento di Matematica - Università degli Studi di Genova

Indici di Posizione. Gli indici si posizione sono misure sintetiche ( valori caratteristici ) che descrivono la tendenza centrale di un fenomeno

Capitolo 2 Errori di misura: definizioni e trattamento

Propagazione di errori

3 Variabilità. variabilità. Senza deviazione dalla norma il progresso non è possibile. (Frank Zappa) Statistica - 9CFU

Francesco Ciatara ELEMENTI STATISTICA

Stim e puntuali. Vocabolario. Cambiando campione casuale, cambia l istogramma e cambiano gli indici

Laboratorio di Fisica I: laurea in Ottica e Optometria. Misura di una resistenza con il metodo VOLT-AMPEROMETRICO

TRATTAMENTO STATISTICO DEI DATI ANALITICI

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER ATTRIBUTI

Lezione 3. Gruppi risolubili.

ESERCITAZIONE NUMERO 4

Tabelle Statistiche. Massimo Alfonso Russo Dipartimento di Scienze Economiche, Matematiche e Statistiche Università di Foggia

Design of experiments (DOE) e Analisi statistica

ELABORAZIONE DEI DATI

Prof.ssa Paola Vicard

Premessa. Abbiamo più volte enfatizzato come questo processo di sintesi comporta un prezzo da pagare in termini di perdita di informazioni.

FUNZIONI LOGICHE FORME CANONICHE SP E PS

Numeri complessi Pag. 1 Adolfo Scimone 1998

STATISTICA DESCRITTIVA

CALCOLO DEGLI INDICI STATISTICI

ELEMENTI DI STATISTICA DESCRITTIVA

Capitolo 4 Le Misure di Centralità

Sommario. Facoltà di Economia francesco mola. Distribuzioni (cont.) Distribuzioni di frequenza. Distribuzioni Distribuzioni di quantità

Rappresentazioni analitiche delle distribuzioni

Sommario. Corso di Statistica Economia e Commercio. Distribuzioni (cont Distribuzioni di frequenza. Distribuzioni

Def. Si dice variabile aleatoria discreta X una variabile che può assumere valori X1, X

NOTA METODOLOGICA PER L ANALISI DELLE CAUSE DI MORTE

Capitolo 17. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 17.1: Suggerimento

Il modello di regressione lineare semplice (1) Studio della dipendenza riepilogo

ESERCIZI SU DISTRIBUZIONI CAMPIONARIE

corrispondenza della generica i-esima modalità. Indicando con #(.) la cardinalità di un insieme, per esse si ha, rispettivamente:

DI IDROLOGIA TECNICA PARTE II

Transcript:

UNITA 13 PARTE PRIMA STATISTICA DESCRITTIVA: RICHIAMI E APPROFONDIMENTI Par.1 Popolazoe e dat statstc Nel beo ha zato a studare come s descrvoo, s rappresetao e s terpretao cosddett feome collettv, coè tutt que feome che teressao ua popolazoe, tesa come seme fto o fto d soggett che hao caratterstche comu. Questo è argometo d teresse della statstca, che rguarda metod scetfc per raccoglere, ordare, rassumere, presetare ed aalzzare dat, sa per trare valde cocluso, sa per predere ragoevol decso. Voglamo ora rpredere cocett prcpal per po applcarl a qualche esempo cocreto. Iaz tutto precsamo che è detta statstca descrttva la fase della statstca che cerca solo d aalzzare e descrvere u certo campoe, seza cercare d trarre partcolar cocluso su u gruppo pù vasto. E vece detta statstca duttva o fereza, la fase della statstca che studa le codzo sotto le qual dall aals d u campoe, s cercao d dedurre (ferre) cocluso per l tera popolazoe. Sa gà che ua qualuque dage statstca passa attraverso vare fas, che possamo brevemete stetzzare : aals del problema, per charre qual è lo scopo dell dage, a ch è rvolta, e qual è l campoe d popolazoe tra cu raccoglere dat, ecc. raccolta e trascrzoe de dat elaborazoe de dat raccolt È dspesable defre modo precso l obettvo della rcerca, per dvduare correttamete le formazo che servoo ed evtare d raccoglere dat che possoo cofodere. E però altrettato dspesable raccoglere dat co cura: se la fote è l Istat, dat soo dspobl ache sul sto, ma qualuque sa la fote d proveeza de dat, occorre verfcare la data d aggorameto. Par.1.1 Le rappresetazo Scuramete rcord che, dopo aver raccolto qualche modo dat da aalzzare, s possoo tabulare utlzzado: tabelle semplc, tabelle multple o tabelle a doppa etrata; partcolare s chama sere statstca la tabella che cotee le modaltà d u carattere qualtatvo e le relatve frequeze; s chama vece serazoe statstca la tabella che cotee le modaltà d u carattere quattatvo e le relatve frequeze e s possamo rappresetare grafcamete, ache utlzzado software appost, medate: stogramm (barrette orzzotal o vertcal cosecutve), ortogramm (barrette separate), aerogramm (torte), deogramm (fgure stlzzate che rchamao l coteuto del feomeo), cartogramm (zoe colorate su ua carta geografca) o acora dagramm cartesa

Queste tecche hao lo scopo d dare coosceza vsva mmedata d u feomeo. Par.1. Le varabl dscrete e cotue I statstca s usa spesso l terme varable. Rcordera certamete che ua varable è u smbolo che può assumere valor all tero d u certo seme, ormalmete detto domo. Ua varable è detta cotua se può assumere, almeo teorcamete, qualuque valore compreso tra altr due valor cosecutv. Ad esempo l altezza h d ua persoa è ua varable cotua perché può assumere qualuque valore, ache relazoe alla precsoe dello strumeto usato per msurare. I caso cotraro la varable è detta dscreta; ad esempo ua persoa può avere 1 bccletta, oppure o pù, ma certamete o 1,5 o 3,1 bcclette. Come cosegueza d cò, dat come le altezze, pes, ecc. coè tutte le msurazo, soo dat cotu; vece tutte le eumerazo forscoo dat dscret. Par. 1.3 I dat: arrotodamet, otazo scetfche Poché spesso le cfre cotegoo decmal, rcorda che geeralmete s arrotoda secodo regole precse; ad esempo se voglamo arrotodare a due cfre decmal l umero 5, 8146 s usa 5, 81 perché è molto pù vco al umero vero che o 5, 8. Se vece voglamo compere la stessa operazoe co 7, 815 potremmo essere cert se sceglere 7,81 o 7, 8. La regola questo caso prevede d arrotodare al umero par che precede l 5, così sceglamo 7, 8. D cosegueza 13, 865 s arrotoda a 13, 86. Quado umer dvetao molto grad o molto pccol, soprattutto se hao molt zer, è coveete usare la otazoe scetfca che s basa sulle poteze d 10 e sulle propretà delle poteze che gà coosc. Esemp La scrttura 1,3 10 8 8 1,3 10 ha l effetto d spostare la vrgola d 8 post verso destra, per cu 130.000.000 La scrttura 146, 10 5 5 146, 10 ha vece l effetto d spostare la vrgola d 5 post verso sstra, per cu 0,00146 Dveta così u po pù facle esegure operazo come l prodotto de due precedet umer, basta sfruttare le propretà delle operazo e delle poteze: 1,3 10 8 146, 10 5 1,3 146, 10 8 10 5 190,06 10 3 190.060 oppure acora 3.000.000 0,0000000005 3 10 6 5 10 10 15 10 4 0,0015 Eleca tu le propretà che soo state applcate etramb cas precedet.

Prova tu Arrotoda all utà pù prossma umer: 48, 6 e 5, 3 Sol. 49 e 5 Arrotoda al secodo decmale umer:, 483 e 41, 68 Sol., 48 e 41, 63 Utlzzado la otazoe scetfca, calcola: 0,003 5.000 0,04 Sol. 1. 875 Par. 1.4 La frequeza Nell orgazzazoe de dat ha partcolare mportaza cooscere la frequeza co cu u dato s preseta, percò s dstgue tra: la frequeza assoluta f a, che è l umero d volte cu ua modaltà s è mafestata la frequeza relatva f r, che è l rapporto tra la frequeza assoluta f a e l umero de dat raccolt, coè percetuale f p f r f a ; spesso per charezza e comodtà la frequeza relatva s esprme Par. L elaborazoe de dat: gl dc d poszoe cetrale e gl dc d varabltà L elaborazoe de dat raccolt cosste sostazalmete ella determazoe degl dc statstc, che servoo per stetzzare u uco umero alcue formazo; s dstguo dc d poszoe cetrale e dc d varabltà. Par..1 Gl dc d poszoe cetrale Per quato rguarda gl dc d poszoe cetrale, quell da cooscere prcpalmete soo: la meda artmetca la meda poderata la moda la medaa Probablmete rcord che meda artmetca, moda e medaa soo tp dvers d mede, cascuo de qual offre vatagg e svatagg e ha specfche propretà; s può oltre cosderare la meda poderata, cu ha mportaza ache l peso, coè l mportaza, attrbuto ad og valore. Esempo Uo studete uverstaro ha superato buoa parte de suo esam rportado seguet vot: 4 5 30 18 6 8 4 19 3 1 8 4 18 19 1 3 4 3 5 6 8 30 334 La meda de suo vot è: 3, 85 14 14

La moda è 4 perché l voto che s preseta co pù frequeza La medaa è l valore cetrale, se valor soo umero dspar; se vece soo umero par, come questo caso, è la semsomma de due valor cetral. Pertato, dopo aver rordato vot orde crescete o decrescete s trova 4. Nel caso d ua dstrbuzoe suddvsa class, come rappresetate d ua classe s prede l suo valore cetrale, se valor soo umero dspar oppure la meda de due valor cetral, se soo umero par. Costrusc u foglo elettroco per l calcolo d quest dc d poszoe cetrale, persoalzzalo e verfca rsultat precedet. Eserczo La tabella seguete mostra la dstrbuzoe d frequeze, dvsa class, degl stped settmaal dollar d 65 mpegat della C&R Compa d New York, per l ao 198. Stped $ 50,00 59,99 60,00 69,99 70,00 79,99 80,00 89,99 90,00 99,99 100,00 109,99 110,00 119,99 Numero d mpegat 8 10 16 14 10 5 Rferedos alla tabella, determa: a) l valore cetrale della terza classe b) l ampezza della quta classe c) la frequeza assoluta e quella relatva della terza classe d) la percetuale d mpegat che guadagao meo d 80 $ la settmaa e) la percetuale d mpegat che guadagao almeo 60 $ ma meo d 100 $ la settmaa Sol. 70,00 79,99 $ a) Il valore cetrale della terza classe è: 74,995$ arrotodable a 75,00 $ b) L ampezza della quta classe, come d tutte le altre, è: 99,99 89,99 $ 10,00 $ c) La frequeza assoluta della terza classe è 16, coè l umero d mpegat che guadagao la 16 cfra corrspodete, metre la frequeza relatva è: 0, 461 coè l 4,6% (65 è l umero 65 complessvo d dpedet) d) Somma l umero d mpegat che guadagao meo d 80 $ e rapportal al umero totale d 34 mpegat: 0, 53 coè l 5,3% 65

50 e) Co procedmeto aalogo al precedete, s ha: 0, 769 coè l 76,9%. 65 Par.. Gl dc d varabltà Spesso, soprattutto el caso d valor molto dversfcat tra loro, samo teressat ache a msurare la varabltà d tal valor, operazoe per cu s usao cosddett dc d varabltà, che prcpalmete soo: l tervallo d varazoe (o campo d varabltà) lo scarto semplce medo la varaza lo scarto quadratco medo (o devazoe stadard) Come gà detto, gl dc d varabltà soo partcolarmete mportat perché tegoo coto ache d quato sgol dat s dscostao tra loro e dalla meda artmetca, qud servoo a gudcare l grado d varabltà d u feomeo statstco. Rcordamo che: - l tervallo d varazoe è la dffereza tra l valore massmo e l valore mmo d ua sere d dat ed dca semplcemete tra qual due valor soo compres tutt gl altr - lo scarto semplce medo s è la meda artmetca de valor assolut degl scart d og sgolo umero dalla meda artmetca M de umer; smbol: s 1 M M Nel coloo: quado trov l smbolo... M 1 o pù brevemete: sgfca che dev sommare valor d e precsamete dev calcolare s 1 (s legge sommatora per che va da 1 a d M... ), 1 ; è qud ua scrttura stetca cu è la quattà che dpede dall dce, l quale deve assumere tutt valor ter tra 1 e. (fe) Esempo Calcolare l ampezza dell tervallo d varazoe e lo scarto semplce medo de umer -5 4 6 0 11. Procedamo co orde. L tervallo d varazoe è: 5, 11 la cu ampezza vale: 11 ( 5) 16 Per determare lo scarto semplce medo è ecessaro determare prma la meda M de valor, 5 4 6 0 11 coè: M 3 e l valore assoluto de sgol scart dalla meda, coè: 6 3 1, 5 3 8, 4 3 1, 6 3 3, 0 3 3, 11 3 8

1 8 1 3 3 8 A questo puto lo scarto semplce medo è: s 4. Questo rsultato sgfca 6 che medamete og valore s dscosta dalla meda d 4 utà. - La varaza è la meda artmetca de quadrat degl scart; s dca co. I smbol: M 1 M M... M 1 o pù brevemete: - Lo scarto quadratco medo, detto ache devazoe stadard, è la radce quadrata della varaza; questo dce, che s prefersce al precedete, s dca co σ e l suo valore è tato pù pccolo quato pù dat real s cocetrao attoro alla loro meda artmetca. I smbol: 1 M M... M o pù brevemete: 1 M Nel coloo: σ = 0 se gl scart dalla meda soo., coè la meda cocde co.., e questo può avvere solo se.completa tu la frase! Nota: spesso s usa u altro dce, detto coeffcete d varabltà, che è u umero puro e s defsce come rapporto tra lo scarto quadratco medo σ e la meda M: CV 100. Questo M dce è quas sempre postvo (d solto s usa co valor tutt postv), vee geeralmete espresso percetuale e c dca se ua dstrbuzoe ha maggor o mor varabltà d u altra; o può tuttava dare formazo specfche sull testà della varabltà d ua dstrbuzoe. Esempo Rferedos all esempo precedete, calcolare lo scarto quadratco medo de valor e l coeffcete d varabltà. Sfruttado calcol gà fatt, s calcola la varaza 1 8 1 3 3 8 come: 4, 6. 6 Lo scarto quadratco medo qud è: 4,6 4, 96 Il relatvo coeffcete d varabltà è valutable come CV 4,96 100 3 165,3% Eserczo Ua classe è composta da 8 alu. La msura de loro pes ha forto seguet dat chl: 70, 73,4 68,8 68,5 7,1 64 65,6 74,8 75,3 81 67,5 70,4 7,3 79,4 67,9 80, 80,5 76, 74,3 73,8 69,7 70,5 71,3 77,4 66, 68,8 76,1 71,4

a) Costrusc ua tabella raggruppado dat class d frequeza d ampezza 3 kg. b) calcola la frequeza relatva e percetuale per cascua classe c) rappreseta grafcamete dat della tabella due mod dvers, a tua scelta d) calcola l valor medo de pes, l tervallo d varazoe e lo scarto quadratco medo Sol. a) e b) La tabella che cotee dat raggruppat class d frequeza e le frequeze rcheste, è la seguete: Class Itervallo Frequeza assoluta Frequeza relatva Frequeza percetuale % 1 64.0 67.0 3 0,1071 10,71 67.1 70.1 6 0,14 1,4 3 70. 73. 7 0,5 5 4 73.3 76.3 7 0,5 5 5 76.4 79.4 0,0714 7,14 6 79.5 8.5 3 0,1071 10,71 Sol. c) Usado la rappresetazoe medate stogramma (le class coo cosecutve) s ha: (serre grafco del fle ScaStat1 ) Usado vece u dagramma a torte s ha: (serre l grafco del fle ScaStat ) Sol. d) Il peso medo degl studet della classe s ottee come meda poderata, dove a rappresetare cascua delle se class d frequeza sceglamo l suo valore cetrale, coè la semsomma de due valor estrem della classe: M 3 65,5 6 68,6 3 7 71,7 6 7 7 7 74,8 3 77,9 3 81 03,4 8 7,58 L tervallo d varazoe è la dffereza tra l valore massmo e l valore mmo tra quell rlevat, qud questo caso è 81 64 17. Questo dato c forma solo sul fatto che tra lo studete che pesa d pù e quello che pesa d meo, c è ua dffereza d 17 Kg. Per calcolare lo scarto quadratco medo σ, bsoga aztutto calcolare lo scarto assoluto d og valore dalla meda, scegledo come rfermeto l valore cetrale d cascua classe: 65,5 7,58 7,08 68,6 7,58 3, 98 71,7 7,58 0, 88 74,8 7,58, 77,9 7,58 5, 3 81 7,58 8, 4 Ora s può applcare la formula per l calcolo d σ: 7,08 3,98 0,88 6, 5,3 8,4 5,9 Questo valore c dce che, meda, l peso d og studete s dscosta d 5,9 kg. dal peso medo che è d 7,58 kg.

PARTE SECONDA RELAZIONI TRA LE VARIABILI STATISTICHE Nell utà precedete abbamo rassuto le prcpal fas d u dage statstca; dopo aver raccolto e orgazzato dat ecessar, ora s tratta d elaborarl. Cosa sgfca? Elaborare dat sgfca essezalmete aalzzarl sgolarmete o gruppo, esamare se esstoo relazo tra due o pù d ess, cercare d capre se uo derva da u altro, eccetera, allo scopo d dedurre rsultat utlzzabl. Par.3 I rapport statstc La forma pù semplce d elaborazoe de dat è costtuta da rapport statstc che s creao tra dat d ua stessa dstrbuzoe o fra dat d dstrbuzo dverse. I buoa sostaza s tratta d rapport, coè quozet, tra due dat almeo uo de qual abba carattere statstco. Ne esamamo solo alcu, rcordado che: se l cofroto avvee tra dat omogee, l rapporto sarà u umero puro: ad esempo l rapporto tra peso e altezza d ua persoa, oppure tra umero d abtat d ua azoe e dsoccupat, ecc. se vece l cofroto avvee tra dat o omogee, l rsultato ha ua certa utà d msura: ad esempo l rapporto tra superfce comuale e umero d farmace preset, è espresso farmace per chlometro quadrato, oppure l rapporto tra umero d studet d ua classe e superfce dell aula, è espresso studet per metro quadrato, ecc. Par.3.1 I rapport d composzoe Regola I rapport d composzoe s ottegoo dvdedo cascua frequeza assoluta rlevata per l totale delle frequeze e dcao qual è l peso d cascua frequeza rspetto al totale delle frequeze. Normalmete l rsultato vee moltplcato per 100; questa operazoe c agevola l cofroto tra dat, perché permette d capre faclmete quale percetuale della frequeza totale rappreseta cascua frequeza. I pratca s tratta della frequeza relatva che gà coosc. Nel coloo Attezoe: per come soo deft, la somma de rapport d composzoe deve sempre essere uguale ad 1 o a 100, se s tratta d rapport percetual. Te coto ache degl evetual arrotodamet. Esemp d rapport d composzoe l tasso d dsoccupazoe (è l rapporto tra le persoe cerca d occupazoe e l totale della forza lavoro; Itala el 011 è stato par all 8%) l tasso d occupazoe (è l rapporto tra gl occupat e la popolazoe co almeo 15 a d età; Itala el 011 è stato par al 56,9%)

Esempo: Settore N. occupat ( mglaa) Rapporto d composzoe Tasso percetuale Idustra 378 378/8371=0,4453 44,53% Artgaato 165 165/8371=0,1941 19,41% Commerco 3018 3018/8371=0,3605 36,05% Totale 8371 1 100% l tasso d attvtà (è l rapporto tra la forza lavoro e la popolazoe co almeo 15 a d età) l tasso d scolarzzazoe superore (è l rapporto tra l umero d scrtt ad ua scuola superore e la totaltà della popolazoe tra 14 e 19 a) l tasso d ataltà (è l rapporto tra l umero delle ascte ua comutà durate u perodo d tempo e la umerostà della popolazoe meda dello stesso perodo) l tasso d mortaltà relatvo ad ua certa malatta (è l rapporto tra l umero d cttad che u certo perodo d rfermeto muooo per causa d quella malatta rspetto al totale d coloro che l hao cotratta) l rapporto delle spese per tursmo rspetto alla totaltà delle spese complessve effettuate da ua famgla l rapporto de perottamet hotel el mese d agosto rspetto a perottamet au, ecc. Nel coloo: cerca cosa sgfca esattamete forza lavoro Par. 3. I rapport d coessteza Regola S calcola l rapporto tra le frequeze d due feome dvers rfert allo stesso luogo e/o allo stesso tempo; questo tpo d rapporto cofrota la dmesoe statstca d due grupp compreset u certo seme ed è percò dcato per rlevare l evetuale squlbro d u gruppo rspetto all altro. Esemp d rapport d coessteza l rapporto tra gl arrv d turst tala e d turst straer Sardega u certo ao l rapporto tra umero d mpegat e umero d opera u azeda l dce d occupazoe/dsoccupazoe (è l rapporto tra occupat/dsoccupat valutato ello stesso luogo (Stato, zoa geografca, Regoe ), el medesmo perodo) la copertura d blaco (è l rapporto tra etrate ed uscte dello Stato) l dce d ataltà mascho/femma (è l rapporto tra eoat masch e femme, ua stessa comutà el medesmo perodo); esempo: Sesso eoat el 003 Numero Rapporto d coessteza Idce d ataltà Masch 79.517 79.517/64.546=1,056 105,6 % Femme 64.546 64.546/79.5170=0,946 94,6 % Totale 544.063 Da quest dat s deduce che le ascte d eoat masch superao del 5,6 % le ascte d eoat femma, coè og 100 femme ascoo 105,6 masch; per coverso, og 100 masch ascoo 94,6 femme. Nel coloo: attezoe: term tasso d ataltà e dce d ataltà possoo essere equparat, ache se u aals pù accurata può dfferezarl, almeo per quato rguarda la defzoe.

Par.3.3 I rapport d dervazoe Regola S parla d rapport d dervazoe quado s cofrotao le testà d due feome che s mafestao luogh o temp dvers. S dcoo ache rapport causa-effetto, el seso che l valore che s poe al deomatore del rapporto rappreseta l presupposto per l valore posto al umeratore. Soltamete s mglora la compresoe del rsultato d questo calcolo moltplcadolo per 1000. Esemp d rapport d dervazoe l reddto azoale pro-capte (è l rapporto tra l reddto azoale e la umerostà della popolazoe) l quozete d ataltà (è l rapporto tra at vv durate l ao e la popolazoe resdete) l quozete d uzaltà (è l rapporto tra l umero d matrmo celebrat u certo ao e la popolazoe complessva); esempo: Matrmo Popolazoe d ua cttà Rapporto d dervazoe Quozete d uzaltà 10 0.080 ab. 10/0.080=0,006 6 per mlle ab. 75 18.600 ab. 75/18.600=0,004 4 per mlle ab. 84 4.816 ab. 84/4.816=0,00 per mlle ab. Rflett sul fatto che o s può trascurare l effetto della dversa cossteza umerca de var feome. Ad esempo, se voglamo cofrotare la propesoe a trascorrere le vacaze all estero d tala e fraces, dobbamo teer coto che le due Nazo hao popolazo umercamete dverse. Ha seso allora dvduare u umero che esprma, per ogua delle due Nazo, quate persoe s soo recate all estero og 1000 abtat. Cò s ottee calcolado l rsultato come ved ella coloa 3 della tabella precedete. Attezoe acora al prossmo esempo, che dmostra che o s può o teer coto della cossteza umerca assoluta d ua popolazoe: fatt se ad esempo 1/3 degl studet d u gruppo s è scrtto all uverstà, samo portat a pesare che 1/3 equvale al 33%. Forse qualcuo peserà che questo 33% è u dscreto umero. Se però l gruppo è composto da tre ragazz se e è scrtto uo solo! Par. 3.4 I rapport d destà Regola E l rapporto tra la frequeza d u feomeo e la dmesoe del campo su cu è stata fatta la rlevazoe; è qud u rapporto tra dat o omogee che permette d cofrotare caratterstche altrmet o compatbl; soo alla base d molt dcator socal d beessere Esemp d rapport d destà l dce d affollameto (è l rapporto tra l umero d occupat le abtazo e l umero d staze preset ell abtazoe) la destà abtatva (è l rapporto tra umero d abtat d u comue o d ua provca e la superfce del terrtoro comuale, provcale...)

Provca Superfce ( km. Resdet ell ao Rapporto d destà Destà abtatva quadrat) ( mglaa) (ab./km quadr.) Bologa 370,41 991.94 991.94/370,41=67,91 68 Modea 68,86 700.913 700.913/68,86=61,5 61 Reggo Emla 9,89 530.343 530.343/9,89=31,9 31 Parma 3449,3 44.10 44.10/3449,3=18,17 18 la destà scolastca della tua scuola (è l rapporto tra umero d studet e la cubatura della scuola, coè l suo volume complessvo) la destà d esercz commercal (è l rapporto tra l umero d egoz preset u terrtoro e l estesoe del terrtoro stesso) l umero d post letto egl sttut d cura og 100 mla abtat Par. 3.5 I umer dce I umer dce soo msurazo che servoo per evdezare cambamet d ua varable rspetto al tempo, alla zoa geografca, alla professoe o altro. Co umer dce possamo ad esempo cofrotare cost del cbo o d altr be ua cttà durate u ao, co quell dell ao precedete (cofroto temporale); possamo però ache cofrotare la produzoe azoale, ad esempo d vo, degl ultm 5 a co quella d u altro Stato ello stesso perodo (cofroto terrtorale). I umer dce soo percò molto usat per fare prevso e forre dcazo geeral sulla produzoe, sul cosumo, sulla spesa. Uo de pù cooscut umer dce è scuramete l dce del costo della vta, preparato dall ISTAT; probablmete sa che molt cotratt d lavoro soo prevste le cosddette clausole d scala moble create per cremetare automatcamete l salaro al crescere dell dce del costo della vta. I umer dce possoo essere basat su rapport co base fssa o co base moble, oppure basat su dffereze. a) Numer dce a base fssa Soo l rapporto tra l testà d u certo dato statstco e l testà d u altro dato preso come rfermeto (base), moltplcato per 100. b) Numer dce a base moble Soo l rapporto tra l testà d u certo dato statstco e l testà del dato che lo precede, moltplcato per 100. Esempo: la tabella successva cotee l prezzo per 100 ltr d latte crudo alla stalla (va esclusa) rlevato el mese d geao degl ultm 5 a; cofrotamol. a) Per calcolare l dce a base fssa, sceglamo l prezzo del 008 come base e ad esso rferamo tutt gl altr dat, moltplcado per 100. Usualmete s poe uguale a 100 l dato d rfermeto, qud el ostro caso quello del 008. b) Per calcolare l dce a base moble vece og dato va rapportato al precedete e moltplcato per 100

Ao Prezzo Numero dce a base fssa Varazoe % Numero dce a base moble Varazoe % 008 4 100 0 100 ------ 009 36,0 (36,0/4)100=85,76-14,4 % (36,0/4)100=85,76-14,4 % 010 33,16 (33,16/4)100=78,95-1,05 % (33,16/36,0)100=9,06 +6,30 % 011 39,00 (39,00/4)100=9,86-7,14 % (39,00/33,16)100=117,61 +5,55 % 01 40,70 (40,70/4)100=96,90-3,09 % (40,70/39,00)100=104,36-13,5 % I geerale, possamo osservare che: - se dat otteut ella terza e quta coloa soo superor a 100, dcao u cremeto percetuale rspetto alla base scelta, metre se soo feror a 100 u decremeto; partcolare, ota che ella terza coloa tutt gl dc otteut soo feror a 100 e questo è logco perché l prezzo del latte dal 008 è adato calado, come ved ache ella secoda coloa; - ella quarta coloa possamo leggere l ettà della varazoe percetuale, sempre rferta all ao base 008 - ella quta coloa s è usato l dce moble, per cu tutt dat soo rapportat a quello dell ao precedete e così pure le varazo che s leggoo ell ultma coloa Dovrebbe a questo puto essere evdete che quest due dc dao formazo molto utl ma dverse e vao qud usat secodo lo scopo e lett co attezoe. E partcolarmete frequete vederl applcat ambto borsstco, quato le fluttuazo delle quotazo che avvegoo Borsa s possoo valutare rspetto all zo dell ao (base fssa) o rspetto alla chusura della seduta precedete (base moble). c) Numer dce basat sulle dffereze: la varazoe relatva Per capre come fuzoa u dce basato sulle dffereze, cosderamo la quotazoe dell oro ad esempo al lsto d Mlao. Suppoamo che l goro 4/8/01 l oro sa quotato 41,66 /gr., l 7/8/01 sa quotato 41,77 /gr. e l goro 8/8/01 sa quotato 41,70. Pur potedo fare semplc dffereze artmetche (coloa 3), calcolamo la varazoe relatva della 1 quotazoe, che è data dalla formula: 100 ed esprme la varazoe percetuale rspetto al goro precedete. 1 Modaltà Quotazoe /gr. Dffereza Varazoe relatva X 1 41,66 X 41,76 41,76-41,66=0,1 +0,4 % X 3 41,70 41,7-41,76=-0,06-0,14 % Cosa deduc dalla tabella precedete? I calcol fatt dcoo che l 7 agosto c è stato u cremeto della quotazoe rspetto al 4 agosto d 0,4%, metre l successvo 8 agosto s è rlevata ua flessoe dello 0,14% rspetto al goro precedete. d) L dce d eccedeza Quado s hao due caratter cotrappost e dsgut, 1, l dce d eccedeza msura d quato la frequeza d ua modaltà supera l'altra, rapporto all'ammotare totale del feomeo; vee

percò usato quado s vuol mettere luce d quato ua modaltà prevale sull altra e per calcolarlo 1 s può usare la formula: 100. 1 Esempo: el 00 l valore complessvo delle esportazo è stato 65.367mlo d euro, metre quello delle mportazo è stato 56.888 mlo d euro. Il calcolo dell dce: 65.367 56.888 100 65.367 56.888 1,6 mostra u eccedeza del 1.6% delle esportazo sulle mportazo. S può affermare che questo dce o agguge uove formazo statstche rspetto al rapporto d coessteza co l qual è strettamete coesso. Prova tu 1) Rferedot alla tabella del par. 1.4, completa la seguete: Provca Superfce ( km. quadrat) Resdet ( mglaa) Rapporto d destà Destà abtatva (ab./km quadr.) Forlì-Cesea 376,80 395.489 Ravea 1858,49 39.458 Ferrara 631,8 359.994 Rm 86,0 39.30 Paceza 589,47 89.875 ) Se el 00 l valore delle esportazo dell Itala verso Paes CE è stato d 141.106 mlo d euro, metre l valore delle esportazo etra CE è stato 14.59 mlo d euro, calcola d quale percetuale l prmo dato sopravaza l secodo (grado d copertura) R. 13,5% 3) Rferedot alla tabella del par. 1.5, completa la seguete tabella che s rfersce al mese d aprle: Ao Prezzo Numero dce a base fssa Varazoe % Numero dce a base moble Varazoe % 008 38,09 009 31,66 010 33,16 011 39,00 01 36,00 Par. Lo studo coguto d due caratter: le tabelle a doppa etrata I u dage statstca spesso vegoo rlevat cogutamete due caratter X e Y, per cercare d mettere evdeza evetual legam esstet, ad esempo colore degl occh e de capell d u campoe d persoe. Il rsultato della rlevazoe è u seme d coppe ordate (X,Y). E sez altro teressate cercare d capre se c soo relazo tra quest due caratter, coè se c è dpedeza tra ess, ma attezoe: la dpedeza statstca tra due caratter o è ecessaramete d tpo causale. Questo è l oggetto d studo della statstca bvarata, coè determata da due varabl.

Sappamo gà che quado s vogloo aalzzare dat format da due caratter, s usao tabelle a doppa etrata, che rportao le frequeze co cu s mafestao le vare coppe osservate (dette frequeze cogute); ua tabella così costruta cosete d leggere cotemporaeamete valor de due caratter per og utà statstca e pù propramete vee detta dstrbuzoe doppa d frequeze o dstrbuzoe coguta. Esemp 1) Lo specchetto rassutvo dell oraro scolastco è u esempo perfetto d tabella a doppa etrata. I essa le matere della lezo quotdae soo suddvse e var gor della settmaa orde progressvo, così u attmo samo grado d trovare ad esempo la matera della secoda ora del veerdì. ) All uscta d u cema vegoo tervstat gl spettator (X), suddvdedo la rlevazoe 335 doe e altrettat uom, per cooscere l loro gradmeto (Y) del flm appea vsto. Rsulta che 135 doe lo hao gradto molto, 160 abbastaza e a 40 o è pacuto; rsulta oltre che a 100 uom è pacuto molto, a 175 abbastaza e a 60 o è pacuto affatto. Costruamo ua tabella a doppa etrata che rappreset la rlevazoe. X Y Molto Abbastaza Poco Freq. margale ass. d X Doe 135 160 40 335 Uom 100 175 60 335 Freq. margale ass. d Y 35 335 100 670 Prova a trarre tu alcue cocluso sul rsultato d questa pccola dage. Nel coloo: se etrambe le modaltà della tabella soo qualtatve, abbamo ua tabella d cotgeza; se etrambe soo quattatve, abbamo ua tabella d correlazoe; se vece ua modaltà è qualtatva e l altra quattatva, la tabella è msta. Che tpo d tabella è quella qu accato? Osservazo 1) Nella prma coloa s leggoo valor (doe, uom) assut dalla varable X; ella prma rga s leggoo valor (molto, abbastaza, poco) assut dalla varable Y. ) I ogua delle altre 6 caselle leggamo le frequeze cogute d og coppa (X,Y). Per esempo alla coppa (doe, abbastaza) corrspode la frequeza 160 e vceversa, coè la frequeza 60 corrspode alla coppa (uom, poco). 3) Nell ultma rga s leggoo le cosddette frequeze margal assolute d Y, coè la somma del umero d spettator a cu è collegable u certo carattere: ad esempo 35 spettator hao apprezzato molto l flm 4) Nell ultma coloa s leggoo vece le frequeze margal assolute d X, coè l umero complessvo d doe e d uom che hao rsposto all tervsta; è percò logco che l umero 670 che s legge ell ultma casella rappreset sa la somma della coloa che della rga cu appartee. Prova tu Calcola le frequeze margal d X e Y rferbl alla tabella del fatturato mesle d 1000 azede, che descrve la dstrbuzoe del umero degl addett Y, classfcat tre class, rpartta per area geografca X

X Y (0,10] (10,50] (50,100] Freq. margale ass. d X Nord 100 100 00 Cetro 150 50 50 Sud 150 50 150 Freq. margale d Y Par.4.1 La rappresetazoe grafca La rappresetazoe grafca d ua tabella a doppa etrata co varabl dscrete, può avvere tramte ass cartesa a tre dmeso. I questo caso og coppa d modaltà (X,Y) corrspode ad u puto del pao (,) e da esso za u segmeto vertcale, la cu altezza è la quota data dalla frequeza z assocata ad (X,Y). Questo metodo però, detto dagramma a pal, o è sempre facle é da dsegare, é da leggere. (serre grafco) U altro metodo è quello del dagramma a bolle: questo caso gl ass cartesa soo bdmesoal e format dalle modaltà (X,Y); la frequeza corrspodete vece determa l ampezza d og bolla, coè la sua area. Questa tecca è certamete d pù mmedata compresoe rspetto alla precedete. (serre grafco) Esstoo però altre modaltà, cascua delle qual è d volta volta pù adatta a rappresetare ua dstrbuzoe puttosto che u altra. Fa tu ua rcerca per sapere cos è lo stereogramma e quado s usa; propo fe u esempo cu poterlo utlzzare. Prova tu Costrusc ua tabella a doppa etrata per correlare gl studet della tua classe co la relatva scuola meda d proveeza. Par. 5 La dpedeza statstca Abbamo gà atcpato che ell aals d u feomeo s è molto teressat ache a stablre se fra var caratter aalzzat cogutamete su ua popolazoe v sa u legame (relazoe d dpedeza) oppure o, ed evetualmete quato forte sa; lo studo d questa dpedeza e la rcerca d ua fuzoe che la rappreset, s chama teora della regressoe; o la approfodremo u po solo el caso leare. S chama vece teora della correlazoe l problema che s occupa d esprmere la coessoe tra le varabl co u umero, che msur quato ua varable dpede dall altra. Nel coloo:

Se ua varable o ha alcua flueza su u altra, s dce che soo statstcamete dpedet Par. 5.1 La msura del grado d dpedeza tra due caratter: l dce ch quadro ( ) Per msurare l grado d dpedeza d due caratter, possamo vedere se e quato la dstrbuzoe coguta osservata s dscosta dalla dstrbuzoe che avremmo osservato el caso d dpedeza de caratter. Questo equvale a cofrotare due tabelle a doppa etrata: la tabella che cotee dat osservat e la tabella delle frequeze cogute, che s ottee mettedo cascua delle caselle l prodotto delle corrspodet frequeze margal. Il grado d dpedeza sarà tato pù elevato, quato pù la tabella delle frequeze osservate è dffersce dalla tabella delle frequeze (teorche) d dpedeza. Tal dffereze soo dette cotgeze. Faccamo u esempo rferto ad ua tabella a doppa etrata e a due varabl d tpo qualtatvo. Puo vedere questo esempo svluppato co Ecel ella parte dedcata alle attvtà d laboratoro. Cosderamo l tpo d auto preferte da u gruppo d persoe, uom e doe: X Y Ctcars Fuorstrada Sportve Totale Uom 0 35 60 115 Doe 40 30 15 85 Totale 60 65 75 00 Costruamo ora la tabella delle frequeze cogute teorche d dpedeza secodo questa regola: la frequeza coguta f, ) d og coppa, ), s ottee moltplcado l totale della ( j ( j rga cu appartee l valore, per l totale della coloa e dvdedo l rsultato per l totale delle rlevazo; s ha: Nel coloo 1: rved la omeclatura rportata elle osservazo del par. Nel coloo : ella tabella 1, e j 1,, 3 X Y Ctcars Fuorstrada Sportve Totale Uom (11560)/00=34,5 (11565)/00=37,375 43,15 115 Doe (8560)/00=5,5 7,65 31,875 85 Totale 60 65 75 00 Nota che total d rga e coloa d questa tabella devoo cocdere co quell della tabella precedete. Costruamo po la tabella delle cotgeze secodo questa regola: og cotgeza c, ) s ottee come dffereza tra og frequeza assoluta rlevata e la ( j corrspodete frequeza teorca; s ha: X Y Ctcars Fuorstrada Sportve Totale Uom 0-34,5= -14,5 35-37,375= -,375 16,875 0 Doe 14,5,375-16,875 0 Totale 0 0 0 0

Nota che total d rga e coloa d questa tabella devoo essere ull. Possamo ora calcolare l dce d dpedeza secodo questa regola: s sommao rapport tra quadrat d og cotgeza e le rspettve frequeze teorche, coè, j 1 c, f, 14,5 34,5 ; s ha:,375 37,375 16,875 43,15 14,5 5,5,375 7,65 16,875 31,875 30,3 Nel coloo: se le varabl soo perfettamete dpedet, tutte le cotgeze soo ulle e qud rsulta 0 Sgfcato dell dce Dopo aver calcolato l d ua dstrbuzoe, bsoga terpretarlo, coè capre se l rsultato otteuto rappreseta ua dpedeza forte oppure o. Per avere questa rsposta covee ormalzzare l dce, coè trasformarlo u umero compreso tra 0 e 1. S può dmostrare che NORM., cu è l totale delle rlevazo e k è l valore k 1 more tra l umero delle rghe e delle coloe della tabella dat. Nell esempo precedete: 30,3 NORM. 0,15 da cu s deduce che la dpedeza de due caratter è l 15% d quella 00 1 massma possble. Abbastaza poco, possamo dre. Eserczo S vuole sosteere che vvere ua zoa ad alto tasso d quameto (Z.A.I.) produce pù malatte polmoar rspetto a quato accade ua zoa a basso tasso d quameto (Z.B.I.), per cu s rlevao le frequeze d persoe co malatte polmoar e due grupp per cercare d stablre ua dpedeza tra quest due caratter e s compla la tabella: X Y Persoe co malatte polmoar Persoe seza malatte polmoar Totale Z.A.I. 3 48 80 Z.B.I. 13 57 70 Totale 45 105 150 Se tra queste varabl o c fosse alcua relazoe, coè se fossero varabl dpedet, la stma dell cdeza della malatta polmoare, coè la frequeza relatva, sarebbe calcolable 3 13 semplcemete come: f r 0, 3; cosderado po che due campo a cofroto hao 150 dversa umerostà, el gruppo Z.A.I. dovremmo aspettarc 0,3 80 4 persoe co malatte polmoar, metre el gruppo Z.B.I. 0,3 70 1 persoe.

Sccome però c aspettamo ua dpedeza, procedamo per pass come ell esempo precedete: 1) costruamo la tabella delle frequeze cogute teorche d dpedeza: X Y Persoe co malatte polmoar Persoe seza malatte polmoar Totale Z.A.I. (8045)/150=4 (80105)/150=56 80 Z.B.I. (7045)/150=1 (70105)/150=49 70 Totale 45 105 150 Nel coloo:per abbrevare l lavoro: ota che o è ecessaro calcolare tutte le frequeze teorche, perché total margal soo fss, qud è suffcete calcolare ua sola e rcavare tutte le altre per dffereza! ) Calcolamo ora la tabella delle cotgeze: X Y Persoe co malatte polmoar Persoe seza malatte polmoar Totale Z.A.I. 3-4=8 48-56=-8 0 Z.B.I. 13-1=-8 57-49=8 0 Totale 0 0 0 3) fe determamo l dce: NORM. 8,163 150 Par. 6 L terpolazoe statstca 8 4 8 56 8 1 8 49 8,163 e ormalzzamolo: 0,05, coè la dpedeza de due caratter è l 5% della massma possble. Iterpolazoe è l ome che s dà al problema geerale d determare l equazoe d ua curva che rappreset la dpedeza d due caratter X e Y rlevat cogutamete, ad esempo altezza e peso d u campoe d persoe. I u dage statstca d questo tpo, s ottegoo coppe ordate, ) che descrvoo caratter rlevat e che, rappresetate u grafco, probablmete ( j formerao ua poco sgfcatva ube d put. L terpolazoe cosete d sostture alla ube d put u opportua fuzoe che pass l pù vco possble a put stess, modo da descrvere l legame tra le varabl. Questa fuzoe, qualuque essa sa, è detta terpolate; l terpolazoe statstca è detta ache regressoe. Nel coloo: se la fuzoe terpolate passa esattamete per put (dett pol), l terpolazoe è d tpo matematco; se vece passa tra pol, è d tpo statstco. Il problema che c s poe è come sceglere la fuzoe terpolate pù adatta; realtà o esste u crtero codfcato e assoluto, ma la dsposzoe de put e l espereza suggerscoo d volta volta la fuzoe da utlzzare.

E tuttava molto dffuso l caso della fuzoe leare, coè l caso cu la fuzoe terpolate sa ua retta, per cu approfodamo u po questo caso. Par. 6.1 Il metodo del barcetro Quado la ube d put s dspoe el pao cartesao modo da assumere aturalmete u adameto rettleo, come quello che ved e prm due grafc precedet, è facle pesare d sceglere ua retta come fuzoe terpolate. Ma tra le molte rette che passao varo modo tra put, quale sarà la mglore? Il procedmeto oto come metodo del barcetro è ua buoa tecca per otteere la retta terpolate. Per capre a fodo questa tecca, faccamo ua premessa e u esempo. Come s calcola l barcetro d ua dstrbuzoe? Dato u seme d put d coordate,, cosderamo l puto, che ha come coordate le mede artmetche de rspettv valor e. Utlzzado la smbologa stetca, possamo scrvere: 1 e 1. Queste soo le coordate del barcetro della dstrbuzoe. A questo puto s può completare la costruzoe della retta terpolate, che ha equazoe: 1 a( ) ; essa l coeffcete a è calcolable come: a Nel coloo 1: avra scuramete capto che a è l coeffcete agolare della retta 1 Nel coloo : le quattà e soo gl scart da valor med e Esempo Trovare la retta terpolate seguet put:, 1, 3, 18, 4, 7, 5, 45 co l metodo del barcetro. Puo vedere questo esempo svluppato co Ecel ella parte dedcata alle attvtà d laboratoro. Per avere a dsposzoe velocemete tutt dat che servoo per applcare la formula precedete, 1 14 dapprma calcolamo le coordate del barcetro: 3, 5 4 po costruamo ua tabella così fatta: 1 10 e 5, 5 4 1-1,5-13,5 0,5,5 3 18-0,5-7,5 3,75 0,5 4 7 0,5 1,5 0,75 0,5

5 45 1,5 19,5 9,5,5 = 14 = 10 0 0 = 54 = 5 Nel coloo: l smbolo Σ rassume brevemete l pù completo 1 54 Ora possamo determare l valore d a 10, 8 e fe scrvere 5 l equazoe della retta cercata: 5,5 10,8( 3,5) 10,8 1, 3 1 Nel grafco sottostate puo vedere rosso put assegat, ero l barcetro e verde la retta d terpolazoe. 1 Puo provare ad terpretare da solo l sgfcato de valor umerc 10,8 e -1,3 che compaoo ell equazoe, rpesado allo studo della retta. Per eserczo, crea u foglo d calcolo tpo Ecel che, utlzzado dat propost, geer u grafco coteete sa put della dspersoe, sa la retta terpolate. Par. 6. Il metodo de mm quadrat U altro procedmeto altrettato valdo e molto cooscuto, è l metodo de mm quadrat, co l quale s mmzza l errore commesso el sostture put dat co quell della retta terpolate. Osserva l grafco successvo e faccamo u osservazoe prelmare. Immaga d avere alcu put d u grafco a dspersoe e d aver traccato la retta d terpolazoe f () ; per og puto, della dspersoe, sega l puto, f ( ) la stessa ascssa ma appartee alla retta. che ha (serre u grafco) La dffereza f ( ) c dà, puto per puto, l errore commesso el sostture la retta a put real; tale errore aturalmete può essere per eccesso (d sego postvo) o per dfetto (d sego egatvo). Nel grafco ved l ettà d tale errore rappresetato da ua barretta colorata. A questo puto è abbastaza spotaeo pesare che la mglor retta terpolate sa quella che mmzza la somma d queste dffereze. I realtà o è propro così, perché tale somma potrebbe essere zero; s

prefersce vece mmzzare la somma S de quadrat d tal dffereze, coè: S Da qu derva l ome del metodo. 1 f ( ) Nel coloo: questa espressoe vee chamata ache codzoe d accostameto Vedamo ora pratca come s applca la tecca d cu parlamo. Poché la retta avrà equazoe: f ( ) a b, sosttuedo ella codzoe d accostameto s ha: S 1 1 1 ( a, b) a b cu 1 1 1 1 1 1 a e b Nel grafco ved l partcolare dell terpretazoe geometrca. (serre grafco) Per redere u po pù agevole l calcolo, costruamo ua tabella co dat ecessar, utlzzado le stesse coppe d put dell esempo precedete. Sccome dovremo otteere lo stesso rsultato, questo eserczo c servrà ache come cofroto della quattà d lavoro da svolgere, per poter futuro operare la mglor scelta d percorso. Puo vedere ache questo caso svluppato co Ecel ella parte dedcata alle attvtà d laboratoro. 1 4 4 3 18 9 54 4 7 16 108 5 45 5 5 = 14 = 10 = 54 = 411 1 1 1 1 1 1 4 411 14 10 16 Rcavamo ora: a 10, 8 4 54 14 0 1 1 b 1 1 1 1 1 1 54 10 4 54 14 411 14 46 0 1,3 Quest rsultat cofermao che due metod soo ugualmete vald; certamete etramb prevedoo molt calcol, per cu è cosglable fare u po d eserczo, predsporre la tabella co orde e aturalmete usare la calcolatrce.

Par. 6.3 La regressoe d Y su X e d X su Y Abbamo vsto che la retta terpolate o retta d regressoe è la retta che e cas pù semplc terpola, coè approssma, l adameto d u seme d coppe, ) ; la regressoe leare può ( essere d Y su X o vceversa d X su Y. Il calcolo della regressoe d X su Y s rduce allo scambo delle varabl el dagramma a dspersoe ( modo che X sa la varable dpedete e Y la varable dpedete). Dal puto d vsta grafco, cò equvale a sostture gl scart vertcal co quell orzzotal. I geerale la retta d regressoe d Y su X o è uguale alla retta d regressoe d X su Y. Vedamo u esempo. Nella seguete tabella vegoo rlevat proftt X d 6 azede ( mlo d euro), e le rspettve spese Y sosteute per l ammoderameto degl mpat ( mlo d euro): X 50 60 30 85 95 40 Y 0 40 14 50 60 6 Determare: a) la regressoe d Y su X b) la regressoe d X su Y a) Determamo la retta d regressoe d Y su X. Dopo aver creato u grafco a dspersoe e aver otato che put s dspogoo modo da suggerre u adameto leare crescete, utlzzamo l metodo del barcetro per calcolare gl elemet ecessar, che dspoamo ua tabella be ordata: 50 0-10 -15 150 100 60 40 0 5 0 0 30 14-30 -1 630 900 85 50 5 15 375 65 95 60 35 5 875 15 40 6-0 -9 180 400 = 360 = 10 =.10 = 3.50 60 35 A questo puto possamo determare l valore d a (che abbamo gà cotrato el par. 3.1) detto coeffcete d regressoe d Y su X e calcolable come: 1.10 a 0,68 e fe scrvere l equazoe della retta cercata: 3.50 1 35 0,68( 60) 0,68 5,8 (el grafco sottostate è la retta verde)

Commeto: poché la retta terseca l asse delle u puto d ordata egatva (che corrspoderebbe a spese egatve, e cò o è possble), l valore d proftto mmo teorco da otteere per potzzare spese d ammoderameto mpat, è par a 8,594 mlo d euro b) Per determare po la retta d regressoe d X su Y, è ecessaro apportare alcue varazo al lavoro fatto e precsamete: - aggugere alla tabella precedete la coloa, che ha per somma = 1.6 - per o cofoders, chamare b l coeffcete d regressoe d X su Y e varare la 1.10 composzoe come segue: b 1, 36 16 1 - l equazoe della retta è: b( ) Dopo queste precsazo l rsultato cercato è: 60 1,36( 35) 1,36 1, 4 (el grafco è la retta rosso) Commeto: l rsultato dce che se le spese Y d ammoderameto degl mpat soo ulle, proftt X soo o superor a 1,4 mlo d euro Osservazo: le due rette hao coeffcet d regressoe postv, percò descrvoo adamet crescet le due rette o cocdoo, ma passao etrambe per l barcetro della dstrbuzoe (evdezato el grafco dal puto rosso) l coeffcete d regressoe d Y su X dca che all aumetare d ua utà del proftto ( mlo d euro), le spese aumetao d 0,68 utà ( mlo d euro); s usa quado s vuole sapere come vara meda Y dpedeza da X l coeffcete d regressoe d X su Y dca che u aumeto d spesa d ua utà ( mlo d euro), è collegable ad u aumeto d 1,36 utà d proftto ( mlo d euro); s usa quado s vuole sapere come vara meda X dpedeza da Y Cosa potrest dedurre se trovass che a 0? Prova tu

Utlzzado dat dell esempo, costrusc ua tabella Ecel per l calcolo delle due rette d regressoe e rappreseta grafcamete sa le ube d put che le rette trovate. Nota bee: utlzzado la ozoe d agolo formato tra due rette, s può affermare che: Nel coloo: rpassa come s calcola l agolo formato da due rette! - pù l agolo formato dalle rette d regressoe è pccolo, pù le rette determate soo ua buoa approssmazoe de dat real - se l agolo è ullo, coè le rette cocdoo, allora tutt put appartegoo alle due rette - se le rette soo perpedcolar o c è dpedeza leare tra le varabl, ma può esserc dpedeza d altro tpo, perché come sa o sempre u terpolazoe leare resce a rappresetare adeguatamete le dstrbuzoe de put. Par. 7 La correlazoe Nel par.5 abbamo vsto che s parla d correlazoe tra due varabl quado la dpedeza tra esse è msurata da u umero. La correlazoe dca coè l grado della relazoe tra varabl e per mezzo d essa cerchamo d determare quato u equazoe descrve bee tale relazoe. Per otteere questo rsultato s può usare l cosddetto dce d correlazoe leare d Bravas- Pearso. Vedamo come calcolarlo co due metod dstt. Prmo metodo Il metodo pù semplce, se s soo gà determate le rette d regressoe, sfrutta loro rspettv coeffcet agolar a e b (ved par.6.3); questo caso l coeffcete d Bravas-Pearso è calcolable come r ab. Scegleremo l sego + se a e b soo postv, scegleremo vece l sego se a e b soo egatv. Possamo osservare alcue caratterstche del coeffcete r: r è sempre compreso tra -1 e 1 ed è u umero puro se partcolare r = 1 o r = -1 la correlazoe tra le varabl è perfetta e tutt put del dagramma stao sulla retta d regressoe; se vece r = 0 o c è correlazoe leare Se per esempo ( dat provegoo dall esempo del par.6.3) a 0, 68 e b 1, 36 s trova che r 0,9 e sccome questo valore è molto vco ad 1, possamo dedurre che l modello d regressoe leare usato esprme molto bee l legame tra le due varabl. Cò coferma ache le osservazo fatte dal puto d vsta grafco, coè rette che formao u agolo molto pccolo dcao u forte legame tra le varabl. Secodo metodo Se vece o abbamo a dsposzoe coeffcet a e b, s può procedere u altro modo, ma prma d tutto dobbamo trodurre l cocetto d covaraza.

La covaraza d X e Y è defta come la meda de prodott degl scart delle coppe, 1,, coè: XY, cu ovvamete rappreseta l umero totale delle rlevazo cogute. da Nel coloo 1: Voledo abbrevare u po la scrttura d questa formula, s può porre ' e ' e scrvere che XY 1 ' ' Nel coloo : rcorda che se la tabella de dat ha u dverso umero d rghe e coloe, per es. 3, pedc d e varao modo dverso tra loro Esempo d calcolo della covaraza Calcola la covaraza de dat fort da: X 1 3 4 5 Y 3 4 10 Dopo aver determato valor med: 1 3 4 5 3 4 10 3, 5 e 4 4 4, 75, calcolamo gl scart de sgol valor da valor med: 1 3 -,5-1,75 3,94 3 4-0,5-0,75 0,19 4 0,75 -,75 -,06 5 10 1,75 5,5 9,19 e fe la covaraza: XY 3,94 0,19 4,06 9,19,81 Sgfcato geometrco della covaraza Sccome la coppa perpedcolar, dvdua l barcetro della ube d put del dagramma, le rette e dvdoo l pao cartesao quattro quadrat, dcat come ved el grafco sottostate. Puo rcooscere che: ' - e quadrat A e C le dffereze e ' hao sego cocorde (etrambe postvo o egatvo), qud la covaraza XY ' ' 1 0 e questo porta a cocludere che la maggor parte de put del grafco s colloca quest due quadrat (e o B e D) ed oltre all aumetare de valor assut da ua varable, aumetao meda ache valor dell altra

- e quadrat B e D ' e ' hao vece sego dscorde (uo postvo e uo egatvo), qud la covaraza XY 0 e allora la maggor parte de put del grafco s trova quest due quadrat (e o A e C) ed oltre all aumetare de valor assut da ua varable, dmuscoo meda valor dell altra - put che s trovao esattamete sulle rette dao XY 0 qud l umero d put che s trovao e quadrat A e C equlbrao quell de quadrat B e D e o c è dpedeza leare tra le due varabl X e Y (rcorda che comuque potrebbe esserc dpedeza d altro tpo). A questo puto possamo determare l grado d dpedeza tra le varabl X e Y calcolado l coeffcete d Bravas-Pearso, che utlzza l valore della covaraza: XY r cu XY è la covaraza, metre X e Y soo le devazo stadard d X e Y X Y rspettvamete. Nel coloo: rcorda che la devazoe stadard d X è calcolable co: X 1, metre la devazoe stadard d Y è Y 1 Esempo Rferedos all esempo precedete, calcolare l coeffcete d correlazoe d Bravas-Pearso. Autamoc rprededo la tabella precedete e completamola co le ultme due coloe: 1 3 -,5-1,75 3,94 5,065 3,065 3 4-0,5-0,75 0,19 0,065 0,565 4 0,75 -,75 -,06 0,565 7,565 5 10 1,75 5,5 9,19 3,065 7,565 Σ=13 Σ=19 Σ=0 Σ=0 Σ=11,5 Σ=8,75 Σ=38,75 8,75 38,75 E gà stato calcolato che XY, 81 e oltre: X 1, 48 e Y 3, 11 4 4 XY l dce d Bravas-Pearso vale: r 0, 61 X Y Rappreseta grafcamete prcpal dat e rsultat dell eserczo.