ELEMENTI DI STATISTICA PARTE 1
|
|
|
- Flavia Serafini
- 10 anni fa
- Просмотров:
Транскрипт
1 ELEMETI DI STATISTICA PARTE. ITRODUZIOE. La parola statstca. Cenn storc.3 Gl studos.4 La statstca moderna.5 Le font statstche. DEFIIZIOI 3. Una defnzone d statstca 3. I fenomen collettv 3.3 Untà statstche, caratter, modaltà 4.4 Popolazone e campone 6.5 Le scale d msura 6 3. FASI DELL IDAGIE STATISTICA 7 3. Pano d rlevazone 7 3. Rlevazone de dat Spoglo de dat Correzone degl error Elaborazone Interpretazone 0 4. SERIE STATISTICHE 0 4. Defnzone 0 4. Rappresentazone d una sere statstca Tp partcolar d sere 5. TABELLE STATISTICHE DI FREQUEZA 5. Tabelle statstche 5. Frequenze 5 6. RAPPRESETAZIOI GRAFICHE 7 ESERCIZI 3 7.A. GLI IDICATORI STATISTICI 4 7.A. Defnzon 4 7.A. Requst 5 7.B. IDICI STATISTICI DI POSIZIOE O MEDIE LASCHE O MEDIE BASATE SULL ORDIAMETO DEI DATI 6 7.B. Valor estrem 6 7.B. Valore centrale 6 7.B.3 Medana 6 7.B.4 Propretà della medana 9 7.B.5 Quantl e quartl 30 7.B.6 Moda 3 7.C. MEDIE AALITICHE 33 7.C. Meda artmetca 33 7.C. Propretà della meda artmetca 35 7.C.3 Osservazon sulla meda artmetca 36 dell Unverstà degl Stud d Bar esclusvamente a fn della preparazone per l'esame d ELEMETI DI STATISTICA. on è concessa la cessone d queste dspense a terze persone, soprattutto nel caso n cu queste avessero fn d lucro conness alla loro dstrbuzone. on è concesso copare, utlzzare o modfcare questo documento per qualsas altro fne senza un'autorzzazone esplcta dell'autore.
2 7.C.4 Caratterstche della meda artmetca 36 ESERCIZI 37 8.A. IDICI DI VARIABILITA 37 8.B. IDICI DI VARIABILITA BASATI SULL ORDIAMETO DEI DATI 39 8.B. Campo d varazone 39 8.B. Dfferenza nterquartlca 39 8.C. MISURE DI DISPERSIOE 39 8.C. Devanza 40 8.C.3 Varanza 4 8.C.4 Scarto quadratco medo 4 8.C.5 Propretà delle msure d dspersone 4 ESERCIZI COCETRAZIOE 4 9. Concetto e msura della concentrazone (nel caso d sere) 4 9. La curva d Lorenz Indc d concentrazone 45 ESERCIZI SIMMETRIA E CURVA ORMALE 47. Smmetra e asmmetra 47. Box plot 48.3 La curva normale 48 ESERCIZI 5 50 ESERCIZI RIEPILOGATIVI A 5 dell Unverstà degl Stud d Bar esclusvamente a fn della preparazone per l'esame d ELEMETI DI STATISTICA. on è concessa la cessone d queste dspense a terze persone, soprattutto nel caso n cu queste avessero fn d lucro conness alla loro dstrbuzone. on è concesso copare, utlzzare o modfcare questo documento per qualsas altro fne senza un'autorzzazone esplcta dell'autore.
3 PARTE.A AALISI BIVARIATA 53.A. Introduzone: sere e tabelle doppe 53.A. La connessone 54.B. IDIPEDEZA E DIPEDEZA I DISTRIBUZIOE (COESSIOE) PER CARATTERI QUALITATIVI 55.B. Indpendenza n dstrbuzone 55.B. Connessone n dstrbuzone 56.B.3 Indc d connessone: L ndce Ch-quadrato d Pearson 57 ESERCIZI 6 59.C. REGRESSIOE PER DISTRIBUZIOI DOPPIE MISTE: 60.C. Indpendenza n dstrbuzone 60.C. Dpendenza n meda: l rapporto d correlazone η d Pearson 60 ESERCIZI 7 63.D. CORRELAZIOE (=ITERDIPEDEZA) PER VARIABILI STATISTICHE DOPPIE (DISTRIBUZIOI PER CARATTERI QUATITATIVI) 63.D. Covaranza (msura assoluta d nterdpendenza) 63.D. Coeffcente d correlazone d Bravas - Pearson (msura relatva d nterdpendenza) 64 ESERCIZI 8 65.E. DIPEDEZA FRA VARIABILI QUATITATIVE: REGRESSIOE LIEARE 66.E. Indce d determnazone R 67 ESERCIZI 9 69 ESERCIZI RIEPILOGATIVI B 70 ESERCIZI GEERALI 7 dell Unverstà degl Stud d Bar esclusvamente a fn della preparazone per l'esame d ELEMETI DI STATISTICA. on è concessa la cessone d queste dspense a terze persone, soprattutto nel caso n cu queste avessero fn d lucro conness alla loro dstrbuzone. on è concesso copare, utlzzare o modfcare questo documento per qualsas altro fne senza un'autorzzazone esplcta dell'autore.
4 . ITRODUZIOE. La parola statstca L'etmologa della parola "Statstca" derva dal vocabolo talano "Stato" e fa rfermento, nella quas totaltà de lnguagg europe, alla constatazone per cu le prme nformazon su fenomen real sono state raccolte ed organzzate ad opera degl organsm statal che ne erano anche prncpal utlzzator. La prma apparzone del vocabolo "statstca" nteso come raccolta d nformazon organzzate e gestte dallo Stato sembra essere quella dell'talano Ghsln che, nel 589, ndca la Statstca come "descrzone delle qualtà che caratterzzano e degl element che compongono uno Stato".. Cenn storc La statstca è sorta n temp antchssm, fn da prm nsedament uman avent una semplce organzzazone socale. S trovano document d rlevazon d persone e d terren ne nuragh sard e ne monument egzan pù antch. Esstono notze relatve a rlevazon statstche fatte esegure dall'mperatore cnese Yu, pù d 4000 ann fa, allo scopo d ottenere notze precse sulla stuazone dell'agrcoltura n ogn provnca, e qund d poter rpartre equamente le mposte. Presso Roman, Servo Tullo sttuì la prma forma d censmento, chamato allora Census", che era effettuato ogn cnque ann e servva a conoscere l numero de cttadn, l'ammontare de loro ben, l'andamento delle nascte e delle mort. Possamo però affermare che la statstca, come dscplna a sé stante e, come gà detto, nzalmente fnalzzata all'espressone d fenomen rguardant gl Stat, sa nata solo nel secolo XVII, n seguto alle grand scoperte matematche. el XVIII e nel XIX secolo, graze all'ntroduzone d metod matematc e al calcolo delle probabltà la statstca ha avuto notevol mpuls e l suo campo delle applcazon s è andato amplando quando s è capto come utlzzare un nseme d'nformazon allo scopo d rcercare le cause del manfestars d talun fenomen. Tale dscplna ha po avuto una svolta decsva quando ha aggunto all aspetto descrttvo anche l aspetto nvestgatvo, ottenuto medante la messa n relazone de fatt osservat con altr che ne possano essere causa o conseguenza. Con questo nuovo approcco l campo dell'ndagne statstca s è amplato n modo eccezonale e metod statstc hanno trovato applcazone n moltssme dscplne: economa, socologa, fsca, bologa, genetca, pscologa, eccetera..3 Gl studos Fra numeros studos che hanno contrbuto allo svluppo della statstca possamo rcordare l belga Adolfo Quetelet ( ) che ha sostenuto l prncpo secondo cu: le legg che governano la Socetà sono fsse e mmutabl, come quelle che governano corp celest ed esstono fuor dal caprcco degl uomn. umerose sono state, nel corso del tempo, le defnzon della statstca: c'era ch s lmtava a consderarla solo un metodo, ch nvece una scenza. Attualmente s possono dare vare defnzon d statstca e fra esse c pare nteressante quella proposta da B. Gardna l quale sostene che la statstca n senso moderno sa <<l'applcazone de metod scentfc alla programmazone della raccolta de dat, alla loro classfcazone, elaborazone, anals e presentazone e all'nferenza d concluson attendbl da ess>>. Ma s possono rcordare anche nom come quello d Cournot, ndagatore de fatt economc vssuto n Franca e facente grande uso anche del calcolo d probabltà e Gragor Mendel che applcò le osservazon statstche al campo della bologa. Fu però Gustav Rumeln a dare una sstemazone della statstca. Egl ndvduò una dstnzone fondamentale tra una statstca, che defnì e che ancora ogg è defnta, metodologca, che fa da
5 base e dà le lnee drettrc d metodo per la raccolta de dat, la loro elaborazone matematco probablstca e l nterpretazone de rsultat, da una statstca applcata a var ram della conoscenza e della scenza, che assume denomnazon propre a seconda de camp d applcazone, come ad esempo la demografa, la bometra, l antropometra e va dcendo. In partcolare la statstca ha avuto grande applcazone nel campo degl stud bologc, ad opera d Ronald Fsher e d Karl Pearson, cu stud sono stat pres come esempo anche nelle altre dscplne statstche per va della loro generaltà e mportanza metodologca. In Itala maggor statst sono stat Rodolfo Benn, Corrado Gn, Gorgo Mortasa, Marcello Boldrn e Lvo Lv..4 La statstca moderna Ogg la statstca è ampamente utlzzata pressoché n tutt camp d studo. Se ne fa sempre maggore utlzzo nel campo delle rcerche d mercato, della panfcazone terrtorale, n campo produttvo ed economco n generale. Con la nascta de grand Stat europe, s attrbusce all'anals statstca de fenomen collettv un nteresse pubblco che spnge progressvamente le nazon occdental a dotars d Isttut "central" d Statstca, deputat per legge alla raccolta, organzzazone e dffusone d dat sulla popolazone, sulle abtazon, sulle rsorse economche e su tutt gl aspett rlevant della vta collettva d una nazone, d una Comuntà d stat (Unone Europea) o dell'ntero paneta (azon Unte). Ogg, gl organsm pubblc che sttuzonalmente raccolgono e dffondono nformazon statstche sono nnumerevol ed agscono secondo una gerarcha d competenze che ndvdua nell'ente locale la sede prortara d raccolta del dato elementare, mentre al verfca, l'aggregazone e la pubblcazone sono d competenza dell'ente centrale. In Itala tale ente è l ISTAT (Isttuto azonale d Statstca)..5 Le font statstche L ISTAT è dpendente dalla Presdenza del Consglo de Mnstr ed sttuzonalmente accentra tutta la pubblcazone Statstca nazonale ( provvedendo a curare e dffondere l materale raccolto n pubblcazon a perodctà mensle, annuale, decadale o anche occasonale. Le rlevazon contenute n tal pubblcazon possono po essere a carattere generale o relatve a specfc camp d attvtà. Così, accanto all Annuaro Statstco Italano e a Bollettn mensl che sono a carattere generale, v sono gl annuar dedcat alle nascte e a decess, pubblcazon n campo santaro e famlare. Accanto a queste v sono po le statstche della Pubblca Ammnstrazone, le statstche gudzare cvl e penal, statstche nel campo de cont nazonal e statstche sul tema del lavoro. Altre pubblcazon esstono, po, relatvamente a tutte le attvtà produttve. L ISTAT non è, però, l unca organzzazone che cura e gestsce l ngente mole delle font statstche nazonal. Ogn anno l Parlamento pubblca la Relazone sulla stuazone economca del Paese, l Mnstero del tesoro cura l Blanco d Prevsone dello Stato, la Banca d Itala pubblca l Bollettno statstco e tante altre pubblcazon sono effettuate dalle Camere d Commerco, Confndustra e altr ent come Enel, Ra e Ferrove dello Stato. A lvello nternazonale mertano un cenno le statstche dell OU, del BIT (Bureau nternatonal du traval), quell della OMS (Organzzazone Mondale della Santà), dell UESCO e della FAO. Infne va ctato l Isttuto statstco delle comuntà europee, l EUROSTAT, che produce statstche relatve a paes aderent all unone.
6 . DEFIIZIOI. Una defnzone d statstca La statstca può essere, qund, defnta come un nseme d metod per lo studo de fenomen collettv con lo scopo d metterne n luce le regolartà nascoste attraverso lo studo del modo con cu s sono manfestat sngol cas, o da rsultat appars ne var esperment. Tutt gl stud statstc s basano sullo studo de fenomen e sulla ndvduazone de fatt che determnano tal fenomen al fne d determnare qual element possono essere consderat cause prncpal e qual sono le relazon ntercorrent tra tal fatt. Cò consente d ndvduare, ed solare, le cause accdental e d costrure de modell relatv al fenomeno preso n consderazone. Attraverso tal modell è, po, possble effettuare delle prevson n merto a fenomen stess. In genere s parla d una statstca descrttva, coè quel genere d anals che s lmta ad osservare le regolartà de fenomen, da una statstca nferenzale, che s propone d ndvduare legam tra fatt ed fenomen fno alla formulazone d un modello matematco che esprma l andamento del fenomeno stesso.. I fenomen collettv In generale, per fenomeno ntendamo tutto cò che capta ntorno a no o che no stess provochamo e che sa percepto e constatato. Possamo dstnguere fra fenomen natural (come l clma, l tramonto del sole, le onde del mare) e fenomen rprodott n laboratoro. Tutt fenomen che s presentano costantemente con le stesse caratterstche sono chamat fenomen tpc. Tale è ad esempo la caduta d un corpo che, abbandonato ad una certa altezza, cade vertcalmente verso l basso a causa della forza d gravtà terrestre. D'altra parte esstono de fenomen che s manfestano ogn volta con caratterstche dverse e per qual è dffcle fare delle prevson sul loro comportamento. Pensamo, ad esempo, a fenomen meteorologc, che non sempre permettono d fare n antcpo delle prevson scure sulle condzon del tempo ne gorn successv, e che qund possono essere defnt fenomen atpc. Se consderamo, nvece, fenomen socal qual ad esempo le nascte, matrmon, le mgrazon, possamo affermare che non è possble stablre delle legg general, se lmtamo l nostro studo ad un sngolo caso, come nvece avvene per fenomen tpc. Possamo però affermare che se s effettuano delle osservazon molto numerose su tal fenomen, ess rvelano determnate caratterstche unform, per cu s può concludere che, pur essendo sngolarmente atpc, presentano, consderat collettvamente, una tpctà d comportamento che c permette d studare le legg che l governano. I fenomen d questo tpo sono chamat fenomen collettv. I fenomen socal sono nnumerevol e per tale motvo è sorta l esgenza e l utltà d studare autonomamente grupp ess. Da cu le statstche applcate, gà ndvduate da Gustav Rumeln, qual la Demografa, che studa fenomen rguardant le caratterstche struttural e dnamche delle popolazon umane; la Statstca Santara, che studa quanttatvamente fenomen legat al settore della santà, relatvamente sa alle strutture che al loro utlzzo e n relazone a fenomen patologc che colpscono l uomo; la Bometra che studa fenomen bologc degl organsm vvent, la Statstca Gudzara, la quale studa quanttatvamente fenomen che rcadono nella sfera del drtto volato e che costtuscono oggetto d conoscenza delle Forze dell ordne, dell Autortà Gudzara, degl Isttut d prevenzone e Pena e d alcun uffc ammnstratv, o che dervano dall attvtà della magstratura; la Statstca Economca, che studa fatt cosddett economc, qual l andamento de prezz, de consum, delle produzon, eccetera. 3
7 .3 Untà statstche, caratter, modaltà * ved pag. seguente I cas ndvdual oggetto dell osservazone sono defnt untà statstche. L'untà statstca è l pù pccolo elemento sul quale s effettua un'osservazone. È, ad esempo, untà statstca ogn macchna prodotta da un fabbrca, ogn abtante d una data provnca, ogn alunno d una scuola. L'untà statstca può essere semplce, se corrsponde ad una sngola persona o ad un oggetto (ad esempo, età della popolazone talana, clndrata delle automobl), composta, se è formata da un nseme d element (ad esempo, nucle famlar, lott d produzone). Il rsultato d un'operazone computa sulle untà statstche (ad esempo, numero delle persone d sesso maschle nella popolazone talana, prezzo medo d un certo bene) s defnsce dato statstco o carattere ed è, n defntva, un'nformazone sul fenomeno che s vuole studare. Il dato statstco può rappresentare o l numero delle untà statstche che hanno n comune una caratterstca fssata (ad esempo, l numero degl alunn d una scuola, l numero d matrmon n una certa regone) oppure un numero rcavato da pù untà statstche che serve a rappresentare un aspetto del fenomeno studato (ad esempo, l reddto globale degl abtant d una provnca, l loro reddto pro capte, l volume delle mportazon d un dato bene). S defnsce ntenstà l numero che esprme l ammontare, la msura o la grandezza d un carattere quanttatvo d una untà statstca. Modaltà sono le dverse ntenstà o dvers attrbut che un carattere può assumere. Le modaltà secondo cu sono classfcate le untà statstche possono essere qualtatve o quanttatve. Le modaltà quanttatve sono espresse da numer rsultant da msurazon o da enumerazon, come, ad esempo, la rlevazone de reddt d una popolazone, dalle altezze de mltar d leva, del numero de van degl allogg d un comune e così va. Le modaltà quanttatve possono essere contnue o dscrete; contnue, se sono espresse da numer real e possono assumere tutt valor d un ntervallo (ad esempo, altezze, pes), dscrete, n caso contraro (ad esempo, numero de van delle abtazon, numero degl addett n un settore ndustrale). Le modaltà qualtatve sono nvece espresse da attrbut, espresson verbal, come, ad esempo, la rlevazone della popolazone talana secondo lo stato cvle, la rlevazone delle automobl prodotte ne var mes d un anno, la rlevazone della produzone d cereal nelle dverse regon talane. Le modaltà qualtatve s defnscono ordnabl, quando è possble ordnarl secondo un crtero logco, o sconnesse, quando nvece non è possble ordnarle n alcun modo. S dce frequenza l numero che esprme quante volte una data modaltà del carattere s presenta nella totaltà delle untà rlevate. 4
8 ESEMPIO: untà statstca = student CORSO ELEMETI DI STATISTICA DOTT. CRISTIA MUSCHITIELLO A.A. 0/0 caratter = età, altezza, n. esam superat, sesso, relgone, automoble d propretà *Untà statstche, caratter, modaltà - UITA STATISTICA: è l elemento d base della popolazone su cu s vuole effettuare la rlevazone Sulla untà statstca vedono osservat uno o pù caratter - CARATTERE: è la caratterstca oggetto d studo coè l aspetto che della untà statstca s vuole studare. Cascun carattere s esprme attraverso modaltà - MODALITA : è l numero (per caratter quanttatv) o l attrbuto (per caratter qualtatv) che l untà statstca manfesta. * * * * 5
9 .4 Popolazone e campone Un nseme fnto d dat statstc tra loro omogene per quanto rguarda una o pù caratterstche è defnta popolazone statstca. Rappresenta una popolazone statstca, ad esempo, l'nseme degl alunn d una scuola, o l'nseme delle stature degl alunn d una certa classe. Un unverso è una popolazone statstca composta da un numero nfnto d element, mentre un campone è un complesso d osservazon effettve sugl element d una popolazone o unverso. Ad esempo, è un unverso l'nseme formato da rsultat d un numero llmtato d lanc d un dado, o l'nseme degl esperment. Costtusce un campone, ad esempo, l'nseme formato da un certo numero d student estratt dalla popolazone scolastca d una cttà, oppure l'nseme d un certo numero d untà d un bene economco, scelte dalla produzone n base a determnat crter. La scelta del campone statstco rappresenta uno degl element crucal dello studo d un fenomeno..5 Le scale d msura La classfcazone delle modaltà de caratter avvene attraverso uno strumento formale che è la SCALA DI MISURA. Le scale d msure seguono un ordne che è legato alla quanttà d nformazon che esse fornscono e percò sono ordnate da quella che fornsce l mnor numero d nformazon a quella che ne fornsce l maggor numero. Inoltre ogn scala contene sempre tutte le nformazon della precedente. - SCALA DICOTOMICA: S usa per la classfcazone de caratter con due sole modaltà d cu una è complementare dell altra. Fra le modaltà n questo caso è possble stablre una sola relazone e coè quella d dverstà (Esempo sesso). - SCALA OMIALE: S usa per caratter con pù d due modaltà (n genere qualtatv nomnal o sconness). S tratta de caratter le cu modaltà non possono essere ordnate n alcun modo e per qual l unco tpo d studo è connesso alla verfca della presenza o assenza del carattere e alla loro uguaglanza o dverstà (Esempo colore degl occh). - SCALA ORDIALE: S usa per que caratter (qualtatv) le cu modaltà o attrbut possono essere ordnat secondo un partcolare artfzo d natura logca o formale n ordne crescente o decrescente. Per quest caratter è possble ndvduare oltre alla loro dverstà anche una relazone d ordne. on è nvece possble effettuare operazon né d natura addtva che moltplcatva (Esempo mes dell anno). - SCALA DI COTEGGIO: Questa scala s usa per caratter quanttatv per qual lo zero è convenzonale (per esempo la temperatura). In tal caso non ha senso rapportare le msure ottenute, ed è, nvece, corretto confrontare per dfferenze. - SCALA DI MISURE I SESO STRETTO: anche questa scala s usa per sol caratter quanttatv, ma per quell contnu. In questo caso s parla d msure n senso stretto poché esste uno zero naturale (per esempo l peso, l altezza eccetera). In tal caso è possble defnre degl ntervall ed anche elaborare le nformazon tramte funzon. 6
10 3. FASI DELL IDAGIE STATISTICA: Lo studo d un fenomeno collettvo con metodo statstco è defnto ndagne statstca. Fnaltà specfca d un ndagne statstca è quella d rsolvere un problema socale specfco e d nteresse mmedato,volendo con l termne mmedato dstnguere questo tpo d rcerca da quella cosddetta pura, volta coè alla verfca d potes che contengono concett astratt e non mmedatamente utlzzabl. Il lavoro necessaro per effettuare una anals statstca deve essere suddvso n fas successve. a) Per prma cosa occorre predsporre l Pano della rlevazone che defnsce charamente gl obettv da raggungere attraverso l'ndagne, l'oggetto della rlevazone e l modo d raccolta de dat. Questa fase è la pù delcata perché, se non è preparata n modo accurato, può pregudcare la ruscta dell'ntera ndagne. b) Qund s procede alla Rlevazone, ovvero quel complesso d operazon fnalzzate alla raccolta de dat, coè delle modaltà o de caratter delle untà del collettvo statstco preso n esame. c) Al termne della rlevazone, subentra la fase dello spoglo, de dat, che consste nell'enumerazone e classfcazone de dat raccolt, secondo l pano prestablto e gl obettv da raggungere. I dat sono qund raggruppat secondo le modaltà d un carattere qualtatvo, o secondo le ntenstà d un carattere quanttatvo. Lo spoglo può essere fatto manualmente da personale opportunamente addestrato o con l'auto d PC. d) Prma d procedere all'elaborazone vera e propra, dat vanno corrett per elmnare gl error eventualmente commess nella fase d rlevazone. e) I dat così raccolt ed organzzat vengono elaborat. f) I rsultat dell ndagne svolta vanno qund nterpretat. Vedamo le fas della rlevazone punto per punto: 3. Pano d rlevazone Il soggetto che deve panfcare la rlevazone deve nnanz tutto defnre lo scopo della rlevazone fno ne mnm dettagl e mezz fnanzar e uman d cu dsporre n modo che non v sano ambgutà. - Qund occorre defnre l untà statstca e l untà d rlevazone. Per untà statstca s ntende l untà oggetto del collettvo che s vuole analzzare (m ad esempo se l collettvo da analzzare è la popolazone, l untà statstca oggetto della rlevazone è ragonevolmente l ndvduo, ma s può decdere d consderare come untà la famgla). Defnre l untà d rlevazone sgnfca nvece defnre partcolar accorgment nella scelta delle untà statstche da consderare (se ad esempo l'untà statstca è rappresentata dalla famgla occorre ben defnre l sgnfcato che s vuol dare a questa parola e coè stablre se l'ndagne dovrà comprendere anche convvent, le persone che vvono da sole ecc ). Bsogna noltre evtare la sovranformazone, evtando quelle nformazon che non sono strettamente necessare allo svolgmento della anals o quelle dffcl da rlevare. Bsogna noltre adeguare la mole d nformazon alle rsorse fnanzare e al tempo dsponble - Defnte le scale d msurazone adottabl, l pano d rlevazone dovrà ndcare mezz tecnc d osservazone e coè: a) support da utlzzare per la rlevazone. Va ndcato coè se la stessa sarà effettuata medante questonar, modell o schede e se necessaro un operatore, la persona o 7
11 le persone che s occuperanno della rlevazone. b) personale addetto. A tal proposto dstnguamo le rlevazon automatche, n cu sono le untà statstche a recars dall operatore (è l caso delle nascte o delle mort) da quelle rflesse n cu dat sono raccolt da personale addetto e appostamente addestrato. c) gl strument necessar. - A questo punto della formulazone del pano occorrerà, prma d procedere, stablre lmt terrtoral della rlevazone e quell temporal. Per quanto rguarda lmt d tempo, quest possono far rfermento ad un stante precso (come avvene ne censment per qual è necessaro che tutte le nformazon fornscano la stuazone esstente ad una certa ora d un dato gorno), o a un dato perodo d tempo (anno, stagone, mese, settmana o altro). La scelta deve essere fatta tenendo conto d numeros fattor: n estate sono notevol gl spostament delle famgle per le fere e qund, per certe rlevazon d carattere generale, s prefersce fssare l'epoca per la raccolta de dat n un perodo compreso fra la fne del mese d aprle e prm d gugno. Rguardo a lmt d spazo, la rlevazone può essere fatta su un terrtoro pù o meno vasto. C sono ndagn condotte su numerose nazon contemporaneamente, altre esegute a lvello regonale, provncale o comunale. La scelta dpende, come affermato pù volte, dagl obettv che s voglono raggungere. Lmt d spazo sono anche quell rfert a partcolar categore dell'oggetto dell'ndagne; per esempo, volendo esamnare le varazon relatve al numero degl scrtt nelle scuole talane ne var ann, c s può lmtare agl sttut tecnc, oppure alle scuole pubblche. Tal statstche saranno valde lmtatamente al terrtoro per cu sono state fatte; un'ndagne nelle scuole pubblche del Lazo non sarà valda per le altre regon talane a causa de numeros fattor, dvers n ogn regone, che possono nflure sull'andamento delle scrzon. - ella predsposzone d un pano d rlevazone occorre porre sempre partcolare attenzone alla scelta della ampezza della rlevazone, ovvero alla scelta della esecuzone d una rlevazone totale o parzale. Una rlevazone s dce totale se è estesa a tutt gl element d una popolazone statstca, mentre rdefnsce parzale o per campone se è fatta solo su alcun element della popolazone, scelt con crter opportun. Camponamento Indubbamente una rlevazone totale ha l prego d fornre rsultat complet e precs sul fenomeno ndagato; tuttava se la popolazone è molto numerosa, comporta cost elevat e temp d realzzazone molto lungh. ella realtà s rcorre molto spesso a ndagn parzal, dette rlevazon camponare, quando occorre contenere cost (l costo d un'ndagne camponara è mnore d quello d un'ndagne totale), quando occorre ottenere pù tempestvamente rsultat, nfne, quando non è possble procedere dversamente (ad esempo gl stud sulla durata de prodott ndustral comportano nevtablmente la dstruzone delle untà esamnate). Le rlevazon camponare devono soddsfare l mportante requsto d dare un mmagne fedele, sebbene rdotta, del fenomeno preso n consderazone. La statstca moderna fa ampssmo uso del camponamento per la crcostanza che la rlevazone camponara consente rduzon n termn d spesa e d tempo mpegato per lo svolgmento delle anals, così permettendo d aumentare l numero delle anals stesse almentando la produzone statstca nazonale. La scelta del campone deve essere fatta n modo che esso sa rappresentatvo, ovvero che sa estratto con un crtero oggettvo e possegga le stesse caratterstche della popolazone da esamnare. Quando nvece la rlevazone tende ad escludere quelle untà che presentano l carattere con ntenstà nferore a determnat lmt o entro lmt determnat s parla d campon non rappresentatv. Ad esempo, se un lotto d 000 pezz fosse formato da 300 pezz dfettos e da 700 pezz non dfettos, un campone deale d 00 pezz dovrebbe contenere 5 pezz dfettos e 85 pezz non dfettos, ma dffclmente un campone estratto da quel lotto ha questa composzone. Altro elemento fondamentale per una rlevazone camponara è che l 8
12 campone sa suffcentemente ampo, nfatt pù l campone è numeroso, pù rsultat che fornsce sono sgnfcatv. Le metodologe d camponamento sono raggruppabl n due grand class: a) camponamento casuale, n cu cascuna untà della popolazone ha la stessa probabltà d essere estratta b) camponamento medante scelta ragonata. In questo caso le untà sono scelte con metod non del tutto casual e pertanto non hanno la stessa probabltà d essere nserte nel campone 3. Rlevazone de dat La raccolta de dat s può dstnguere: - rguardo al modo, n automatca se sono gl stess nteressat che fornscono spontaneamente, spesso n vrtù d precse dsposzon d legge, le nformazon su fenomen che l rguardano (è quanto accade gornalmente negl uffc anagrafc dove sono denuncate le nascte, le mort, trasferment), o rflessa se è fatta drettamente da organ prepost a tale scopo, come avvene per esempo ne censment e nelle rcerche d mercato. - Rguardo alla durata, n: contnue, se sono fatte senza nterruzone (ad esempo, rlevazone anagrafche de nat, de mort, de matrmon), perodche, se sono fatte ad ntervall regolar d tempo (come censment con perodctà decennale, le rlevazon delle forze d lavoro con perodctà trmestrale) o occasonal, se sono fatte una volta tanto per ndagn su fenomen partcolar (ad esempo, le rlevazon de dann d un terremoto, le ndagn d mercato per l lanco d un prodotto). Anche fenomen sono dstngubl n: fenomen d stato se rfert ad stant d tempo ( ad esempo la popolazone) e d flusso se occorre analzzarl per ntervall d tempo ( come le nascte, le mgrazon o le mort ). 3.3 Spoglo de dat Una volta effettuata la rlevazone delle untà statstche s può procedere alla formazone de dat statstc, attraverso l operazone d spoglo delle untà stesse. - Lo spoglo è la prma fase del processo d elaborazone de dat statstc e consste nell enumerazone. Attraverso l enumerazone le schede, modul, questonar sono contat e, nello stesso tempo, controllat, al fne d fornre prm dat sull estensone della rlevazone. - Successvamente s procede alla classfcazone, ovvero nel raggruppamento de dat ottenut n categore, class, a seconda delle ntenstà o delle qualtà de caratter rlevat. Ad esempo, n un'ndagne relatva ad un certo sttuto tecnco potranno n un prmo momento formars class dverse comprendent gl alunn del trenno e quell del benno; s potranno ancora dstnguere altre due categore: masch e femmne e così va. - Infne s effettua lo spoglo materale, rportando dat, gà enumerat e classfcat, n prospett chamat tabelle d spoglo. 3.4 Correzone degl error Prma d concludere la fase d spoglo e passare alla fase d vera e propra anals occorre depurare dat da eventual error. (tp d error ) Va precsato che per error non s ntendono soltanto eventual error materal che possono essere stat comput nella fase d rlevazone; affette da error sono quelle rlevazon rferte a fenomen perturbat da cause vare qual mperfezon ne questonar o degl strument, omsson del soggetto che effettua la rlevazone o del soggetto cu la 9
13 rlevazone s rfersce, o ancora, n fase d spoglo de dat, possono essere dovute ad una erronea nterpretazone d talune rsposte o dat, ad error d trascrzone o d arrotondamento de valor. Gl error possono po essere accdental, costant, sstematc o d dstrbuzone a seconda che sano legat a cause fortute ed occasonal (come nel caso d error d msura o d stma), che s rpetano con la stessa ntenstà n tutte le osservazon, che agscano secondo partcolar legg o che nfne alterno la valutazone dell esatta dstrbuzone d un fenomeno. ( e loro correzone). La correzone a posteror degl error d rlevazone può essere effettuata utlzzando dverse metodologe. In lnea generale s cerca d predsporre la rlevazone n manera quanto pù precsa possble al fne d evtare l presentars d error d qualunque genere 3.5 Elaborazone Questa fase comprende tutte le possbl anals statstche utl per lo studo del fenomeno consderato, attraverso la applcazone d partcolar procedment matematc che hanno la funzone d trasformare dat raccolt, consderat grezz, n dat elaborat che mettono n evdenza le caratterstche del fenomeno collettvo da studare. 3.6 Interpretazone Interpretare dat sgnfca esamnarl al fne d verfcare se l obettvo prefssato è stato raggunto, se esstono relazon con altr fenomen, se è possble fare una prevsone sulla tendenza del fenomeno nel tempo. 4. SERIE STATISTICHE 4. Defnzone Una sere statstca è un nseme d dat post consecutvamente l uno all altro rappresentant ognuno un dato, coè l enttà del carattere così come osservata sulla sngola untà statstca. Esempo Sere statstca del carattere numero d component della famgla, rferto a pazent afferent ad un medco d medcna generale: Rappresentazone d una sere statstca una sere statstca s ndca smbolcamente nel modo seguente { x } =,,..., dove l ndce serve ad ndvduare, nella sere de dat, quello specfco dato che occupa la poszone ndcata. x = 3 x = x 3 = 4 x 4 = 3 x 5 = 3 x = 6 5 x = 3 x = 6 = x x = Una sere può essere rappresentata orzzontalmente o vertcalmente Sere non decrescent 0
14 spesso può avers nteresse ad ordnare dat n ordne non decrescente. S orgna n tal modo una Sere non decrescente che s rappresenta con l ndce racchuso fra parentes: x ( ) x()... x( )... x( ) Dove l ndce () sta ad ndcare l dato che occupa la -esma poszone d ordne e dove la presenza del segno uguale sta ad ndcare che tutt dat con lo stesso valore vanno consderat e non pres una sola volta. La sere non decrescente sarà allora ndcata come segue: { x },,..., ( ) =, nel nostro esempo: x ( ) = x ( ) = x ( 3 ) = 3 x ( 4 ) = 3 x ( 5 ) = 3 x ( 6 ) = 4 x ( 7 ) = 4 x ( 8 ) = 5 x ( ) = 7 x = 8 Questo tpo d sere è maggormente utle per fn pratc. 4.3 Tp partcolar d sere Fra le sere statstche ve ne sono alcune che rvestono partcolare mportanza e sono oggetto d specfc settor d rcerca. S tratta delle sere storche e delle sere terrtoral. Entramb quest tp d sere sono caratterzzate dal fatto che dat sono raccolt per specfc ambt, rspettvamente temporal o spazal. queste sere vengono rappresentate attraverso l utlzzo d una tabella a due colonne, una contenente la suddvsone n temp o spaz e l altra contenente dat osservat sulle untà statstche. ) Sere storche: Le sere storche s rappresentano come nella tabella d seguto: TEMPI 0 FEOMEO x 0 x x x elle sere storche vale l prncpo d non scambabltà de temp: dat, coè, s ordnano n base a temp e non possono essere scambat fra d loro. A seconda del tpo d fenomeno che rappresentano, possono po essere d due tp dvers: o o o Sere Storche d flusso o d movmento: per fenomen che s realzzano n arch d tempo (esempo: le nascte d un anno). Sere storche d stato o d fondo: per fenomen che accadono e vengono regstrat n specfc stant d tempo (esempo: vendta d bglett del cnema n una gornata.). Sere storca cclca: per fenomen regstrat n corrspondenza d gorn della settmana o mes dell anno.
15 Le sere storche s rappresentano, smlmente alle sere n generale, con l smbolo: {, x } =,,..., Dove la sta ad ndcare che l dato -esmo s e presentato al tempo -esmo. ) Sere terrtoral: Anche le Sere terrtoral s rappresentano n una tabella del tpo d quella vsta per le sere storche ma con la prma colonna contenente la suddvsone per aree geografche nvece che per temp. Smlmente a quanto vsto per le sere storche, po, anche le sere terrtoral possono rappresentars come segue: { t, xt } t =,,..., Dove l ndce t assoca cascun dato al terrtoro dove è stato rlevato. 5. TABELLE STATISTICHE DI FREQUEZA 5. Tabelle statstche Quando le sere statstche contengono molte nformazon la loro rappresentazone rsulta complessa e s utlzza allora un metodo per classfcare dat e sntetzzarl n modo esaustvo e senza perdta d nformazone: le tabelle statstche d frequenza. Le tabelle statstche sono costtute da due colonne; la prma contene, nelle dverse rghe, le vare modaltà del carattere consderato e vene defnta colonna madre, mentre la seconda può contenere dvers valor, come vedremo d seguto. Infne la parte superore della tabella contene l ndcazone de dat contenut nelle vare colonne e vene defnta testata. Una tabella statstca vene defnta, n manera generca dstrbuzone statstca semplce o dstrbuzone d frequenza, ntendendo, con tale termne, qualunque tabella che assoca a ogn modaltà del carattere una frequenza assoluta, dove per frequenza assoluta s'ntende l numero delle untà statstche assocate ad una modaltà. Le modaltà s ndcano con x, =,, k, dove k rappresenta l numero d modaltà del carattere rappresentato, mentre le frequenze assolute s ndcano con l smbolo n, =,, k,
16 Esempo: Dstrbuzone d frequenze assolute relatva alla facoltà d appartenenza degl scrtt all unverstà d Torno n un dato anno x n Lettere Gursprudenza 8.59 Scenze poltche Magstero Agrara.73 Scenze natural 7.4 Economa Farmaca.48 Medcna Veternara V sono var tp d tabelle statstche a seconda del tpo d carattere che s è rlevato sulla popolazone che s sta rappresentando. Quando le tabelle s rferscono ad un solo carattere, s dstnguono n: a) varabl statstche, quando la dstrbuzone statstca è relatva a caratter quanttatv. Le varabl statstche s dstnguono, a loro volta, n - dscrete o - contnue, a seconda che valor cu esse s rferscano faccano parte d un nseme dscreto d valor solat, oppure ad un nseme contnuo d valor. Esempo: Varable statstca dscreta relatva agl nvestment pubblctar d 30 azende n mglaa d euro x n Esempo: Varable statstca contnua relatva all altezza d 00 ragazz msurata n cm x - x + n Quando l carattere quanttatvo è contnuo non s consderano tutte le possbl determnazon del suo nseme unverso, ma valor s raggruppano n class; coè n ntervall contgu che possono essere d ampezza eguale o dversa. La prma e l ultma classe possono po non contenere un estremo, poché valor possono essere molto dradat e n questo caso sono dette class aperte; è consglable evtare d esegure elaborazon con class aperte, occorre chuderle medante valor scelt n modo opportuno. Quando s fa una rlevazone è molto mportante stablre l ampezza (o modulo), se possble costante, delle class, perché se le class sono troppo 3
17 ampe la classfcazone e le successve elaborazon potrebbero essere dstorte, mentre se le class sono troppo rstrette la dstrbuzone sarebbe dspersa e poco regolare. Talvolta s raggruppano n class anche caratter quanttatv dscret, soprattutto se le modaltà del carattere sono molto numerose. In generale l numero delle class vara fra un mnmo d cnque e un massmo d vent. In una varable statstca dvsa n class s defnsce lmte nferore della classe l valore snstro dell ntervallo, s defnsce nvece lmte superore della classe l estremo destro dell ntervallo. L Intervallo d classe è po l nseme de valor contenut fra due lmt, laddove nvece per Ampezza della classe (o modulo) s ntende la dfferenza fra lmte superore e lmte nferore della stessa. Infne la semsomma de due lmt è defnta valore centrale della classe. Una varable statstca è dunque defnta dall nseme de valor osservat d un carattere quanttatvo e dalle frequenze a ess assocate. Invece delle frequenze assolute s possono assocare a valor della varable le frequenze relatve, che s ottengono dvdendo ogn frequenza per la somma totale delle frequenze stesse. b) mutable statstca. Quando l carattere che nteressa la rlevazone è un carattere qualtatvo, la dstrbuzone confgurata prende l nome d mutable statstca ed è defnta dall nseme delle modaltà osservate d un carattere qualtatvo e dalle frequenze a esse assocate. La m.s. può essere: - rettlnea se le modaltà ammettono un ordne d successone naturale, con una modaltà nzale e una fnale Esempo: Mutable rettlnea relatva al rendmento d 00 scrtt ad un corso d laurea x n suffcente 3 buono 37 dscreto 4 ottmo cclca se le modaltà ammettono un ordne d successone ma non è possble, a meno d una convenzone, stablre quale sa l valore nzale e quale quello fnale (per esempo gorn della settmana) - sconnessa, se le modaltà non ammettono alcun ordne d successone, come ad esempo nel caso delle nazonaltà o delle professon (la dstrbuzone degl scrtt all unverstà d Torno, vsta n precedenza, è un esempo mutable sconnessa) c) Tp specfc d varabl statstche sono quelle nelle qual le modaltà sono rappresentate da stant (o perod) d tempo e quelle n cu sono rappresentate da dvson terrtoral scelte. Tal tabelle sono rspettvamente le sere storche e le sere terrtoral. Dunque le dstrbuzon statstche possono essere schematzzate nel modo seguente. 4
18 5. Frequenze Oltre alle frequenze assolute, che ndcano esattamente l numero d volte n cu una modaltà s presenta n una popolazone, esstono altr tp d frequenze che possono essere assocate alle modaltà. L esstenza e l calcolo d vare frequenze è gustfcato dal fatto che, cascuna d esse, fornsce un nformazone agguntva rspetto alle frequenze assolute e permette d esegure alcune operazon specfche: a) frequenze cumulate sono quelle frequenze che assocano a ogn valore della varable dscreta (o a ogn classe della varable contnua) la somma della rspettva frequenza assoluta con le frequenze assolute de valor precedent. j =,,..., k = n = n + n n j =,,..., = Esempo: Varable dscreta relatva agl nvestment pubblctar d 30 azende n mglaa d euro x n = = =30 30 / 5
19 b) frequenze relatve f sono quelle ottenute dal rapporto fra le frequenze assolute e l numero totale d untà: f = n. Relatvzzare un valore, n questo caso una frequenza, consente d rendere le msure delle frequenze confrontabl per var grupp, cò poché le frequenze relatve hanno l mportante propretà d avere somma par ad. Esempo: Varable dscreta relatva agl nvestment pubblctar d 30 azende n mglaa d euro x n f 0 6 0, , , ,33 30 c) frequenze relatve cumulate F sono le frequenze che assocano a ogn valore della varable dscreta (o a ogn classe della varable contnua) la somma della rspettva frequenza relatva con le frequenze de valor precedent. j =,,..., k F = f F = f + f j =,,..., = f Esempo: Varable dscreta relatva agl nvestment pubblctar d 30 azende n mglaa d euro x f F 0 0, 0, 35 0,3 0,+0,3=0,5 50 0,6 0,+0,3+0,6=0, ,33 0,+0,3+0,6+0,33= / d) frequenze percentual p sono date dalle frequenze relatve moltplcate per cento. p = f 00 Esempo: Varable dscreta relatva agl nvestment pubblctar d 30 azende n mglaa d euro x f p 0 0, 0% 35 0,3 30% 50 0,6 6% 75 0,33 33% 00% 6
20 e) Frequenze percentual cumulate P P = F 00 Esempo: Varable dscreta relatva agl nvestment pubblctar d 30 azende n mglaa d euro x f F P 0 0, 0, 0% 35 0,3 0,5 50% 50 0,6 0,67 67% 75 0,33 00% / / f) Denstà d frequenza h Questo tpo d frequenza s può calcolare solamente n caso d modaltà rappresentate da class d frequenza e usa per la realzzazone degl stogramm (rappresentazon grafche per caratter quanttatv contnu). Le denstà d frequenza sono date dal rapporto fra le frequenze assolute e le ampezze delle class: n h = con a = x + x a Talvolta le rlevazon statstche sono effettuate consderando per ogn untà statstca l andamento de valor rfert a pù d un carattere. La rappresentazone n tabelle d tal rlevazon da orgne alle tabelle a doppa entrata, nel caso d due caratter e alle tabelle multple nel caso d pù d due caratter Le tabelle a doppa entrata rappresentant dstrbuzon d frequenza possono essere: - d contngenza, se due caratter sono entramb qualtatv (s parla d mutable statstca doppa), - d correlazone, se due caratter sono entramb quanttatv (s parla d varable statstca doppa), - mste, se uno de due caratter è qualtatvo e l altro quanttatvo. Esempo: Mutable statstca doppa (tabella d contngenza) relatva al numero d turst (n mglaa), n alcune cttà talane n un dato mese. TURISTI CITTA Italan Straner TOTALI Veneza 4 6 Frenze Roma Torno apol TOTALI RAPPRESETAZIOI GRAFICHE Le tabelle statstche sono un prmo strumento d presentazone de dat. Oltre alle tabelle, dat possono essere presentat anche attraverso rappresentazon grafche. Le rappresentazon grafche offrono numeros VATAGGI: 7
21 - descrvono l fenomeno n forma vsva e permettono d esamnare l andamento n modo globale e d confrontare caratter dvers dello stesso fenomeno e le sue varazon nel tempo e nello spazo. - sono molto pù espressve d una tabella d valor. I grafc, essendo d facle lettura, permettono nfatt a tutt d capre l andamento d un fenomeno. Le rappresentazon sono utlzzate con un duplce SCOPO: a) descrttvo quando vengono utlzzate, come gà detto, per permettere d esamnare l fenomeno n forma vsva b) scentfco se s utlzzano per rcercare l modello matematco alla base del fenomeno (ossa una funzone che ne esprma l andamento). S utlzzano dvers TIPI d rappresentazon grafche:. Pttogramm a fgure rpetute, utlzzat quando l grafco deve servre, pù che come metodo d studo, come metodo d dvulgazone al pubblco de dat. S utlzzano allora de motv deografc che, opportunamente affancat da una legenda, offrono un dea del fenomeno n esame. e pttogramm ad ogn mmagne corrsponde una data ntenstà del fenomeno. Occorre tuttava osservare che questo genere d rappresentazon non sono sempre corrette. Cò accade quando nel rappresentare l raddoppamento d un fenomeno da un anno all altro s utlzz una fgura che è l doppo d dmenson della prma. In questo caso, nfatt, s avrà un mmagne d dmensone quadrupla rspetto alla precedente e percò stesso errata. Una corretta rappresentazone dovrebbe raddoppare l area della fgura e non le sue dmenson. Peraltro una corretta legenda può essere d auto n tal senso, gudando l osservatore nella nterpretazone della rappresentazone. Esempo: Pttogramma della produzone mensle d auto d 3 case automoblstche: la prma ha prodotto 00 mla auto, la seconda 80 mla e la terza 30 mla. Dagramm cartesan. Fanno uso delle coordnate cartesane ortogonal del pano. Sull asse delle ascsse s usa rappresentare le modaltà del fenomeno, mentre su quello delle ordnate vengono rappresentate le corrspondent frequenze. S ndvduano qund punt nel pano corrspondent alle coppe d valor (modaltà e frequenze corrspondent). A questo punto, nel caso d caratter quanttatv dscret, s traccano delle lnee vertcal n corrspondenza d cascuna modaltà, avent altezza par alla frequenza corrspondente a quella modaltà. el caso d sere storche, nvece, s congungono punt successv con de segment n manera da formare una spezzata. 8
22 DIAGRAMMA A LIEE DELLE ALTEZZE Istogramm: anche questo tpo d rappresentazone fa uso del pano cartesano. S utlzza nel caso d sere statstche contnue, coè cu caratter sono contnu o dscret ma con un gran numero d modaltà. Fssato un sstema d ass cartesan ortogonal, sull asse delle ascsse s rportano tant ntervall consecutv quante sono le class; su quest ntervall s costruscono de rettangol le cu aree sono proporzonal alle frequenze. Cò vale a dre che su un segmento d base par all ampezza della classe s costrusce un rettangolo d altezza par al rapporto fra la frequenza totale d quella classe e l ampezza della classe stessa, ovvero la denstà d frequenza. Solo nel caso n cu le class abbano la stessa ampezza basterà rportare altezze proporzonal alle frequenze. Con gl stogramm la somma delle aree d tutt rettangol è proporzonale alla somma delle frequenze. Esempo: Varable statstca contnua della lunghezza d 4 fum amercan n km x - x + n a h , , , , , , ,00 4 / / Esempo: Istogramma relatvo alla lunghezza d 4 fum amercan n km 9
23 4. Dagramma F ntegrale. S ha a che fare con questo tpo d dagramma quando vengono rappresentate, nvece delle frequenze assolute, le frequenze cumulate (coè le frequenze rspettvamente mnor o ugual o maggor d cascuna modaltà successva) o ancora possono essere rappresentate le cosddette le frequenze relatve cumulate (n altre parole le frequenze de valor maggor o uguale d ogn successva modaltà n relazone alla frequenza totale). L opportuntà della presa n consderazone d questo tpo d frequenza sta nella crcostanza che la somma totale delle frequenze relatve accumulate (o funzon d rpartzone) è sempre uguale a e cò ne faclta la rappresentazone grafca. Il dagramma ntegrale s costrusce rappresentando le successve frequenze cumulate o cumulate relatve, x n corrspondenza degl estrem superor delle class e congungendo fra loro var punt con una spezzata. Questo stesso genere d rappresentazone è quella che vene utlzzata ad esempo per le sere storche che hanno la caratterstca d avere sulle ascsse, come modaltà, gl ann o perod d tempo che sono stat oggetto della rlevazone. Funzone d rpartzone della varable Investment pubblctar d 30 azende n mglaa d euro 5. Dagramma a settor crcolar. Questo genere d rappresentazone s utlzza per le m.s. sconnesse. All nterno d un cercho o un semcercho s rappresentano tutte le modaltà, ognuna con frequenza par all area della sezone del cercho che occupano. L ampezza d ogn settore sarà data dalla formula: : n = 360 : α. Dove n è la frequenza della modaltà a ed è la frequenza totale. PROVEIEZA DEI 465 ISCRITTI AD UA FACOLTA' UIVERSITARIA SCIETIFICA ESTERA ARTISTICA PROFESSIOALE MAGISTRALE TECICA LIGUISTICA CLASSICA 0
24 6. dagramma a nastr. Per la rappresentazone delle mutabl statstche sconnesse talvolta s utlzzano de nastr orzzontal. Questo metodo però necessta del preventvo ordnamento de dat. Esempo: Dagramma a nastr del carattere Abtudne al fumo d 57 student d una scuola superore puglese student - Smoke ever Occas Regul Heavy Dagramma a barre vertcal. Per la rappresentazone delle mutabl statstche ordnabl s possono utlzzare barre vertcal avent altezza par alle frequenze. Esempo: Rappresentazone della mutable rettlnea relatva al rendmento d 00 scrtt ad un corso d laurea 8. Cartogramm. Sono tp d rappresentazon utlzzate per le sere terrtoral. Per realzzarle s utlzza lo schema della carta geografca dell area oggetto d rlevazone, utlzzando de smbol n ogn area o una colorazone partcolare per rappresentare l ntenstà del fenomeno.
25 Esempo: umero d operator del settore ol extravergne d olva DOP e IGP per regone (anno 009). 9. uvola d punt. È questo l prmo de metod che s utlzzano per rappresentare le varabl o mutabl statstche doppe o multple. Quando s devono rappresentare coppe d valor corrspondent s utlzza un sstema d ass cartesan all nterno del quale s ndvduano tant punt quante sono le coppe d valor corrspondent alle ntenstà o frequenze ndvduate per ogn coppa d modaltà. SCATTERPLOT DELLE ALTEZZE E DEI UMERI DI SCARPA altezze n. scarpa Regole mportant da osservare nella rappresentazone grafca: Quando s realzzano de grafc è necessaro prestare attenzone ad alcune mportant regole: ) La rappresentazone deve essere autonoma dalla tabella che la ha orgnata, nel senso che deve contenere tutte le nformazon utl per la sua esatta nterpretazone.
26 ) Conseguentemente l ttolo deve contenere: a. Oggetto della rappresentazone (cosa) b. Epoca (quando) c. Ambto terrtorale (dove) Esempo: Student resdent n Itala per rpartzone geografca, 990. Consum fnal delle famgle per tpo d consumo, composzone percentuale, anno ) E necessaro ndcare nel grafco: a. Qual caratter sono stat osservat sulle untà. b. Le untà d msura. La scelta delle untà d msura è arbtrara e ha un mportanza rlevante se s pensa che sceglendo opportunamente la scala d msura s può dare maggore o mnore rsalto a alle varazon delle frequenze e delle modaltà o s può ruscre a rsolvere problem d rappresentazone dovut alla presenza d ntervall assolut fra le modaltà o le frequenze d ampezza molto elevata. Molto d frequente s utlzzano le scale logartmche (che consstono nel sostture a cascuna modaltà o frequenza l suo corrspondente logartmo naturale). Questa scala fa s che gl ntervall sugl ass sano rappresentatv d rapport fra fenomen rappresentat e qund delle loro dfferenze relatve. (ad ntervall ugual sugl ass corrspondono rapport ugual de valor) c. Gl eventual troncament d scala d. Se sono stat nsert pù caratter della varable, quest devono essere ndcat n manera dversa e. La legenda, quando necessara, va posta alla base del grafco. ESERCIZI - ESERCIZIO D seguto sono rportate le votazon fnal n centesm d 0 student al test d ammssone al corso d Laurea n Botecnologa Indvduare l tpo d carattere. Realzzare la varable statstca relatva al carattere voto n centesm 3. Calcolare le frequenze cumulate, le frequenze relatve, relatve cumulate, e percentual; 4. Rappresentare grafcamente la dstrbuzone ESERCIZIO D seguto sono rportate le lunghezze d 40 fogle d platano, regstrate al mllmetro pù prossmo:
27 . Indvduare l tpo d carattere. Realzzare la varable statstca relatva al carattere lunghezza delle fogle utlzzando la suddvsone n class rtenuta opportuna; 3. Calcolare le frequenze cumulate, le frequenze relatve, relatve cumulate, percentual e le denstà d frequenza; 4. Rappresentare grafcamente la dstrbuzone. ESERCIZIO 3 D seguto è rportato l corso d laurea d 6 student scrtt alla facoltà d Lettere e flosofa dell Unverstà d Udne nell anno 00 C C D D D D L D C C D L L D C D C= Conservazone de ben cultural D= Dams L= Lettere. Indvduare l tpo d carattere. Realzzare la dstrbuzone statstca relatva al carattere Corso d Laurea ; 3. Calcolare le frequenze cumulate, le frequenze relatve, relatve cumulate e percentual; 4. Rappresentare grafcamente la dstrbuzone. ESERCIZIO 4 D seguto è rportato l grado d soddsfazone d 6 student scrtt alla facoltà d Lettere e flosofa dell Unverstà d Udne nell anno =nsoddsfatto =poco soddsfatto 3=soddsfatto 4=molto soddsfatto. Indvduare l tpo d carattere. Realzzare la dstrbuzone statstca relatva al carattere Corso d Laurea ; 3. Calcolare le frequenze cumulate, le frequenze relatve, relatve cumulate e percentual; 4. Rappresentare grafcamente la dstrbuzone. 7.A. GLI IDICATORI STATISTICI 7.A. Defnzon Dopo aver effettuato una raccolta d dat e dopo aver sstemato dat ottenut n tabelle statstche è mportante effettuare una sntes sulle dstrbuzon al fne d consentre la comparazone del fenomeno oggetto d studo con altr fenomen dello stesso tpo o d tpo dverso per qual abba senso un confronto de valor. È qund necessaro trovare un valore che sappa sntetzzare l fenomeno coglendo l sottofondo costante esstente fra le sngole osservazon. È ovvo però che attraverso la sntes s chede all ndce d esprmere la dstrbuzone secondo poch aspett o uno solo, quello che sembra pù mportante ed è ovvo che l dato d sntes così costruto porta ad una perdta d nformazone. Lo scopo degl ndcator statstc, dunque, è quello d sntetzzare n un sngolo valore numerco l ntera dstrbuzone d frequenza al fne d ottenere valor confrontabl nel tempo, nello spazo o tra crcostanze e fenomen dfferent ma n qualche modo assmlabl. 4
28 7.A. Requst Gl ndcator statstc (mede) devono soddsfare uno o entramb seguent requst: Condzone d nternaltà d CAUCHY: Il valore sntetco ( x ) deve essere compreso fra l valore pù grande e l pù pccolo della dstrbuzone: x < x < x ( ) ( s) Condzone d nvaranza d CHISII: Il valore sntetco deve essere tale che, sosttuto a cascuna osservazone, sa rappresentatvo della dstrbuzone, ovvero possa essere sosttuto a cascuna delle osservazon, lascando mmutata la quanttà assunta come nvarante e rappresentata da una funzone f. In altre parole deve valere la seguente uguaglanza: per le sere d valor: f ( x, x,..., x ) f ( x, x,..., x) = per le dstrbuzon: f ( x, x,..., xs ) f ( x, x,..., x) = C sono dvers tp d ndcator statstc e non tutt soddsfano contemporaneamente queste due condzon. In partcolare abbamo: 5
29 7.B. IDICI STATISTICI DI POSIZIOE O MEDIE LASCHE O MEDIE BASATE SULL ORDIAMETO DEI DATI: Questo prmo tpo d mede sono defnte n modo generale mede nterne perché soddsfano la condzone d nternaltà d Cauchy. Per la loro determnazone è necessaro preventvamente ordnare dat n ordne non decrescente e qund queste mede non possono essere calcolate per mutabl sconnesse), ma possono essere calcolat per tutt gl altr tp d varabl. Inoltre, sono defnte mede lasche perché non tengono conto d tutt valor della sere o dstrbuzone ma solo d alcun; mede d poszone perché ndvduano la poszone occupata da una partcolare modaltà; nfne sono defnte mede basate sull ordnamento de dat perché sono, appunto, basate sulla poszone degl element della varable. Le mede poszonal sono: - I Valor estrem - Il Valore Centrale o Campo d Varazone - La medana - I quantl. - la Moda, che studeremo n questo gruppo anche se n realtà non fa parte d nessuno de grupp d mede vst. 7.B. Valor estrem Quest ndc poszonal, nseme al valore centrale e al campo d varazone, possono essere calcolat solo nel caso d varabl quanttatve, sa contnue che dscrete. Precsamente: x è l prmo valore della dstrbuzone (ordnata) x è l ultmo valore della dstrbuzone. - mn - max 7.B. Valore centrale Anche questo ndce è calcolable soltanto per varabl quanttatve sa contnue, che dscrete ed è x max + x dato dalla semsomma del mnmo e del massmo: mn. Questo ndce possede l grosso svantaggo d essere fortemente nfluenzato da eventual valor anomal della dstrbuzone, laddove, per valor anomal s ntendono que valor molto grand o molto pccol rspetto alla maggor parte de valor della dstrbuzone o della sere. In genere, nella rcerca d un ndcatore, s cerca d evtare che tale valore sa nfluenzato da dat anomal. Tuttava l valore centrale è utle n alcune stuazon. 7.B.3 Medana La medana è quella modaltà che bpartsce la sere o dstrbuzone d dat lascando ugual numero d termn da un lato e dall altro. Per la sua determnazone, come per le altre mede nterne, è necessaro ordnare prelmnarmente dat. In sostanza la Medana bpartsce la dstrbuzone n due sotto-dstrbuzon: la prma a snstra della Medana (costtuta dalla metà delle untà la cu modaltà è mnore o uguale alla Medana) e la seconda a destra della Medana (costtuta dalla metà delle untà la cu modaltà è maggore o uguale alla Medana). Tecncamente s afferma che la medana è l valore/modaltà per l quale frequenza relatva cumulata vale 0,5. 6
30 La medana può essere calcolata per caratter quanttatv e qualtatv ordnabl ma non per caratter qualtatv sconness, poché quest non possono essere ordnat. Il suo calcolo è dfferente a seconda che sa par o dspar e, anche, a seconda del tpo d dstrbuzone.. MEDIAA PER SERIE STATISTICHE CO CARATTERI QUATITATIVI DISCRETI In questo caso le sngole osservazon vanno ordnate n modo non decrescente e l valore medano è dfferente ne due seguent cas: - Se è un numero par - Se è un numero dspar x( ) + x( + ) Me = Me = x +. MEDIAA PER VARIABILI STATISTICHE DISCRETE In questo caso la medana è calcolata utlzzando le frequenza cumulate. La medana è data dalla modaltà che rcopre l posto centrale nella sequenza delle frequenze cumulate e qund le formule per l calcolo della medana sono le stesse vste per le sere con la sola dfferenza che dovremo guardare le frequenze cumulate e non quelle assolute : - Se è un numero par - Se è un numero dspar x( ) + x( + ) Me = Me = x + 3. MEDIAA PER VARIABILI STATISTICHE DISCRETE Se le modaltà sono raggruppate n class, non s defnsce un valore unvoco, ma una classe medana x x + determnata consderando frequenze cumulate: la classe medana è, coè, la classe la cu frequenza cumulata è mmedatamente superore a /. Pur essendo corretto consderare un qualsas elemento dell'ntervallo medano un valore medano s è solt procedere, al fne d avere una msura unca del valore, ad un'approssmazone della medana con la una formula calcolata, anch essa, utlzzando le frequenze cumulate. Precsamente l valore medano vene rcercato medante una funzone nterpolatrce che s ottene attraverso una smltudne fra trangol nel grafco delle frequenze cumulate. A ttolo d esempo, per comprendere come s ottene la formula, consderamo la dstrbuzone delle altezze n cm d 00 ragazz d una scuola, dvsa per class, nel modo seguente: Varable statstca contnua relatva all altezza d 00 ragazz d una Scuola meda puglese nell a.s x - x + n TOTALE 00 7
31 Qund consderamo l grafco delle frequenze cumulate relatvo a tale varable (la spezzata rossa nel grafco rportato d seguto): In questo grafco la medana corrsponderebbe al valore sull asse delle ascsse n corrspondenza d /=00. Per ottenere tale punto s fa rfermento al teorema su trangol sml, per cu s ha: AF : AD = FE : DB Ovvero, nel nostro caso: a : 0 = 78 : 84 da cu: 0 78 a =. 84 Ora rflettamo sul fatto che Me non è altro che a + l valore x -, ovvero 60, per cu: 0 78 Me = Che può essere scrtto come Me 0 x x = x + 84 = Da cu, se ndchamo d Me = x + n d l ampezza della classe, ottenamo la formula della medana: 8
32 dove x è l estremo superore della classe (-)esma - - d è l ampezza della classe - è la frequenza cumulata della classe precedente - è l valore della dstrbuzone della medana. 4. MUTABILI QUALITATIVE ORDIABILI La medana n questo caso non può che essere ndvduata semplcemente osservando le frequenze cumulate e la modaltà a cu corrsponde la frequenza medana. Rcaptolamo quanto vsto fno ad ora n uno schema: 7.B.4 Propretà della medana Prma d passare alla anals d un altro tpo d meda rcordamo brevemente le propretà e vantagg della medana: - la medana può sempre essere calcolata e percò vene utlzzata ogn volta che non è possble calcolare la meda artmetca. - La medana è l valore che occupa la poszone centrale nell elenco ordnato de valor della sere o dstrbuzone e pertanto ha l vantaggo d non essere nfluenzato da valor estrem che possono essere valor anomal (outlers). Per tale motvo è ndcato come ndce robusto. - La medana gode d una mportante propretà defnta Propretà d mnmo. Per tale propretà, dopo aver defnto la quanttà x Me scarto dalla medana, affermamo che la somma degl scart n valore assoluto dalla medana è un mnmo, coè: s = x Me = mn E qund la somma de valor assolut degl scart da qualunque altro valore generco k, sarà maggore: 9
33 s x Me < = = s 7.B.5 Quantl e quartl x k k Me I quantl sono que valor che dvdono la sere o la dstrbuzone n h part, ognuna avente la h- esma parte della numerostà del collettvo. aturalmente se la sere o dstrbuzone è dvsa n h part allora quantl saranno h-. Quando, n partcolare, h=4 allora quantl prendono l nome d QUARTILI, dvdono la sere o dstrbuzone n 4 part e sono 3; l chameremo Q, Q e Q 3 e dremo che: - l I quartle Q contene l 5% della dstrbuzone (e ne lasca dopo d se l 75%) - l II quartle Q contene l 50% (ne lasca dopo d se l 50% e concde con la medana) - l III quartle Q 3 contene l 75% ( e ne lasca dopo d se l 5%) I quartl non possono essere calcolat per varabl qualtatve sconnesse per lo stesso motvo per cu non può essere calcolata la medana e coè perché le modaltà non sono suscettbl d alcun ordnamento. I quartl e quantl n generale s calcolano con una metodologa del tutto analoga a quella con la quale s calcola la medana (poché hanno un sgnfcato molto smle). Analogamente a quanto vsto per la medana, pertanto, anche per quartl bsogna dstnguere var cas:. QUARTILI PER SERIE STATISTICHE CO CARATTERI QUATITATIVI DISCRETI In questo caso è necessaro ordnare valor e qund calcolare quartl n modo dfferente a seconda che l valore /4 abba un resto oppure no, a seconda coè che sa o meno dvsble per 4. - Se è dvsble per 4 naturalmente sarà par percò, analogamente alla medana: Q = Q = 3 x + 4 x x x Se non è dvsble per 4 allora avremo un resto che chameremo h e quartl saranno seguent: Q = x Q h + 4 = x 3 3 h 4. QUATILI PER VARIABILI STATISTICHE DISCRETE Anche questo caso è analogo a quello della medana. Pertanto occorrerà calcolare le frequenza cumulate e ndvduare quartl con le stesse formule vste nel caso d sere d valor, ma guardando questa volta le frequenze cumulate. 30
34 - Se è dvsble per 4 naturalmente sarà par, percò: Q Q 3 = = x + 4 x x + 4 x Se non è dvsble per 4 allora avremo un resto che chameremo h e quartl saranno seguent: Q = x Q h + 4 = x 3 3 h QUATILI PER VARIABILI STATISTICHE COTIUE Come abbamo verfcato per la medana, anche qu utlzzamo formule nterpolatc che utlzzano le frequenze cumulate. Rflettendo sul grafco precedentemente llustrato s ottene quanto segue: d - I quartle: Q = x + n 4 d - II quartle = medana: Q = x + n d 3 - III quartle: Q 3 = x + n 4 4. QUARTILI PER VARIABILI QUALITATIVE ORDIABILI Osservazone Anche n questo caso, come per la medana, bsognerà fare un calcolo manuale sempre consderando le frequenze cumulate e purché s abba a che fare con mutabl ordnabl. I quartl, nseme a centl, sono l tpo pù usato d Quantl. Pù n generale, può essere utle suddvdere una qualunque dstrbuzone n q dstrbuzon parzal, avent, ognuna, la q-esma parte della numerostà. La modaltà che fa da cardne fra due dstrbuzon parzal successve è, appunto l quantle. Rcaptolamo quanto vsto fno ad ora n uno schema: 3
35 7.B.6 Moda La moda è la modaltà che presenta la frequenza pù elevata rspetto alle modaltà adacent. Questo ndcatore può essere calcolato sa per caratter qualtatv che per caratter quanttatv ma solo per dstrbuzon (coè quando dat sono raffgurat n tabelle) e non per sere. Per dstrbuzon d caratter quanttatv dscret la moda è: n > n Mo = x ' n > n+ Per le dstrbuzon dvse n class n partcolare la moda è la frequenza della classe che presenta la maggore denstà d frequenza e vene d solto assocato al valore centrale della classe. h > h Mo = x x ' h > h + Questo tpo d meda non appartene a nessuna delle due categore d mede poché non soddsfa nessuna delle due condzon vste. V sono due cas partcolar d moda: - Quando n una dstrbuzone s hanno pù modaltà con frequenza ( o class d modaltà con denstà d frequenza ) pù elevata rspetto a quelle adacent s dce che s ha una DISTRIBUZIOE PLURIMODALE e la modaltà ( o classe d modaltà) con la frequenza pù elevata vene detta MODA PRICIPALE. - Se la moda nvece cade n uno degl estrem della dstrbuzone s dce che la dstrbuzone è ZEROMODALE. 3
36 µ n = = x n CORSO ELEMETI DI STATISTICA DOTT. CRISTIA MUSCHITIELLO A.A. 0/0 7.C. MEDIE AALITICHE. Le mede analtche sono quelle mede che soddsfano anche la condzone d nvaranza d Chsn, coè: per le sere d valor: f ( x, x,..., x ) = f ( x, x,..., x) per le dstrbuzon: f ( x, x,..., xs ) f ( x, x,..., x) = dove f è un qualunque operatore matematco, al varare del quale s ottene un tpo dverso d meda analtca. In partcolare se sceglamo f =somma ottenamo la meda artmetca. 7.C. Meda artmetca Defnzon: La meda artmetca è quel valore che sntetzza l carattere d un collettvo statstco lascando nvarato l ammontare totale del carattere stesso, vale a dre che sosttuendo la meda a tutt valor del carattere rmane nvarato l ammontare del carattere. x + x x = M + M M Coè: volte = x = M Da cu la meda artmetca µ per sere d valor: Esempo: La meda artmetca della seguente sere d valor: E data da: µ = = = 4, Per una v.s. dscreta rappresentata da una dstrbuzone d frequenza, la meda artmetca s dce ponderata ed è par a:. 33
37 Esempo: Per calcolare a meda artmetca della seguente dstrbuzone Varable statstca dscreta relatva agl nvestment pubblctar d 30 azende n mglaa d euro x n E necessaro aggungere una colonna alla tabella con l valore d prodott d modaltà per frequenze E qund la meda è data da: µ = n x n = = = = x n x n ,83 Infne quando s abba a che fare con una dstrbuzone statstca dvsa n class, per calcolare la meda artmetca s parte da alcune potes: Innanztutto s potzza che la classe sa equamente dstrbuta e pertanto la meda s calcolerà prendendo n consderazone l valore centrale della classe e ponendolo par ad x'. n x' n = µ =. Esempo: La meda per la varable relatva all altezza, gà vsta n precedenza: Varable statstca contnua relatva all altezza d 00 ragazz msurata n cm x - x + n x x n
38 µ = n x' n = = = = 73,5.B.: Quando le calss esteme sono aperte, l valore centrale vene scelto arbtraramente, potzzando una ampezza della classe opportuna. 7.C. Propretà della meda artmetca La meda artmetca gode d mportant propretà: ) La somma algebrca degl scart dalla meda artmetca x µ è uguale a zero. Coè n formula: s ( x µ ) = = 0 Infatt nella formula nvarante della meda artmetca: x n + xn xsns = µ ( n + n n s Se portamo tutto al secondo membro ottenamo propro: s s s n = 0 = ( x µ ) n + ( x µ ) n ( x µ ) n = ( x µ ) ) La somma de quadrat degl scart è un mnmo ) Ovvero è mnore della somma degl scart d x da un qualunque altro valore k dverso da 0 µ ( x k) = ( x µ ) + ( k ) dove n( µ k) è una quanttà postva. 3) La meda artmetca non è nvarante per traslazon, coè aggungendo a cascuna modaltà della dstrbuzone una costante, anche la meda rsulterà essere traslata d un valore corrspondente propro alla costante: se x ' = x + a µ ' = a + µ 4) La meda artmetca non è nvarante per cambament d untà d msura, coè : x ' = bx µ ' bµ = Dalle propretà 3 e 4 dervano le ultme due: 5) La meda artmetca è assocatva, ovvero la meda generale può otteners come meda ponderata delle mede parzal. 35
39 µ µ = + µ µ k k k 6) La meda artmetca non è nvarante per la pù generale trasformazone lneare α + βx, coè: x ' = α + βy µ ' = α + βµ. Questa propretà è detta lneartà della meda artmetca ed mplca: - la propretà traslatva se s pone β= - l cambamento d scala ponendo α=0. 7.C.3 Osservazon sulla meda artmetca - La meda artmetca è consderata la meda per eccellenza ma non sempre rsulta la mglore. Cò poché per l suo calcolo s presuppone che l andamento del fenomeno sa lneare e pù precsamente che dat sano n regressone artmetca - La meda artmetca è consderata l BARICETRO d una sere o dstrbuzone poché rappresenta l centro d tutt valor. - Vene anche defnta VALORE DI TEDEZA CETRALE coè l valore verso l quale tendono tutt gl altr valor d una sere o dstrbuzone, coè ancora l valore pù vcno a tutt gl altr. 7.C.4 Caratterstche della meda artmetca - è espressa nella stessa untà d msura delle osservazon - soddsfa la condzone d nternaltà d CAUCHY - soddsfa la condzone d CHISII poché lasca nvarato l ammontare complessvo del fenomeno: n x = = n = µ - Se l valore della meda corrsponde ad un valore della dstrbuzone allora la meda s defnsce MEDIA EFFETTIVA O MEDIA REALE, s nvece non concde con una delle modaltà della dstrbuzone, la meda artmetca è detta MEDIA DI COTO. - Questa meda è utlzzata esclusvamente per fnaltà d tpo addtvo lneare. - La meda artmetca O è un ndce robusto poché tene conto e vene nfluenzata dalla eventuale presenza d valor anomal. 36
40 ESERCIZI - ESERCIZIO 5 Utlzzando la varable statstca dscreta costruta nell ESERCIZIO, ndvduare:. l mnmo e l massmo,. l valore centrale, 3. la moda, 4. la medana e quartl, 5. la meda artmetca. ESERCIZIO 6 Utlzzando la varable statstca contnua costruta nell ESERCIZIO, ndvduare:. l mnmo e l massmo,. l valore centrale, 3. la moda, 4. la medana e quartl, 5. la meda artmetca. ESERCIZIO 7 Utlzzando la varable statstca contnua costruta nell ESERCIZIO 3, calcolare tutt gl ndcator statstc possbl. ESERCIZIO 8 Utlzzando la varable statstca contnua costruta nell ESERCIZIO 4, calcolare tutt gl ndcator statstc possbl. 8.A. IDICI DI VARIABILITA Le nformazon fornte dalle mede non sono suffcent da sole a caratterzzare una dstrbuzone. È necessaro, coè, ntegrare tal nformazon con altre che tengano conto del grado d dspersone delle modaltà ntorno alla meda o d quanto le modaltà con cu l carattere è presente dfferscano fra loro. Tal ndc sono gl ndc d varabltà. Defnzone: gl ndc d varabltà sono quegl ndc che danno una msura della dstrbuzone rspetto ad una meda, o d quanto dfferscano fra loro le modaltà present nelle untà, basandos su msure della dverstà fra due quanttà. Caratterstche: un ndce d varabltà deve soddsfare le seguent condzon: - se le x sono ugual fra loro la varabltà deve essere nulla: se x =x = =x allora Va=0 - una msura d varabltà deve essere tanto pù grande quanto pù grande è la dfferenza fra dat. Le msure d varabltà s dstnguono n: 37
41 ) IDICI BASATI SULL ORDIAMETO DEI DATI a. Campo d varazone b. Dfferenza nterquartlca ) MISURE DI DISPERSIOE a. Devanza b. Varanza c. Scarto quadratco medo 3) MISURE DI DISUGUAGLIAZA a. Indce d dsuguaglanza d GII La seconda categora è quella pù utlzzata. Inoltre, tranne la prma categora, che può essere nulla anche quando le modaltà non sono tutte ugual fra loro, le altre soddsfano entrambe le due condzone vste prma. Infne, notamo che gl ndc d varabltà possono essere calcolat soltanto per caratter quanttatv e nemmeno per qualtatv ordnabl. Cò poché quest ultm sono su scala ordnale ma non dstanzata percò per ess ha senso solo osservare se sono dvers o se uno e maggore o mnore dell altro, ma non ha senso fare dfferenza né tantomeno rapport. Per caratter qualtatv studeremo n seguto delle msure specfche d calcolo che defnremo d MUTABILITÁ. Possamo schematzzare gl ndc d varabltà come segue: 38
42 8.B. IDICI DI VARIABILITA BASATI SULL ORDIAMETO DEI DATI 8.B. Campo d varazone S calcola facendo la dfferenza fra l valore massmo e l mnmo della dstrbuzone: W = x( ) x( ) per sere e W = x( s) x( ) per dstrbuzon. otamo che se x = x allora W=0 (percò vale la prma condzone). on è però detto che valga la seconda condzone, nfatt, se, ad esempo, nella sere v sono valor anomal, quest aumentano la dfferenza fra dat, ma l campo d varazone è lo stesso rspetto a quello d una dstrbuzone dove non v sono valor anomal. S dce, dunque, che questo ndce O È robusto. Vene utlzzato prncpalmente nel campo ndustrale per controllare la qualtà d un prodotto generato da una lavorazone n sere, l quale deve avere prefssat lmt d altezza o do peso. In cas del genere ndvdua rapdamente la varabltà delle caratterstche del prodotto per poter bloccare n tempo la produzone nel caso che la stessa ecceda lmt che s sono prefssat. 8.B. Dfferenza nterquartlca È data dalla dfferenza fra l terzo e l prmo quartle: D q = Q 3 Q. Questo ndce c dce come s comporta l 50% centrale della dstrbuzone ed è certamente pù robusto del precedente, poché non è nfluenzato da valor anomal, nfatt s elmnano le code della dstrbuzone. on soddsfa però la prma caratterstca, poché l terzo e l prmo quartle possono concdere anche se la dstrbuzone è varable..b.: s possono costrure anche dfferenze nterdeclche o ntercentlche che avranno sgnfcato molto smle a quello d Dq. 8.C. MISURE DI DISPERSIOE Per msure d dspersone s ntendono tutt quegl ndc che msurano la dspersone d ogn termne della dstrbuzone della meda, sono, coè, basat sugl scart x -µ. Le devazon sono postve per tutt valor pù grand della meda e negatve per valor pù pccol della meda, noltre, per la prma propretà della meda artmetca, se s sommano gl scart, quest s annullano. Se, però, s consderano valor assolut degl scart, quest sono ndcatv della varabltà d una sere, n partcolare, pù alt sono gl scart n valore assoluto d ogn modaltà rspetto alla meda, maggore è la varabltà, coè appunto la dspersone delle modaltà ntorno al valore rappresentatvo che è la meda. Un modo per eludere l problema dell annullamento degl scart, è quello d consderarne l quadrato. Gl ndc d dspersone sono basat su tal dat. Tale scelta è legata al fatto che per la seconda propretà della meda artmetca, la somma d tal valor è un mnmo, questo garantsce che ess sano n grad d rappresentare la varabltà d una sere n modo sntetco pù d qualunque altra metodologa. Gl ndc d questo tpo soddsfano, tutt, sa la prma condzone, che la seconda. 39
43 8.C. Devanza La devanza è data da: ( x ) Dev( x) = µ nel caso d sere = s = ( x ) n Dev( x) = µ nel caso d dstrbuzon. Questo ndce presenta l nconvenente d non essere espresso n termn della numerostà del collettvo, esso, coè, aumenta con l aumentare della numerostà e cò lo rende un valore non faclmente nterpretable: s dce che la devanza esprme un ammontare globale. Per tale motvo questo è l ndce d questa categora meno utlzzato. Vene, nvece, pù spesso usato un altro ndce che elmna l nconvenente appena ctato, tale ndce è la varanza. Esempo: consderando la varable seguente Varable statstca dscreta relatva agl nvestment pubblctar d 30 azende n mglaa d euro x n e sapendo che la meda d questa dstrbuzone è par a 47,83, per calcolare la devanza dovremo aggungere una colonna alla dstrbuzone con l calcolo degl scart AL QUADRATO Qund la devanza sarà data da: ( ) = 6075 Dev ( x) = x µ n = x n (x -µ) *n
44 8.C.3 Varanza La Varanza s ottene dalla Devanza, dvdendo questa per : ( x µ ) = σ = nel caso d sere s ( x µ ) n = σ = nel caso d dstrbuzon. La varanza è espressa n termn d, tuttava, presenta l nconvenente d essere espresso non nella untà d msura del carattere ma nella stessa untà al quadrato. Esempo: el caso precedente la varanza è data da: σ = = ( x ) µ 8.C.4 Scarto quadratco medo n 6075 = = 70,5 30 Lo SQM è dato dalla radce quadrata della Varanza e s ndca con σ ( x µ ) = σ = nel caso d sere s ( x µ ) n σ = = nel caso d dstrbuzon. Questo ndce d varabltà è espresso nella stessa untà d msura della dstrbuzone, pertanto è pù sntetco e faclmente nterpretable rspetto alla varanza e alla devanza..b.: ella termnologa anglosassone lo scarto quadratco medo è defnto STADARD DEVIATIO ed è qund n talano spesso defnto come devazone standard. Esempo: Sempre nel caso precedente, la varanza è data da σ = s = ( x ) µ n = 84,87 4
45 8.C.5 Propretà delle msure d dspersone Tutte le msure d dspersone sono IVARIATI per traslazon ma O sono nvarant per cambament d scala: se Y=a+bX allora σ = y b σ x ESERCIZI - 3 ESERCIZIO 9 Utlzzando la varable statstca dscreta costruta nell ESERCIZIO, calcolare:. Il campo d varazone,. La dfferenza nterquartlca, 3. La devanza, 4. La varanza, 5. Lo scarto quadratco medo, ESERCIZIO 0 Utlzzando la varable statstca contnua costruta nell ESERCIZIO, calcolare:. Il campo d varazone,. La dfferenza nterquartlca, 3. La devanza, 4. La varanza, 5. Lo scarto quadratco medo, ESERCIZIO Utlzzando la varable statstca contnua costruta nell ESERCIZIO 3, calcolare tutt gl ndcator d varabltà possbl. ESERCIZIO Utlzzando la varable statstca contnua costruta nell ESERCIZIO 4, calcolare tutt gl ndcator d varabltà possbl. 9. COCETRAZIOE Un caso partcolare della varabltà è la Concentrazone. La concentrazone è applcable a tutt e sol fenomen cosddett trasferbl, ovvero fenomen per qual è potetcamente possble trasferre parte dell ammontare globale da alcun soggett ed potetcamente dare ad altr fno al lmte che uno posseda tutto l ammontare del carattere e gl altr nente. Esemp d caratter trasferbl sono l reddto, l numero d passegger d una compagna aerea. on sono nvece trasferbl caratter come l peso o l altezza. La concentrazone s rappresenta attraverso ) un ndce che msura l grado d concentrazone del carattere ) una curva, chamata curva d Lorenz. 9. Concetto e msura della concentrazone (nel caso d sere) Quando nostr valor sono rappresentat sotto forma d sere, per l calcolo della concentrazone occorre: 4
46 . ordnare valor n senso non decrescente (da pù pover a pù rcch): x ( ) x... x... x () ( ) ( ). determnare le frazon relatve cumulate de soggett: p =. Per cu: se = p =/ cu corrsponde x () se = p =/ cu corrsponde x () 3. determnare le frazon relatve cumulate delle ntenstà. S tratta d frazon relatve q, con al denomnatore l ammontare globale e al numeratore le ntenstà cumulate: q j= = = x x ( j ) ( ) Se = allora j= e qund x( j ) = x( ) Se = allora j=, e qund x( j ) = x( ) + x( ) Se =3 allora j=,,3 e qund x( j ) = x( ) + x( ) + x( 3) Se = allora j=,,, e qund x ( j) = x( ) + x( ) x( ) S osserv che: Se p = q vuol dre che le x () sono tutte ugual fra d loro. S dce, allora, che v è EQUIDISTRIBUZIOE Esempo: umero d passegger per compagna aerea: j= j= j= j= Compagne Aeree umero d vaggator A 50 B 50 C 50 D 50 E 50 TOT 50 43
47 Per prma cosa occorre ordnare le x. Inoltre da questo momento attrbuamo un numero progressvo al posto de nom delle compagne poché non nteressano. Calcolamo noltre le p e le q : x Σ x j p q , 0, ,4 0, ,6 0, ,8 0, TOT 50 Se q = 0 =,,..., e p = q s dce che c è MASSIMA = COCETRAZIOE. Rprendamo lo stesso esempo: Ordnamo e calcolamo le p e le q : Compagne Aeree umero d vaggator A 0 B 0 C 0 D 50 E 0 TOT 50 x Σ x j p q 0 0 0, , , , TOT 50 In tutt gl altr cas sarà sempre p q =,,..., e p = q =. S parlerà allora d COCETRAZIOE e occorrerà ndvduare un modo per poterla rappresentare e calcolare. Esempo: E qund: Compagne Aeree umero d vaggator A 50 B 70 C 30 D 00 E 90 TOT
48 q q 0 0 CORSO ELEMETI DI STATISTICA DOTT. CRISTIA MUSCHITIELLO A.A. 0/0 p p q 0 x Σ x j p q , 0, ,4 0, ,6 0, ,8 0, p 340 TOT La curva d Lorenz Un prmo modo per rappresentare la concentrazone è l grafco defnto, appunto, curva d Lorenz. Tale curva s ottene ponendo n ascssa le p e n ordnata le q e assume la forma seguente ne var cas: EQUIDISTRIBUZIOE quando p =q MASSIMA COCETRAZIOE Caso ntermedo: SPEZZATA DI COCETRAZIOE 9.3 Indc d concentrazone Indc assolut d concentrazone Gl ndc d concentrazone saranno basat sulle quanttà p -q. nfatt: - n caso d equdstrbuzone p -q =0 =,,..., e p = q = - n caso d massma concentrazone p -q = p =,,..., e p = q = - ne cas ntermed p -q >0 =,,..., e p = q percò una prma msura assoluta d concentrazone è data da: = 45
49 = ( p q ) = = = 0 > 0 p massma concentrazone equdstrbuzone concentrazone Indc relatv d concentrazone (rapporto d concentrazone d gn) Per ottenere l corrspondente ndce relatvo d concentrazone basta rapportare l ndce appena calcolato al suo massmo. L ndce che s ottene vene defnto RAPPORTO DI COCETRAZIOE DI GII: R = ( p q ) p = 0 = = equdstrbuzone massma concentrazone Il rapporto d concentrazone d Gn R può essere anche nterpretato nel modo seguente: ESERCIZI - 4 ESERCIZIO 3 Una banca possede le seguent sed con relatv proftt (anno 008): Sed Proftt Bar 0 Como 30 Forlì 87 Genova 3 Calcolare l ndce d concentrazone e dsegnare la curva d Lorenz 46
50 n n Mo Me µ Mo x Mo - Me Mo µ < Me < µ Me < Mo < µ CORSO ELEMETI DI STATISTICA DOTT. CRISTIA MUSCHITIELLO A.A. 0/0. SIMMETRIA E CURVA ORMALE. Smmetra e asmmetra Dopo aver ndvduato gl ndcator statstc e gl ndc d varabltà, un altra nformazone mportante crca l carattere oggetto d anals è se esso s dstrbusce n manera smmetrca oppure asmmetrca. La smmetra è un ndcatore della forma delle dstrbuzon. Una dstrbuzone s dce smmetrca quando è possble traslarla ntorno alla sua medana e vedere due ram, quello destro e quello snstro, perfettamente sovrappost. In altr termn una dstrbuzone è smmetrca se le modaltà che sono equdstant dalla medana hanno la stessa frequenza. Una dstrbuzone smmetrca s presenta nel modo seguente e con delle specfche caratterstche: Smmetra - Me - Q = < > Q 3 - Me - Q x () = < > x () - Q 3 Quando una dstrbuzone non è smmetrca allora s dce che è asmmetrca e s può presentare con asmmetra postva o negatva, rspettvamente : Asmmetra postva (la dstrbuzone s allunga verso valor postv) Asmmetra negatva (la dstrbuzone s allunga verso valor negatv) 47
51 . Box plot Attraverso le nformazon ottenute tramte medane, quartl, mnmo e massmo è possble costrure una rappresentazone grafca della forma della dstrbuzone che permette d stablre se la dstrbuzone è smmetrca o asmmetrca. Questa rappresentazone è defnta box-plot, o dagramma a scatola. A ttolo esemplfcatvo, s osserv l box plot della varable contnua relatva al numero d altezze, precedentemente osservata:.3 La curva normale E necessaro accennare come n natura esstano un nfnto numero d popolazon possbl. Da tempo s è notato che le msurazon fatte n relazone alla gran parte de fenomen collettv possono, n ultma anals, essere rcondotte ad una sola dstrbuzone d frequenze, la cosddetta dstrbuzone normale. La dstrbuzone normale è una dstrbuzone contnua avente una forma smmetrca e campanulare. E possble dmostrare che la maggor parte d dstrbuzon emprche, all aumentare del numero d untà, sono rconducbl ad una forma normale. A ttolo esemplfcatvo, consderamo l stogramma relatvo alla statura d 700 ragazz d età compresa fra 3-8 ann. el grafco s è aggunta una curva nterpolatrce, la cu forma è campanulare e smmetrca. Gauss dmostrò che la maggor parte de fenomen collettv, per grand numerostà, assumono molto spesso questa forma dstrbutva. La ragone d questa crcostanza è dovuta alle sue caratterstche. Infatt, Gauss dmostrò che gl error (ovvero gl scart dalla meda) tendono a dstrburs n modo smmetrco ntorno alla meda e tendono a dmnure all aumentare della dstanza dalla meda stessa.! 48
52 A partre dalle rcerche d Gauss, s dmostra che l espressone algebrca d questa curva dpende solamente dal numero d osservazon, dalla meda µ e dallo scarto quadratco medo σ. Senza soffermarc sulla espressone matematca della curva, vale la pena osservare che, al varare de tre element caratterzzant della curva, essa vara parzalmente n forma e poszone. In partcolare: - al varare della meda µ, vara la poszone della curva sull asse x; - al varare dello scarto quadratco medo σ, vara la forma della curva, che dvene pù o meno aguzza; - al varare della numerostà, vara l area sotto la curva. A ttolo esemplfcatvo s osservno grafc rportat alla pagna successva, qual mostrano cosa accade facendo varare d µ e σ: In statstca la curva normale vene utlzzata nel senso che, data una qualunque dstrbuzone, s cerca d verfcare se essa, n effett, s dstrbusce normalmente, nfatt, laddove questo accada, le successve anals su quella dstrbuzone saranno pù precse ed accurate, propro perché s conoscono alcune caratterstche d base del fenomeno, coè quelle della curva normale. Infne s osserv che non tutte le curve campanular e smmetrche sono normal. La normaltà è data dalla esstenza d una specfca forma funzonale che lega meda, scarto quadratco medo e numerostà. Esstono dverse msure della normaltà d una dstrbuzone, tal msure, però, esulano dagl scop d questo corso. 49
53 ESERCIZI - 5 ESERCIZIO 4 Con rfermento alla dstrbuzone dell eserczo, realzzare l box-plot e dre se la dstrbuzone può essere consderata smmetrca. In caso d asmmetra ndcarne anche l tpo. 50
54 ESERCIZI RIEPILOGATIVI - A ESERCIZIO 5 D seguto s rporta l numero d dpendent assent da un azenda agrcola n 8 gorn lavoratv S msur la concentrazone della sere. ESERCIZIO 6 La dstrbuzone d frequenza assoluta degl stpend mensl n euro de 65 dpendent d una determnata azenda è rportata nella seguente tabella Stpendo. d dpendent Totale 65. s dca se la varable X, oggetto d nteresse, è qualtatva, sconnessa o ordnale, o quanttatva, dscreta o contnua;. Con rfermento a rsultat della rlevazone, sntetzzat nella tabella d frequenza, s specfch la assocata dstrbuzone d frequenza relatva e le corrspondent frequenze cumulate, assolute e relatve; 3. S costrusca la rappresentazone grafca; 4. S determn la moda, la medana, quartl e la meda artmetca della dstrbuzone; 5. S determn, noltre, lo scarto quadratco medo de valor. ESERCIZIO 7 Le seguent temperature sono state rlevate durante l funzonamento d un frgorfero da laboratoro ad ntervall d due ore durante una gornata: S determn la temperatura medana e la temperatura meda della gornata;. S realzz la varable dscreta de valor e s rappresent grafcamente la dstrbuzone. ESERCIZIO 8 Sa data la seguente tabella nella quale è rportato l reddto annuo d 0 ndvdu con le frequenze con le qual è stato osservato: 5
55 Reddto (mglaa d euro). ndvdu 4, ,5 Totale 4. S calcol l reddto medano e quartl della dstrbuzone;. S calcol l reddto medo; 3. Se tutt soggett guadagnassero 500 euro d pù ogn anno, quale sarebbe l reddto medo d quest ndvdu? ESERCIZIO 9 Una regone delle Alp è stata suddvsa n 6 sottoaree d uguale dmensone e conformazone. Per ogn sottoarea è stato svolto un censmento delle marmotte present. I rsultat ottenut sono stat seguent: Area n. marmotte A 4 B 7 C 0 D 4 E 35 F 3 Totale 93. S calcol un ndcatore statstco che sntetzz questa dstrbuzone;. S rappresent grafcamente la dstrbuzone; ESERCIZIO 0 D seguto è rportata la sere relatva a valor d azotema d 0 soggett san n mg/00ml S realzz la dstrbuzone de valor d azotema;. S calcol l lvello medano, quartl della dstrbuzone e l valore modale; 3. S realzz la funzone d rpartzone de valor d azotema; ESERCIZIO Con rfermento alla dstrbuzone dell eserczo, realzzare l box-plot e dre se la dstrbuzone può essere consderata smmetrca. In caso d asmmetra ndcarne anche l tpo. 5
56 .A AALISI BIVARIATA.A. Introduzone: sere e tabelle doppe La rcerca scentfca non s lmta alla descrzone de sngol fenomen, ognuno consderato ndpendentemente dagl altr. Essa s nteressa anche, e soprattutto, dell anals delle relazon che ognuno d ess può avere con gl altr. Quando n cascuna untà statstca d un collettvo sono state rlevat due caratter, che ndchamo con X e Y, corrspondent valor osservat saranno rappresentat da coppe d valor (x,y ) con =,,,. Quando non è troppo grande, le osservazon possono essere lascate sotto forma d sere, dando orgne alle, cosddette, sere doppe: X Y x y x y x x Quando, nvece, è molto grande e c sono valor rpetut, convene dsporre dat rlevat n una tabella a doppa entrata, o dstrbuzone doppa (come è stato gà accennato quando s è parlato d dstrbuzon statstche). Una dstrbuzone doppa s ndca nel modo seguente: y y X Y y y y h y t TOT. x n n n h n t n. x n n n h n t n. x n n n h n t n. x s n s n s n sh n st n s. TOT. n. n. n.h n.t Dove: - X e Y sono due caratter che possono essere entramb quanttatv, entramb qualtatv, oppure uno quanttatvo e uno qualtatvo e le cu modaltà sono rappresentate, rspettvamente nella colonna madre e nella rga madre:, - n h sono le frequenze assolute ncrocate, coè l numero d volte n cu s presentano conguntamente la generca modaltà x e la generca modaltà y h, qund è l ndce rferto alla X e h è l ndce rferto alla Y - rappresenta l numero d modaltà della x e vara fra e s; - h rappresenta l numero d modaltà della y e vara fra e t; - n. e n.h sono le somme delle frequenze, rspettvamente, delle x e delle y h e vengono defnte frequenze margnal, n partcolare cascuna delle frequenze margnal n. è data dalla somma delle corrspondent frequenze per rga e cascuna delle frequenze margnal n.h è data dalla somma delle corrspondent frequenze per colonna, coè: n + n n h n t = n. n h + n h n h n sh = n.h 53
57 - è la numerostà totale del collettvo, per la quale vale la seguente uguaglanza: s t n = n. h =. ; = h= Inoltre: - la colonna contenente le modaltà del carattere X è defnta colonna madre; - la rga contenente le modaltà del carattere Y è defnta rga madre; - la colonna contenente le frequenze n. è defnta colonna margnale e rappresenta la colonna delle frequenze assocate alla X ndpendentemente dalla Y, ovvero la dstrbuzone semplce del carattere X; - la rga contenente le frequenze n.h è defnta rga margnale e rappresenta la rga delle frequenze assocate alla Y ndpendentemente dalla X, ovvero la dstrbuzone semplce del carattere Y; - Cascuna colonna nterna rappresenta le frequenze della X condzonatamente ad una specfca modaltà della Y, pertanto tal colonne sono defnte delle frequenze condzonate; - Cascuna rga nterna rappresenta le frequenze della Y condzonatamente ad una specfca modaltà della X, pertanto anche tal colonne sono defnte delle frequenze condzonate; Quanto appena detto sgnfca che, n teora, è possble estrarre da una tabella msta un certo numero d dstrbuzon semplc, precsamente tante dstrbuzon semplc condzonate quante sono le colonne e le rghe delle frequenze condzonate pù due dstrbuzon semplc margnal, una per la X e una per la Y. Coè, essendo s l numero d modaltà della X e t l numero d modaltà della Y, da una dstrbuzone doppa s possono rcavare s+t+ dstrbuzon semplc..b.: Se uno de due caratter è qualtatvo contnuo, allora, al posto de valor sngol x e y h, c saranno le class d modaltà x - x +..A. La connessone Lo studo delle relazon esstent fra caratter è chamato COESSIOE. ella letteratura s dstngue fra msure d connessone e msure d correlazone : - Gl ndc d connessone sono prevalentemente, ma non esclusvamente applcat allo studo de caratter qualtatv - Gl ndc d correlazone dervano dal confronto fra varabl quanttatve e fanno parte d quello studo della statstca defnto della REGRESSIOE. Quest ndc, a loro volta, s dstnguono n: o o o Indc d dpendenza (o Regressone) n meda Indc d correlazone (o d nterdpendenza lneare) Indc d Regressone lneare. L anals delle dstrbuzon n due varabl può essere schematzzata nel modo seguente: 54
58 AALISI DELLE DISTRIBUZIOI I DUE VARIABILI DISTRIBUZIOI PER DUE CARATTERI QUALITATIVI DISTRIBUZIOI DOPPIE MISTE DISTRIBUZIOI PER DUE CARATTERI QUATITATIVI DIPEDEZ DIPEDEZ ITERDIPE DIPEDEZ A O A O DEZA A O IDIPEDE IDIPEDE (CORRELAZI IDIPEDE ZA I ZA I OE) ZA LIEARE DISTRIBUZI MEDIA LIEARE (REPRESSIO.B. OE IDIPEDEZA E DIPEDEZA I DISTRIBUZIOE E) (COESSIOE) PER CARATTERI QUALITATIVI Comncamo dalla anals d dstrbuzon n due varabl quando due caratter analzzat, X e Y, sono entramb d tpo qualtatvo. La tabella a doppa entrata generata da una stuazone d questo genere è defnta MUTABILE STATISTICA DOPPIA. Analzzare contemporaneamente due varabl sgnfca analzzare cosa succede alla Y (defnta COSEGUETE) al varare della X (ATECEDETE). Fra le due varabl può non esserv alcuna relazone, e allora s parlerà d ndpendenza dstrbutva (assenza d qualunque relazone), oppure potrà esserc una relazone d dpendenza dstrbutva (connessone n dstrbuzone)..b. Indpendenza n dstrbuzone S dce che fra due caratter qualtatv (rappresentat nella forma d una mutable statstca doppa, non esste alcun legame e v è, dunque, ndpendenza, se le dstrbuzon parzal condzonate della Y restano nvarate al varare de valor della X, coè se vale: n =n = =n. n =n = =n. n =n = =n. n s=n s= =n s. n.=n.= = Come sappamo, le numerostà de fenomen possono, però, essere notevolmente varabl e non è percò corretto parlare n termn assolut, bensì n termn relatv. S consdera, allora, la generca rga e s d ce che c è ndpendenza se vale la seguente relazone: 55
59 n n n nh nt n = =... = =... = = =... s n n n.. Coè:.. h. t n n h. h n. = =... s e h =... t S aggunga che l ndpendenza è recproca, coè se Y è ndpendente da X, anche X è ndpendente da Y essendo le dstrbuzon parzal tutte sml alla margnale e, qund, sml fra loro. S dce, allora, che fra le due varabl non sussste alcuna relazone (assenza d connessone). Pù precsamente s dce che l carattere Y è ndpendente (n dstrbuzone) dal carattere X, o che Y non è connesso con X, se sono ugual fra loro tutte le dstrbuzon parzal, secondo l carattere Y, corrspondent alle vare modaltà d X. Se nvece fra tutte le dstrbuzon margnal ve ne sono almeno due fra loro dverse, allora dcamo che Y è connesso con X..B. Connessone n dstrbuzone Le stuazon d dpendenza vengono analzzate confrontando valor delle frequenze con quell delle frequenze stesse n caso d ndpendenza, ovvero: n n.. h n h = = n * h * Queste quanttà n h sono chamate FREQUEZE TEORICHE o n h ATTESE e rappresentano l valore che cascuna frequenza dovrebbe avere nel caso d ndpendenza dstrbutva. Esempo: partendo da una mutable doppa n cu sano date soltanto le dstrbuzon margnal: X Y D E F TOT. A B 5 C 3 TOT e s vogla costrure la mutable delle frequenze teorche S otterrà la seguente mutable doppa: X Y D E F TOT. A n* n* n* 3 B n* n* n* 3 5 C n* 3 n* 3 n* 33 3 TOT
60 Defnta dstrbuzone teorca, n cu: n* = = n* = = 8 50 Y X D E F TOT. A B C TOT ella realtà è molto dffcle che una dstrbuzone doppa sa formata da valor attes o teorc. Quando cò non accade, allora, s studa qual è l allontanamento della dstrbuzone dalla stuazone teorca attraverso un ndce costruto a partre da uno scarto fra due quanttà sgnfcatve ed è puttosto mmedato comprendere l motvo per l quale la dfferenza da utlzzare n questo caso è quella fra frequenze teorche e frequenze emprche. Queste dfferenze vengono defnte contngenze e s ndcano come segue: & = 0 e h IDIPEDEZA DISTRIBUTIVA DIY DA X E VICEVERSA ) n h n * h = c h ' & > 0 e h COESSIOE POSITIVA ) 0 esste un legame ' ( ( < 0 e h COESSIOE EGATIVA S dce che v è MASSIMA COESSIOE se ad ogn modaltà d X corrsponde solo una modaltà delle Y e vceversa. Per esempo: Y Y X D E F TOT. X D E F TOT. X D E F TOT. A - - oppure A - - oppure A - - B B B C C C TOT TOT TOT Y aturalmente è facle comprendere che la stuazone d massma dstrbuzone è possble solamente per le mutabl doppe quadrate, n cu, coè s=t..b.3 Indc d connessone: L ndce Ch-quadrato d Pearson Vedamo come s costruscono, a partre dalle contngenze, gl ndc per l calcolo della connessone. Per prma cosa s not che, gl ndc che vedremo, sono vald nel caso n cu n * h 5 e h. Se cò non s verfca sarà necessaro assemblare alcune modaltà. Gl ndc d connessone sono tutt strutturat n modo da assumere valore par a : - zero n caso d connessone nulla o ndpendenza. - Massmo o n caso d perfetta connessone, unlaterale o blaterale. 57
61 L ndce d connessone che andremo a calcolare è un ndce basato su confront medante dfferenza fra le frequenza della dstrbuzone effettva e quelle teorche. L ndce Ch-quadrato (χ ) effettua la sntes tramte le contngenze al quadrato ed è dato da χ = s t = h= ( n n *) h n h * h (χ assoluto) Il campo d varazone del χ è l seguente: 0 χ mn(s-;t-) Il χ, per come è costruto, non può ma essere mnore d 0. Il corrspondente ndce relatvo è dato da: χ max χ 0 = ndpendenza = = massma connessone (χ relatvo).b.: È convenente calcolare questo ndce attraverso una formula abbrevata che s ottene dallo svluppo del quadrato ed è data da: χ s t ( n n *) = h h = = h= n h * s t n n n h = h=.. h Esempo: S vogla verfcare se esste connessone fra due caratter X e Y rappresentat nella seguente mutable statstca doppa: X Y D E F TOT. A B C TOT Per prma cosa osservamo che, poché pù d una frequenza ha valore mnore d 5, allora non è possble calcolare l χ senza aver prma accorpato opportunamente le frequenze. Ad esempo accorpamo per colonna: X Y D+E F TOT. A B 7 9 C TOT
62 Per l calcolo del χ s costrusce la seguente tabella nella quale, al posto delle frequenze v sono nh valor : n n.. h Qund l χ è dato da: χ = 69 (,4-) = 69 0,4 = 8,359 X Y E F TOT. A 0,35 0,034 0,385 B 0,3 0,34 0,446 C 0,039 0,54 0,580 TOT.,4 questo valore, assoluto, c fa capre che esste una connessone postva, ma non sappamo n percentuale quanto vale. A tale scopo calcolamo l corrspondente ndce relatvo: χ max χ = 8,359 69mn[, ] = 8,359 = 0, 4 40% 69 Cò sgnfca che la connessone è puttosto bassa. ESERCIZI - 6 ESERCIZIO Alcun rcercator hanno potzzato una possble relazone tra l sesso e l ncdenza dell epatte C n un gruppo d 400 pazent d un ospedale. Pertanto su tutt 400 pazent rlevano dat relatv all ncdenza e al sesso. Esste una relazone tra quest due crter d classfcazone? Sesso HCV+ HCV- Totale Masch Femmne Totale
63 .C. REGRESSIOE PER DISTRIBUZIOI DOPPIE MISTE:.C. Indpendenza n dstrbuzone Quando almeno uno de due caratter è quanttatvo, allora l χ non è pù doneo a msurare la connessone fra due caratter, poché è possble usare altr ndc che sfruttno le nformazon agguntve provenent dalla varable quanttatva. Supponamo che fra due caratter s abba: X = varable quanttatva Y = varable qualtatva In questo caso s valuta se ed n quale msura le mede del carattere quanttatvo X, varano al varare delle modaltà del carattere qualtatvo Y. Il carattere X, n questo caso, è defnto conseguente, poché è quello che potenzalmente può varare al varare dell altro carattere, Y, l quale, poché è quello che causa la dpendenza, è defnto antecedente. Dremo che X è ndpendente n meda da Y se, al varare delle modaltà d Y, le mede condzonate d X rmangono costant, dremo nvece che X è dpendente da Y, nel caso contraro. Per l calcolo della Regressone un prmo passo è quello d confrontare le MEDIE CODIZIOATE. Dunque, n una tabella doppa (msta) n cu s hanno t mede condzonate della X dalla Y, s ha ndpendenza n meda quando: µ = µ = = µ h = = µ t = µ Laddove cascuna meda µ h è una delle mede per colonna della X condzonata ad una specfca modaltà della Y. X x Y y y y h y t TOT. x x µ µ µ h µ t µ x s TOT. n. n. n.h n.t se anche una sola d queste mede non è uguale alle altre, allora esste dpendenza n meda (connessone) e pù precsamente n questo caso, s parla d regressone..c. Dpendenza n meda: l rapporto d correlazone η d Pearson: Una msura della dpendenza n meda è ottenuta confrontando le devanze d cascuna meda µ h dalla meda generale µ. L ndce d dpendenza n meda, coè, è basato su una devanza, defnta, devanza fra grupp, perché msura propro come s dstrbuscono le mede de var grupp della X, ovvero delle dstrbuzon della X condzonate alla Y, rspetto alla meda generale della X: 60
64 ( ) n.h Dev fra = µ h µ t h= L ndce n questone s chama eta-quadro ed è un ndce relatvo che ha la devanza fra grupp al numeratore e l massmo d questa devanza al denomnatore, laddove l massmo d questa varabltà è la devanza totale della X: s ( ) n h Dev(X) = x µ t L ndce è l seguente: η = Dev fra Dev(X). h Questo ndce vara fra 0 e, perché è l rapporto fra una parte non negatva e l totale ed esprme quanta parte della varabltà complessva d Y è attrbuble alla dverstà dervante dalle mede d X che (eventualmente) varano con l varare delle modaltà d Y. In partcolare: - η = 0 vuol dre ndpendenza n meda - η 0 vuol dre dpendenza - η = vuol dre massma dpendenza, coè ad ogn valore d X corrsponde uno ed un solo valore d Y. Esempo: S vogla studare se esste una connessone fra due caratter Voto n statstca e Corso d Laurea relatv a 35 student scrtt ad un corso d statstca alla Facoltà d Economa. Poché: X = varable quanttatva = Voto n statstca. Y = varable qualtatva = Corso d Laurea Voto n Corso d laurea statstca E.C. E.A. M.R. Total Total S tratta d una tabella msta percò possamo stablre se l voto dpende medamente dal corso d laurea. Useremo allora η. Per poterlo calcolare abbamo bsogno prma d calcolare tutte le quanttà che c servono. Coè, per la Devanza fra grupp, abbamo bsogno delle mede per gruppo e della meda generale, qund calcoleremo la devanza fra, po la devanza totale e, nfne, l ndce. 6
65 µ EC = = 4, 5 µ EA = µ MR = = 5, = 5, µ = = 5, t Dev fra = ( µ h µ ) n.h = (4, 5 5, 03) + (5,3 5, 03) 5+ (5, 5, 03) 8 = h= = 3,37+, ,387 = 4,850 Il calcolo della devanza totale della X è un pochno pù laboroso, perché occorre calcolare gl scart ponderat al quadrato per cascuna delle celle della tabella doppa. Convene pertanto realzzare una tabella come quella delle frequenza, ma contenente valor degl scart ponderat al quadrato: Voto n Corso d laurea Statstca E.C. E.A. M.R. Totale 8 (8-5) *3= (-5) *=8 (-5) *=9-7 4 (4-5) *= (4-5) *9=9 (4-5) *6=6 6 8 (8-5) *4=36 (8-5) *4=36 (8-5) *= (30-5) *=50 (30-5) *=5 (30-5) *=5 00 Totale s t Dev(X) = ( x µ ) n h =37 h Pertanto l ndce d Pearson è dato da: η = Dev fra Dev(X) = 4,850 = 0, 03,3% 37 Possamo qund dedurre che, l appartenenza ad uno specfco corso d laurea (gruppo), non nflusce sul voto n statstca. 6
66 ESERCIZI - 7 ESERCIZIO 3 Un azenda produce lampadne n tre dvers stablment (A, B e C). S decde d valutare la durata n ore delle lampadne prodotte: a tal fne vene msurata la durata d 0 lampadne prodotte nello stablmento A, d 7 lampadne prodotte nello stablmento B e d 3 prodotte nello stablmento C. S msur l enttà della dpendenza fra la durata delle lampadne e lo stablmento. Durata delle lampadne Stanlmento STAB.A STAB.B STAB.C Totale Totale B.: per effettuare calcol s consder l valore centrale d cascuna classe..d. CORRELAZIOE (=ITERDIPEDEZA) PER VARIABILI STATISTICHE DOPPIE (DISTRIBUZIOI PER CARATTERI QUATITATIVI) Quando s debba studare l comportamento congunto d due caratter X e Y entramb d natura quanttatva, laddove s supponga che O susssta ndpendenza fra due, possono essere studat due dvers tp d connessone: - nterdpendenza, coè l eventuale crcostanza che due s nfluenzno recprocamente - dpendenza d uno dall altro. el prmo caso, n partcolare, per ndvduare la relazone recproca esstente fra due caratter, occorre realzzare un ndce che l tenga n consderazone entramb, nfatt, le nformazon relatve a sngol caratter separatamente non sono suffcent, da sole, a fornre nformazon sgnfcatve. In partcolare, una msura della nterdpendenza è data dalla varabltà congunta, coè da una msura d come varano contemporaneamente due caratter rspetto alle propre mede..d. Covaranza (msura assoluta d nterdpendenza) La Covaranza è la varanza comune alle due varabl (quanttatve) ed è, qund, una msura della varabltà congunta fra la X e la Y. S ndca con Cov(X;Y) oppure σ XY e vale: Cov(X,Y ) = = ( y µ y ) x µ x ( ) per le sere 63
67 Cov(X,Y ) = s t = h= ( y µ y )( x h µ x )n h per le dstrbuzon. Per l modo n cu è costruta, la covaranza assume seguent valor: - Cov(X,Y ) > 0 n caso d relazone postva, coè quando valor della X e della Y crescono entramb; - Cov(X,Y ) < 0 n caso d relazone negatva, coè quando valor della X crescono e quella della Y decrescono, o vceversa; - Cov(X,Y ) = 0 n caso d assenza d relazone fra le due varabl. Inoltre s dmostra che l campo d varabltà della covaranza è l seguente: σ X σ Y Cov( X, Y) σ X σ Y.D. Coeffcente d correlazone d Bravas - Pearson (msura relatva d nterdpendenza) La covaranza è una msura assoluta d nterdpendenza. Come samo orma abtuat a fare, calcolamo la corrspondente msura relatva, rapportando la covaranza al suo massmo. L ndce che ne derva prende l nome d coeffcente d correlazone d Bravas Pearson e s ndca come segue: ρ XY Cov( X, Y) = σ σ X Y S not che : ρ XY e, pù precsamente: ρ XY = vuol dre Cov ( X, Y) < 0 PERFETTA DISCORDAZA fra caratter ρ XY = vuol dre Cov ( X, Y) > 0 PERFETTA COCORDAZA fra caratter ρ XY = 0 vuol dre Cov ( X, Y) = 0 ICORRELAZIOE o IDIPEDEZA LIEARE. Per esteso tale ndce vale: ( y µ )( x µ ) Cov( X, Y ) ρ XY = = n caso d sere σ σ X Y = = ( x µ ) ( y µ ) X Y = h X Y 64
68 ( y µ )( x µ ) Cov( X, Y ) ρ XY = = n caso d dstrbuzon. t s σ X σy n h= s = h= ( x µ ) n ( y µ ) h t X Y. h = h X n Y h. Infne s osserv che, se s semplfcano tutte le, s ottene: ρ s t ( y µ )( x µ ) Y h X h = h= XY = = t s ( xh µ X ) n. h ( y µ Y ) n. h= = n Codev( X ; Y ) Dev( X ) Dev( Y ) Dove è stata defnta una nuova quanttà, la Codevanza. Questa, analogamente alla devanza, è par alla Covaranza per. ESERCIZI - 8 ESERCIZIO 4 I seguent dat rappresentano pes (n Kg) e lvell d glucoso nel sangue (mg/00 ml) appartenent a 6 masch adult apparentemente san. S verfch se esste correlazone fra due caratter. Glucoso (X) Pes (Y) , 95, , ,9 65
69 .E. DIPEDEZA FRA VARIABILI QUATITATIVE: REGRESSIOE LIEARE Quando fra le due varabl quanttatve s vuole studare la relazone d dpendenza d una dall altra s svolge quella che s defnsce una anals d regressone lneare. ello studo d dpendenza è necessaro defnre quale varable s rtene sa la causa della dpendenza e quale sa la conseguenza. Generalmente la varable causa è defnta antecedente e la dpendente è defnta conseguente. Inoltre d solto s usa porre la X come antecedente e la Y come conseguente. La regressone lneare cerca d ndvduare la relazone funzonale che lega la X alla Y nel modo seguente: Y = f(x). S osserv, però, che non s può consderare la relazone f come una relazone perfettamente determnstca fra la Y e la X. ella relazone s consdera, anche, la presenza d una componente accdentale, o resduale, che vene ndcata con l smbolo ε e che entra a far parte della relazone nel modo seguente: Y = f(x) + ε. COMPOETE RESIDUALE, ACCIDETALE O DI DISTURBO In tal modo la relazone tene, qund conto anche d tutt que fattor della Y che non possono essere determnat tramte la X e che, qund, dsturbano la perfetta relazone fra due caratter. Per tale ragone la ε vene anche defnta COMPOETE DI DISTURBO. Dalla relazone appena vsta segue che vale anche la seguente: ε = Y f(x) se n questa relazone, ponamo: f(x) = Y ˆ * = FUZIOE TEORICA ottenamo: ε = Y Y ˆ *. Dove Y ˆ * rappresenta la funzone che lega le due varabl e che s vuole studare. La funzone f(x) che lega la X e la Y vene espressa nel modo seguente: f(x) = α + βx + ε e qund: y = α + βx + ε dove α e β possono essere nterpretat, rcorrendo ad una nterpretazone grafca, nel modo seguente: 66
70 y f(x) β α 0 x x + x α è un parametro d poszone e rappresenta l ITERCETTA DELLA RETTA S dmostra che parametr della retta d regressone s calcolano nel modo seguente: α = µ Y βµ X Codev( X, Y) β = Dev( X ).E. Indce d determnazone R Un ndce che esprme la relazone d dpendenza della X dalla Y è dato dal, cosddetto, ndce d determnazone, l quale è dato da: Codev( X ; Y ) R =, coè R = ρ XY. Dev( X ) Dev( Y ) Tale ndce, detto anche IDICE DI ADATTAMETO AL MODELLO, esprme quanta parte della devanza totale d Y è determnata o spegata dalla retta d regressone supposta rappresentatva del fenomeno. Questo ndce vara tra 0 e, n partcolare: - R = 0 quando β=0 In questo caso s dce che v è ndpendenza n meda e, coè, tutta la varabltà è d tpo accdentale. - R = quando tutta la varabltà è spegata dalla retta d regressone. I punt della Y sono, coè, tutt appartenent alla retta d regressone. Esempo: β è un parametro d pendenza (matematcamente rappresenta l coeffcente angolare). Vene defnto COEFFICIETE DI REGRESSIOE LIEARE e rappresenta la varazone della y al varare d una untà della x. β è, qund, espressa nella stessa untà d msura d Y. Consderamo la seguente Sere doppa de caratter numero d van per abtazone e numero d component della famgla per vedere se esste una relazone fra l numero d van della casa acqustata e la numerostà della famgla: 67
71 . component della. van (X) famgla (Y) Per prma cosa samo nteressat a capre se esste una relazone d tpo lneare fra due caratter e percò calcolamo l coeffcente d correlazone d Bravas Pearson : (, ) ρ = Codev X Y XY Dev( X ) Dev( Y ). Per farlo, calcolamo dapprma le mede: µ x = 6/0 =,6 (van) µ Y = 3/0 = 3, (component) Qund, per l calcolod egl altr valor, utlzzeremo la seguente tabella. van (X). component della famgla (Y) x - µ x y - µ y (x - µ x) (y - µ y) (x - µ x)( y - µ y) 3 5 0,4-8, 0,6 33,4-7,8-0,6 -, 0,36 449,44, ,4-9, 0,6 368,64-7,68 5 7,4-6, 5,76 6,44-38,88 4 5,4-8,,96 33,4-5,48-0,6 -, 0,36 49,84 3,3 -,6 -,,56 449,44 33,9-0,6 -, 0,36 449,44,7 3 0,4 -, 0,6 449,44-8,48 -,6 -,,56 449,44 33, ,4 4033,6 8,8 Da cu: σ X = ( x µ x ) = 4, 4 =, 44 0 Dev(X) = σ X =4,4 68
72 σ Y =3,36 Dev(Y) = σ Y =33,6 Qund: Codev(X;Y ) = ( y µ y )( x µ x ) =8,8. = A questo punto possamo calcolare l coeffcente d correlazone d Bravas-Pearson: ρ XY = Codev(X,Y ) Dev(X)Dev(Y ) = 8,8 = 0,85 85% 4, 4*33, 6 Esste, dunque, un legame abbastanza forte fra l numero d component della famgla e l numero d van della casa abtata. Adesso vedamo quanto vale questo legame n termn d regressone calcolando l coeffcente d regressone e la retta d regressone: β = Cov(X;Y ) Var(X) = Codev(X;Y ) Dev(X) α = µ Y µ X β = 3,, 6 *,3= 0,06 E qund l equazone della retta è: ŷ* = 0,06 +,3x. = 8,8 4, 4 =,3(van) A questo punto, per completare l eserczo calcolamo anche quanta parte della Y è spegata dalla retta d regressone: R = ρ XY = 0,85 = 0, 75 7% Rsulta che l 7% del numero de van è spegata dal numero de component della famgla. ESERCIZI - 9 ESERCIZIO 5 Consderando dat dell eserczo 4, s verfch se l glucoso (X) dpende dal peso (Y). 69
73 ESERCIZI RIEPILOGATIVI - B ESERCIZIO 6 D seguto è rportata la dstrbuzone doppa relatva al tpo d nvestmento preferto d 330 professonst classfcat n base alla loro professone. S calcol l ndce d Assocazone Ch-quadro (assoluto e relatvo) per la dstrbuzone data. Professone Fond azonar Fond obblgazonar Azon Ttol d stato Totale complessvo Medco Avvocato Commercante Altro Totale complessvo ESERCIZIO 7 D seguto è rportata la dstrbuzone d 400 student classfcat n base al tpo d maturtà conseguto e al voto ottenuto. S msur l enttà della dpendenza meda fra l tpo d maturtà e l voto. Voto Tpo d maturta' Classca Scentfca Altro Totale Totale ESERCIZIO 8 Data la seguente sere doppa relatva all altezza(n pollc) e alla crconferenza del collo (n cm) d 0 soggett Altezza n pollc Crconferenza del collo n cm 67,75 36, 7,5 38,5 66,5 34 7,5 37,4 7,5 34,4 74, ,75 36,4 7,5 37, , 73,5 4,. S verfch se esste correlazone fra due caratter. S verfch se la crconferenza del collo (Y) dpende dall altezza (X), calcolando parametr della retta d regressone e l ndce d determnazone. 70
74 ESERCIZI GEERALI ESERCIZIO 9 Un rcercatore sta eseguendo uno studo sulle produzon d un vgneto d Sangovese. Per questo motvo, ha msurato la produzone untara d 500 pante, ottenendo la seguente dstrbuzone d frequenze assolute. CLASSI d produzone (kg/panta) n,0 -,5,5-3,0 46 3,0-3,5 78 3,5-4,0 0 4,0-4,5 06 4,5-5,0 69 5,0-5,5 5 5,5-6,0 7 Totale 500 Lo studente:. rappresent grafcamente la dstrbuzone,. calcol la produzone meda, la produzone medana e quartl, 3. verfch se la dstrbuzone può essere consderata smmetrca, ESERCIZIO 30 Un campo d mas è concmato con tre dos crescent d azoto e par a 0, 50 e 300 kg/ha. Le produzon osservato sono rspettvamente par a 5, 9 e t/ha. Lo studente:. Stablsca se tra dose d concmazone e produzone esste correlazone. Stablsca se la produzone (Y) è dpendente dalla concmazone (X) defnendo l equazone d regressone ed l valore d R. ESERCIZIO 3 La popolazone delle altezze alla fortura d 0 pante d mas d una serra è data dalla seguente sere d valor: Lo studente:. realzz la dstrbuzone d frequenza relatva al carattere n esame,. rappresent grafcamente la dstrbuzone, 3. rappresent la funzone d rpartzone, 4. Qual è la moda d questa dstrbuzone? 7
75 ESERCIZIO 3 Una dtta s rvolge a tre forntor per l'acqusto d alcun prodott. ella tabella che segue vengono ndcat, per cascun forntore, le percentual d prodott ntegr e d prodott con dfett. Forntore Prodott ntegr Prodott con dfett Totale A B C Totale Lo studente stablsca se l numero d prodott dfettos è assocato al forntore. ESERCIZIO 33 In un campone d 0 soggett masch è stata determnata la statura e l peso corporeo ottenendo seguent rsultat. Altezza n cm(x) Peso n kg(y) Lo studente:. stablsca se due caratter sono correlat,. In caso d rsposta affermatva al punto precedente, determn se l peso può essere consderato dpendente dall altezza, attraverso l calcolo del ndce R. ESERCIZIO 34 Un azenda rleva su un campone 5 famgle l numero d volte che è stato acqustato l prodotto saponetta nell arco d 3 ann: Lo studente determn l lvello d concentrazone della varable oggetto d studo. ESERCIZIO 35 Su 0 student scrtt ad un corso d nglese presso una scuola prvata d Bar, s sono rlevate le provnce d resdenza: BA BR FG FG BA BA BA BA TA BR BR LE BA BA BA FG MI BA TA FG 7
76 Lo studente effettu un anals descrttva completa rspetto a tale varable. ESERCIZIO 36 D seguto s rportano gudz, da A a D, dat da un gruppo d valutator a 5 quadr espost n una gallera da govan artst: A D C B B A B B C C B C D C B Lo studente:. realzz la dstrbuzone d frequenze relatva al carattere n esame,. rappresent grafcamente la dstrbuzone appena realzzata, 3. calcol gl ndcator statstc che è possble calcolare per l tpo d carattere, 73
Ministero della Salute D.G. della programmazione sanitaria --- GLI ACC - L ANALISI DELLA VARIABILITÀ METODOLOGIA
Mnstero della Salute D.G. della programmazone santara --- GLI ACC - L ANALISI DELLA VARIABILITÀ METODOLOGIA La valutazone del coeffcente d varabltà dell mpatto economco consente d ndvduare gl ACC e DRG
Variabili statistiche - Sommario
Varabl statstche - Sommaro Defnzon prelmnar Statstca descrttva Msure della tendenza centrale e della dspersone d un campone Introduzone La varable statstca rappresenta rsultat d un anals effettuata su
LA STATISTICA: OBIETTIVI; RACCOLTA DATI; LE FREQUENZE (EXCEL) ASSOLUTE E RELATIVE
Lezone 6 - La statstca: obettv; raccolta dat; le frequenze (EXCEL) assolute e relatve 1 LA STATISTICA: OBIETTIVI; RACCOLTA DATI; LE FREQUENZE (EXCEL) ASSOLUTE E RELATIVE GRUPPO MAT06 Dp. Matematca, Unverstà
Relazione funzionale e statistica tra due variabili Modello di regressione lineare semplice Stima puntuale dei coefficienti di regressione
1 La Regressone Lneare (Semplce) Relazone funzonale e statstca tra due varabl Modello d regressone lneare semplce Stma puntuale de coeffcent d regressone Decomposzone della varanza Coeffcente d determnazone
Università degli Studi di Urbino Facoltà di Economia
Unverstà degl Stud d Urbno Facoltà d Economa Lezon d Statstca Descrttva svolte durante la prma parte del corso d corso d Statstca / Statstca I A.A. 004/05 a cura d: F. Bartolucc Lez. 8/0/04 Statstca descrttva
Soluzione esercizio Mountbatten
Soluzone eserczo Mountbatten I dat fornt nel testo fanno desumere che la Mountbatten utlzz un sstema d Actvty Based Costng. 1. Calcolo del costo peno ndustrale de tre prodott Per calcolare l costo peno
MACROECONOMIA A.A. 2014/2015
MACROECONOMIA A.A. 2014/2015 ESERCITAZIONE 2 MERCATO MONETARIO E MODELLO /LM ESERCIZIO 1 A) Un economa sta attraversando un perodo d profonda crs economca. Le banche decdono d aumentare la quota d depost
Relazioni tra variabili: Correlazione e regressione lineare
Dott. Raffaele Casa - Dpartmento d Produzone Vegetale Modulo d Metodologa Spermentale Febbrao 003 Relazon tra varabl: Correlazone e regressone lneare Anals d relazon tra varabl 6 Produzone d granella (kg
La verifica delle ipotesi
La verfca delle potes In molte crcostanze l rcercatore s trova a dover decdere quale, tra le dverse stuazon possbl rferbl alla popolazone, è quella meglo sostenuta dalle evdenze emprche. Ipotes statstca:
TITOLO: L INCERTEZZA DI TARATURA DELLE MACCHINE PROVA MATERIALI (MPM)
Identfcazone: SIT/Tec-012/05 Revsone: 0 Data 2005-06-06 Pagna 1 d 7 Annotazon: Il presente documento fornsce comment e lnee guda sull applcazone della ISO 7500-1 COPIA CONTROLLATA N CONSEGNATA A: COPIA
* * * Nota inerente il calcolo della concentrazione rappresentativa della sorgente. Aprile 2006 RL/SUO-TEC 166/2006 1
APAT Agenza per la Protezone dell Ambente e per Servz Tecnc Dpartmento Dfesa del Suolo / Servzo Geologco D Itala Servzo Tecnologe del sto e St Contamnat * * * Nota nerente l calcolo della concentrazone
Studio grafico-analitico di una funzioni reale in una variabile reale
Studo grafco-analtco d una funzon reale n una varable reale f : R R a = f ( ) n Sequenza de pass In pratca 1 Stablre l tpo d funzone da studare es. f ( ) Determnare l domno D (o campo d esstenza) della
STATISTICA DESCRITTIVA CON EXCEL
STATISTICA DESCRITTIVA CON EXCEL Corso d CPS - II parte: Statstca Laurea n Informatca Sstem e Ret 2004-2005 1 Obettv della lezone Introduzone all uso d EXCEL Statstca descrttva Utlzzo dello strumento:
Esercitazioni del corso di Relazioni tra variabili. Giancarlo Manzi Facoltà di Sociologia Università degli Studi di Milano-Bicocca
Eserctazon del corso d Relazon tra varabl Gancarlo Manz Facoltà d Socologa Unverstà degl Stud d Mlano-Bcocca e-mal: [email protected] Terza eserctazone Mlano, 8 febbrao 7 SOMMARIO TERZA ESERCITAZIONE
LA COMPATIBILITA tra due misure:
LA COMPATIBILITA tra due msure: 0.4 Due msure, supposte affette da error casual, s dcono tra loro compatbl quando la loro dfferenza può essere rcondotta ad una pura fluttuazone statstca attorno al valore
Il modello markoviano per la rappresentazione del Sistema Bonus Malus. Prof. Cerchiara Rocco Roberto. Materiale e Riferimenti
Il modello marovano per la rappresentazone del Sstema Bonus Malus rof. Cercara Rocco Roberto Materale e Rferment. Lucd dstrbut n aula. Lemare 995 (pag.6- e pag. 74-78 3. Galatoto G. 4 (tt del VI Congresso
Capitolo 7. La «sintesi neoclassica» e il modello IS-LM. 2. La curva IS
Captolo 7 1. Il modello IS-LM La «sntes neoclassca» e l modello IS-LM Defnzone: ndvdua tutte le combnazon d reddto e saggo d nteresse per le qual l mercato de ben (curva IS) e l mercato della moneta (curva
Lezione 10. L equilibrio del mercato finanziario: la struttura dei tassi d interesse
Lezone 1. L equlbro del mercato fnanzaro: la struttura de tass d nteresse Ttol con scadenza dversa hanno prezz (e tass d nteresse) dfferent. Due ttol d durata dversa emess dallo stesso soggetto (stesso
STATISTICA SOCIALE Corso di laurea in Scienze Turistiche, a.a. 2007/2008 Esercizi 16 novembre2007
STATISTICA SOCIALE Corso d laurea n Scenze Turstche, a.a. 07/08 Esercz 6 novembre07 Eserczo La Tabella contene alcun dat relatv a 6 lavorator delle azende Alfa e Beta. Tabella Lavorator delle azende Alfa
A. AUMENTO DELLA SPESA PUBBLICA FINANZIATO ESCLUSIVAMENTE TRAMITE INDEBITAMENTO
4. SCHMI ALTRNATIVI DI FINANZIAMNTO DLLA SPSA PUBBLICA. Se l Governo decde d aumentare la Spesa Pubblca G (o Trasferment TR), allora deve anche reperre fond necessar per fnanzare questa sua maggore spesa.
Macchine. 5 Esercitazione 5
ESERCITAZIONE 5 Lavoro nterno d una turbomacchna. Il lavoro nterno massco d una turbomacchna può essere determnato not trangol d veloctà che s realzzano all'ngresso e all'uscta della macchna stessa. Infatt
INDICI STATISTICI MEDIA, MODA, MEDIANA, VARIANZA
Lezone 7 - Indc statstc: meda, moda, medana, varanza INDICI STATISTICI MEDIA, MODA, MEDIANA, VARIANZA GRUPPO MAT06 Dp. Matematca, Unverstà d Mlano - Probabltà e Statstca per le Scuole Mede -SILSIS - 2007
Capitolo 3 Covarianza, correlazione, bestfit lineari e non lineari
Captolo 3 Covaranza, correlazone, bestft lnear e non lnear ) Covaranza e correlazone Ad un problema s assoca spesso pù d una varable quanttatva (es.: d una persona possamo determnare peso e altezza, oppure
3. Esercitazioni di Teoria delle code
3. Eserctazon d Teora delle code Poltecnco d Torno Pagna d 33 Prevsone degl effett d una decsone S ndvduano due tpologe d problem: statc: l problema non vara nel breve perodo dnamc: l problema vara Come
Condensatori e resistenze
Condensator e resstenze Lucano attaa Versone del 22 febbrao 2007 Indce In questa nota presento uno schema replogatvo relatvo a condensator e alle resstenze, con partcolare rguardo a collegament n sere
PROCEDURA INFORMATIZZATA PER LA COMPENSAZIONE DELLE RETI DI LIVELLAZIONE. (Metodo delle Osservazioni Indirette) - 1 -
PROCEDURA INFORMATIZZATA PER LA COMPENSAZIONE DELLE RETI DI LIVELLAZIONE (Metodo delle Osservazon Indrette) - - SPECIFICHE DI CALCOLO Procedura software per la compensazone d una rete d lvellazone collegata
Valore attuale di una rendita. Valore attuale in Excel: funzione VA
Valore attuale d una rendta Nella scorsa lezone c samo concentrat sul problema del calcolo del alore attuale d una rendta S che è dato n generale da V ( S) { R ; t, 0,,,..., n,... } n 0 R ( t ), doe (t
Esame di Statistica Corso di Laurea in Economia
Esame d Statstca Corso d Laurea n Economa 9 Gennao 0 Cognome Nome atr. Teora S dmostr la propretà d lneartà della meda artmetca. Eserczo Una casa edtrce è nteressata a valutare se tra lettor d lbr esste
Metodi e Modelli per l Ottimizzazione Combinatoria Progetto: Metodo di soluzione basato su generazione di colonne
Metod e Modell per l Ottmzzazone Combnatora Progetto: Metodo d soluzone basato su generazone d colonne Lug De Govann Vene presentato un modello alternatvo per l problema della turnazone delle farmace che
Economia del Settore Pubblico 97. Economia del Settore Pubblico 99. Quale indice di diseguaglianza usare? il rapporto interdecilico PROBLEMA:
Economa del Settore Pubblco Laura Vc [email protected] www.dse.unbo.t/lvc/edsp_.htm LEZIONE 4 Rmn, 9 aprle 008 Economa del Settore Pubblco 96 I prncpal ndc d dseguaglanza: ndc d entropa generalzzata Isprata
Introduzione al Machine Learning
Introduzone al Machne Learnng Note dal corso d Machne Learnng Corso d Laurea Magstrale n Informatca aa 2010-2011 Prof Gorgo Gambos Unverstà degl Stud d Roma Tor Vergata 2 Queste note dervano da una selezone
Trigger di Schmitt. e +V t
CORSO DI LABORATORIO DI OTTICA ED ELETTRONICA Scopo dell esperenza è valutare l ampezza dell steres d un trgger d Schmtt al varare della frequenza e dell ampezza del segnale d ngresso e confrontarla con
Newsletter "Lean Production" Autore: Dott. Silvio Marzo
Il concetto d "Produzone Snella" (Lean Producton) s sta rapdamente mponendo come uno degl strument pù modern ed effcac per garantre alle azende la flessbltà e la compettvtà che l moderno mercato rchede.
Corso di Statistica (canale P-Z) A.A. 2009/10 Prof.ssa P. Vicard
Corso d Statstca (canale P-Z) A.A. 2009/0 Prof.ssa P. Vcard VALORI MEDI Introduzone Con le dstrbuzon e le rappresentazon grafche abbamo effettuato le prme sntes de dat. E propro osservando degl stogramm
RETI TELEMATICHE Lucidi delle Lezioni Capitolo VII
Prof. Guseppe F. Ross E-mal: [email protected] Homepage: http://www.unpv.t/retcal/home.html UNIVERSITA' DEGLI STUDI DI PAVIA Facoltà d Ingegnera A.A. 2011/12 - I Semestre - Sede PV RETI TELEMATICHE Lucd
La retroazione negli amplificatori
La retroazone negl amplfcator P etroazonare un amplfcatore () sgnfca sottrarre (o sommare) al segnale d ngresso (S ) l segnale d retroazone (S r ) ottenuto dal segnale d uscta (S u ) medante un quadrpolo
PARTE II LA CIRCOLAZIONE IDRICA
PARTE II LA CIRCOLAZIONE IDRICA La acque d precptazone atmosferca che gungono al suolo scorrono n superfce o penetrano n profondtà dando orgne alla crcolazone, la quale subsce l nfluenza d molt fattor
Indicatori di rendimento per i titoli obbligazionari
Indcator d rendmento per ttol obblgazonar LA VALUTAZIONE DEGLI INVESTIMENTI A TASSO FISSO Per valutare la convenenza d uno strumento fnanzaro è necessaro precsare: /4 Le specfche esgenze d un nvesttore
Analisi di mercurio in matrici solide mediante spettrometria di assorbimento atomico a vapori freddi
ESEMPIO N. Anals d mercuro n matrc solde medante spettrometra d assorbmento atomco a vapor fredd 0 Introduzone La determnazone del mercuro n matrc solde è effettuata medante trattamento termco del campone
Norma UNI CEI ENV 13005: Guida all'espressione dell'incertezza di misura
orma UI CEI EV 3005: Guda all'espressone dell'ncertezza d msura L obettvo d una msurazone è quello d determnare l valore del msurando, n altre parole della grandezza da msurare. In generale, però, l rsultato
Corso di. Dott.ssa Donatella Cocca
Corso d Statstca medca e applcata 3 a Lezone Dott.ssa Donatella Cocca Concett prncpale della lezone I concett prncpal che sono stat presentat sono: Mede forme o analtche (Meda artmetca semplce, Meda artmetca
STATISTICA DESCRITTIVA - SCHEDA N. 5 REGRESSIONE LINEARE
Matematca e statstca: da dat a modell alle scelte www.dma.unge/pls_statstca Responsabl scentfc M.P. Rogantn e E. Sasso (Dpartmento d Matematca Unverstà d Genova) STATISTICA DESCRITTIVA - SCHEDA N. REGRESSIONE
Scelta dell Ubicazione. di un Impianto Industriale. Corso di Progettazione Impianti Industriali Prof. Sergio Cavalieri
Scelta dell Ubcazone d un Impanto Industrale Corso d Progettazone Impant Industral Prof. Sergo Cavaler I fattor ubcazonal Cost d Caratterstche del Mercato Costruzone Energe Manodopera Trasport Matere Prme
L AUTORITÀ PER L ENERGIA ELETTRICA E IL GAS
Delberazone 20 ottobre 2004 Approvazone delle condzon general d accesso e d erogazone del servzo d rgassfcazone d gnl predsposte dalla socetà Gnl Itala Spa (delberazone n. 184/04) L AUTORITÀ PER L ENERGIA
NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI CONFRONTO DI PIU MEDIE IL METODO DI ANALISI DELLA VARIANZA
NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI CONFRONTO DI PIU MEDIE IL METODO DI ANALISI DELLA VARIANZA IL PROBLEMA Supponamo d voler studare l effetto d 4 dverse dete su un campone casuale d 4
Calcolo della caduta di tensione con il metodo vettoriale
Calcolo della caduta d tensone con l metodo vettorale Esempo d rete squlbrata ed effett del neutro nel calcolo. In Ampère le cadute d tensone sono calcolate vettoralmente. Per ogn utenza s calcola la caduta
CAPITOLO IV CENNI SULLE MACCHINE SEQUENZIALI
Cenn sulle macchne seuenzal CAPITOLO IV CENNI SULLE MACCHINE SEQUENZIALI 4.) La macchna seuenzale. Una macchna seuenzale o macchna a stat fnt M e' un automatsmo deale a n ngress e m uscte defnto da: )
LE FREQUENZE CUMULATE
LE FREQUENZE CUMULATE Dott.ssa P. Vcard Introducamo questo argomento con l seguente Esempo: consderamo la seguente dstrbuzone d un campone d 70 sttut d credto numero flal present nel terrtoro del comune
LEZIONE 2 e 3. La teoria della selezione di portafoglio di Markowitz
LEZIONE e 3 La teora della selezone d portafoglo d Markowtz Unverstà degl Stud d Bergamo Premessa Unverstà degl Stud d Bergamo Premessa () È puttosto frequente osservare come gl nvesttor tendano a non
10-7-2009. GAZZETTA UFFICIALE DELLA REPUBBLICA ITALIANA Serie generale - n. 158. ALLEGATO 1 (Allegato A, paragrafo 2)
ALLEGATO 1 (Allegato A, paragrafo 2) Indcazon per l calcolo della prestazone energetca d edfc non dotat d mpanto d clmatzzazone nvernale e/o d produzone d acqua calda santara 1. In assenza d mpant termc,
Tutti gli strumenti vanno tarati
L'INCERTEZZA DI MISURA Anta Calcatell I.N.RI.M S eseguono e producono msure per prendere delle decson sulla base del rsultato ottenuto, come per esempo se bloccare l traffco n funzone d msure d lvello
PROGETTO SCUOLA POPOLARE
SPIN TIME LABS & ICBIE Europa Onlus PROGETTO SCUOLA POPOLARE 1 P a g e 1. Introduzone 2. Obettv e fnaltà 3. I tutor del progetto 4. Modulo I. Sostegno scolastco. 5. Modulo II.- Corso d lngua talana 6.
GLI ERRORI SPERIMENTALI NELLE MISURE DI LABORATORIO
GLI ERRORI SPERIMETALI ELLE MISURE DI LABORATORIO MISURA DI UA GRADEZZA FISICA S defnsce grandezza fsca una propretà de corp sulla quale possa essere eseguta un operazone d msura. Msurare una grandezza
Verifica termoigrometrica delle pareti
Unverstà Medterranea d Reggo Calabra Facoltà d Archtettura Corso d Tecnca del Controllo Ambentale A.A. 2009-200 Verfca termogrometrca delle paret Prof. Marna Mstretta ANALISI IGROTERMICA DEGLI ELEMENTI
La taratura degli strumenti di misura
La taratura degl strument d msura L mportanza dell operazone d taratura nasce dall esgenza d rendere l rsultato d una msura rferble a campon nazonal od nternazonal del msurando n questone affnché pù msure
* PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE *
* PROBABILITÀ - SCHEDA N. LE VARIABILI ALEATORIE *. Le varabl aleatore Nella scheda precedente abbamo defnto lo spazo camponaro come la totaltà degl est possbl d un espermento casuale; abbamo vsto che
SERIE STORICHE, TREND, MEDIE MOBILI, REGRESSIONE Andrea Prevete
SERIE STORICHE, TREND, MEDIE MOBILI, REGRESSIONE Andrea Prevete Una sere storca o temporale è un nseme d dat costtut da una sequenza d osservazon su un fenomeno d nteresse X, effettuate n stant (per le
Capitolo 2 Dati e Tabelle
Captolo 2 Dat e Tabelle La Descrzone della Popolazone La descrzone d una popolazone passa attraverso due fas: 1. la formazone de dat statstc 2. la sntes de dat La formazone del dato statstco prevede: ()
Incertezza di sensibilità < fluttuazione intrinseca delle misure.
Error casual no ad ora abbamo correlato la bontà d una msura alla sensbltà degl strument utlzzat. Samo partt da una stuazone n cu effettuata una sere d msure rpetute, le msure hanno tutte dato lo stesso
CAPITOLO 3 Incertezza di misura Pagina 26
CAPITOLO 3 Incertezza d msura Pagna 6 CAPITOLO 3 INCERTEZZA DI MISURA Le operazon d msurazone sono tutte nevtablmente affette da ncertezza e coè da un grado d ndetermnazone con l quale l processo d msurazone
Codice di Stoccaggio Capitolo 7 Bilanciamento e reintegrazione dello stoccaggio
Codce d Stoccaggo Captolo 7 Blancamento e rentegrazone dello stoccaggo 7.4 Corrspettv per servz d stoccaggo L UTENTE è tenuto a corrspondere a STOGIT, per la prestazone de servz, gl mport dervant dall
Strutture deformabili torsionalmente: analisi in FaTA-E
Strutture deformabl torsonalmente: anals n FaTA-E Il comportamento dsspatvo deale è negatvamente nfluenzato nel caso d strutture deformabl torsonalmente. Nelle Norme Tecnche cò vene consderato rducendo
Modelli descrittivi, statistica e simulazione
Modell descrttv, statstca e smulazone Master per Smart Logstcs specalst Roberto Cordone ([email protected]) Statstca descrttva Cernusco S.N., govedì 28 gennao 2016 (9.00/13.00) 1 / 15 Indc d poszone
DECRETA. ART. 3 Il compenso per l attività di collaborazione è fissato in 1.095,00 esente dall imposta sul reddito delle persone fisiche.
BANDO PER n. 64 BORSE DI COLLABORAZIONE PER IL SUPPORTO PRESSO IL C.I.A.O. DELL UNIVERSITA DEGLI STUDI DI ROMA LA SAPIENZA NEL PERIODO DA SETTEMBRE 2010 A FINE GENNAIO 2011 000280 IL RETTORE VISTO VISTO
Progetto Lauree Scientifiche. La corrente elettrica
Progetto Lauree Scentfche La corrente elettrca Conoscenze d base Forza elettromotrce Corrente Elettrca esstenza e resstvtà Legge d Ohm Crcut 2 Una spra d rame n equlbro elettrostatco In un crcuto semplce
