Elementi di statistica descrittiva Andrea Sambusetti URL:

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Elementi di statistica descrittiva Andrea Sambusetti e-mail: sambuset@mat.uniroma1.it URL: http://www.mat.uniroma1.it/people/sambusetti"

Transcript

1 APPENDICE A Elemeti di statistica descrittiva Adrea Sambusetti sambuset@mat.uiroma1.it URL: La statistica descrittiva ha lo scopo di aalizzare e iterpretare delle serie di dati, allo scopo di suggerire tedeze e strategie, forire test di verosimigliaza e creare modelli probabilistici che aiutio a prevedere (compito che è più specificatamete l oggetto della statistica ifereziale e del calcolo delle probabilità). 1. Distribuzioi di dati, rappresetazioe, frequeze Ua distribuzioe di dati è descritta, i geerale, da ua fuzioe X : Ω V, dove Ω è l isieme delle prove, o osservazioi, o popolazioe, e V è l isieme dei valori che ua certa osservazioe può dare. Ecco alcui esempi di distribuzioi: il valore di u carattere i ua certa popolazioe, come per es. le età degli studeti di ua classe: qui Ω è l isieme degli studeti, V l isieme delle età; il risultato di u umero ripetuto di misurazioi, come per es. la temperatura rilevata i u certo sito al variare del tempo: qui Ω è l isieme dei tempi ai quali si effettua la misurazioe, e V è l isieme delle temperature rilevate. Spesso, quado si tratta di prove o misure ripetute, Ω può essere preso uguale all isieme {1,..., } (dove è il umero delle prove); i tal caso, cooscere ua distribuzioe X vuol dire cooscere gli valori X(i) = x i, duque X può essere assimilata ad ua sequeza ordiata di valori (x 1,..., x ) (comuemete abbreviata co (x i ) ). Notiamo che l isieme dei valori V di ua distribuzioe può essere umerico o o. Per esempio: la distribuzioe che idica il gioro della settimaa di massima afflueza i ciascu ufficio postale di ua città (i cui l isieme dei valori V è l isieme dei giori della settimaa); oppure, la stessa distribuzioe delle età i ua popolazioe, se raccolte per itervalli (i cui l isieme V è u isieme di itervalli, per es. tra 0 e 10 ai, tra 11 e 20 ecc.), Tra i vari metodi utilizzati per riassumere e visualizzare le distribuzioi ci soo: diagrammi cartesiai per puti, spezzate o grafici. Di seguito, ecco u esempio per oguo di essi: 1

2 2 Appedice : elemeti di statistica descrittiva Esercizio A.1.1. Per ciascua delle distribuzioi alle figure , specificare l isieme Ω delle prove e l isieme V dei valori: Figura 1. Distribuzioe dell età i ua classe Figura 2. Distribuzioe degli itervalli di reddito medio per regioe Figura 3. Distribuzioe dell aomalia termometrica media terrestre i C U metodo sitetico alterativo per dare ua distribuzioe cosiste ello specificare, per ciascu valore x V possibile, la sua frequeza: cioè il umero f(x) = #X 1 (x) dei casi per i quali si ottiee il valore x. I questo modo la distribuzioe può essere riassuta da ua tabella riportate per ogi x la relativa frequeza f(x). Per esempio, la tabella associata alla distribuzioe delle età ell esercizio A.1.1, Figura 1, è: x = età f(x)

3 A. Sambusetti 3 Si oti che tale tabella o cotiee precisamete la stessa quatità di iformazioe della distribuzioe iiziale (si può dedurre da essa quali soo gli studeti che hao 20 ai?) ma, per molti fii statistici, essa rimpiazza adeguatamete la coosceza precisa della distribuzioe. Si oti ioltre che la somma di tutte le frequeze è sempre uguale al umero di prove (perché?); i umeri ˆf(x)/ soo detti frequeze relative, e dao quidi sempre somma 1. Esercizio A.1.2. Scrivere le tabelle associate a tutte le distribuzioi dell esercizio A.1.1. Ifie, è bee cooscere u ulteriore metodo di rappresetazioe della tabella di ua distribuzioe: gli istogrammi di frequeze e gli aerogrammi (o diagrammi a torta). Se X = (x i ) è ua distribuzioe di dati, l istogramma delle frequeze di X è semplicemete il grafico della fuzioe-frequeze f(x) i fuzioe dei valori possibili x, i quali vegoo rappresetati su u asse come itervallii. Si oti che le frequeze soo valori umerici pertato è sempre possibile cofrotarli umericamete (al cotrario dei valori x della distribuzioe X, che possoo o essere umerici): l istogramma permette precisamete u cofroto visivo immediato dei valori assuti co maggiore frequeza. Per redere geometricamete più ituitivo tale cofroto, i valori possibili x vegoo rappresetati co itervallii di uguale ampiezza, i modo che l area dei rettagolii risultati sia esattamete proporzioale alle frequeze 1. U diagramma a torta per X cosiste ivece i u cerchio, suddiviso i tati spicchi di area (o arco sotteso) proporzioale alla frequeze f(x); lo spicchio relativo ad u valore x corrispode duque ad u agolo al cetro α(x) dato dalla proporzioe f(x) : = α(x) : 2π cioè α(x) = ( 2π )f(x). L area degli spicchi dà quidi u idea immediata della proporzioe delle frequeze relative ˆf(x), cioè il rapporto tra le varie frequeze ed il umero totale delle osservazioi. Esempio A.1.3. L istogramma delle frequeze e l aerogramma della distribuzioe delle età ell Esercizio A.1.1, Figura 1, soo: Esercizio A.1.4. Costruire gli areogrammi delle altre distribuzioi dell esercizio A.1.1, Figure 2 e 3. 1 Qualora i valori x siao itervalli, è buoa orma rappresetarli sull asse co ampiezza proporzioale alla loro misura, i modo che le aree dei vari rettagolii dell istogramma risulti proporzioale ache a tali ampiezze.

4 4 Appedice : elemeti di statistica descrittiva Ifie, già dalla Figura 3 dell esempio A.1.1, osserviamo che può essere utile predere per isiemi Ω e V degli isiemi cotiui; quado, per esempio, l isieme delle osservazioi teda ad ifittirsi i u itervallo reale, o quado la relazioe tra osservazioi e valori sia meglio descritta da ua legge empirica espressa da ua fuzioe di variabile reale. Qui di seguito (Figura 4) portiamo u esempio i cui la distribuzioe esprime la crescita di ua coltura di batteri i fuzioe del tempo, e chiaramete il valore quatità di batteri è misurato più efficacemete come u volume (ua quatità cotiua), piuttosto che dal loro umero (ua quatità discreta), ed il tempo è pesato come cotiuo. Figura 4. Distribuzioe della crescita di ua coltura batterica: X(t) = v 02 t (cm 3 di volume i fuzioe del tempo, espresso i giori t 0) Può essere utile sapere cosa soo le frequeze el caso di ua distribuzioe cotiua come i Figura 4. Difatti, se Ω è u isieme ifiito, come u itervallo, i umeri f(x) = #X 1 (x) perdoo di seso (u valore può essere assuto da u ifiità di osservazioi!). Ricordiamo che la proprietà fodametale delle frequeze è di dare ua misura di quate volte u certo valore è assuto rispetto al umero di osservazioi totali; ovvero, il umero di osservazioi che dao u risultato compreso tra x 1 e x 2 si calcola tramite le frequeze come: (1.1) #X 1 (x 1, x 2) = #{i Ω X(i) (x 1, x 2)} = X f(x) x (x 1,x 2 ) Se desideriamo ua ozioe di frequeza co ua proprietà aaloga, el caso di ua distribuzioe data da ua fuzioe cotiua di variabile reale X : Ω = [a, b] V R, si può procedere el seguete modo: dobbiamo cosiderare ua misura per sottoisiemi A R (e o più il semplice umero di puti ), Z che si defiisce come l[a] = χ A(t)dt R dove χ A è la fuzioe caratteristica dell isieme A: tale misura è, per u uioe di itervalli, precisamete la somma delle loro ampiezze; quidi itroduciamo la fuzioe ripartizioe F : R R di X come F (x) = l[x 1 (, x)] la fuzioe, cioè, che dà la misura del sottoisieme di Ω su cui X vale meo di x; ifie defiiamo la frequeza del valore x della distribuzioe come f(x) = F (x); solamete, el cotesto cotiuo, tale fuzioe frequeza si chiama desità (della distribuzioe X, i x). Esempio A.1.5. Nel caso della distribuzioe X(t) = v 0e 2t i Figura 5, si ottiee: ( ( log F (x) = 2 (x/v 0), se x v 0 log, f(x) = 2 (e/x) se x v 0. 0 se x < v 0 0 se x < v 0

5 A. Sambusetti 5 Qualora questo processo risulti possibile (il che dipede dalla botà della distribuzioe iiziale X), la fuzioe desità f(x) sostituisce egregiamete l idea di frequeza del valore x el caso cotiuo; ifatti si ha, per il teorema fodametale del calcolo itegrale: (1.2) l[x 1 (x 1, x 2)] = l[x 1 (, x 2)] l[x 1 (, x 1)] = F (x 2) F (x 1) = Z x2 x 1 f(x)dx cioè la misura del sottoisieme di Ω su cui X assume valori compresi tra x 1 e x 2 è precisamete dato dall itegrale (o più ua somma) della fuzioe f sull itervallo (x 1, x 2). La formula (1.2) è allora proprio l aalogo della (1.1) el caso cotiuo. I queste ote, comuque, ci limiteremo comuque quasi esclusivamete allo studio di distribuzioi discrete, cioè per le quali l isieme delle osservazioi Ω sia fiito Idici di posizioe Data ua distribuzioe di dati, è spesso utile riassumere il suo adameto co dei umeri, o idicatori. Gli idicatori che adremo a defiire soo di due tipi: idici di posizioe (media, mediaa, mode) e idici di dispersioe (scarto assoluto e scarto quadratico medio). I primi idicao dei valori tipici (i u seso da precisare) della distribuzioe, i secodi misurao quato i valori della distribuzioe si discostao da tali valori tipici. Defiizioe A.2.1. Sia X = (x 1,..., x ) ua distribuzioe dati. Si defiisce: media (aritmetica) della distribuzioe X il umero M(X) = 1 x i ; mediaa di X è il umero otteuto riumerado gli (x i ) i ordie crescete, e quidi prededo il valore di mezzo : { x +1 se è dispari Me(X) = (x + x ) se è pari moda di X il valore Mo(X) = {x i f X (x i ) è massimo} che ha frequeza massima. Si oti subito che: i) la media si può calcolare ache come: M(X) = 1 x i x j f X (x i )x i. ii) la mediaa prova a rispodere al problema di trovare u valore y che divide la popolazioe i due classi di ugual umerosità, ua composta dalla parte della popolazioe su cui la distribuzioe vale meo di y, l altra su cui vale più di y. Me(X) risolve il problema el caso pari se i valori cetrali x, x soo differeti, o el caso dispari se il valore cetrale x +1 2 è assuto ua sola volta; altrimeti, può comuque esserci uo squilibrio umerico 3 tra il sottoisieme della popolazioe co valori iferiori a Me(X) e quello co valori superiori a M e(x) (come mostra il prossimo Esempio A.2.2). iii) la moda o è ecessariamete uica: se vi è più di u valore di frequeza massima, si soo vari massimi relativi, si parla di mode di X, e di distribuzioe plurimodale 4. 2 Il termie discreto assume i matematica, per variabili aleatorie e per spazi astratti, u sigificato più geerale di quello utilizzato qui. 3 Me(X) miimizza comuque la differeza di umerosità tra due classi della popolazioe co la proprietà di avere valori rispettivamete iferiore e superiore a u umero y fissato, cf. Teorema A.3.6(ii). 4 Quidi, ua distribuzioe co due valori di frequeza massima si dirà bimodale; ma si dirà bimodale ache ua distribuzioe il cui grafico delle frequeze abbia due massimi relativi, o ecessariamete uguali. I ogi caso, i valori corrispodeti si chiamerao prima, secoda moda, ecc. cf. Exempio A.3.4.

6 6 Appedice : elemeti di statistica descrittiva Notiamo ioltre che metre media e mediaa hao seso solo per distribuzioi di dati umerici, la moda può esser presa i cosiderazioe per qualsiasi tipo di dati (p.es., se i valori soo giori della settimaa). Esempio A.2.2. Per la distribuzioe dell esercizio A.1.1, Figura 1, si ha: M(X) = 19.82, Me(X) = 20 e Mo(X) = 19. Notare che il umero di studeti di età iferiore a Me(X) è 24 ed il umero di studeti co età superiore è 25! Di seguito vediamo alcui esempi che ci illustrao il tipico utilizzo di questi idici. Esercizio A.2.3 ( ). Il reddito mesile i ua regioe d Italia è distribuito per fasce (i percetuale ad ua popolazioe di N famiglie) secodo la seguete tabella: Keuro <.5.5/1 1/ /2 2/ /3 3/ /4 4/ /5 % Pop Sapedo che ogi famiglia spede circa il 10% del suo reddito i bei voluttuari ed il 5% i eergia, rispodere ai segueti problemi: (i) la Electroics Spa vuole produrre dei lettori mp3 da vedere ella regioe cosiderata. Qual è il massimo prezzo di vedita che la Electroics può fissare se desidera che il suo prodotto sia accessibile alla maggioraza delle famiglie? (ii) la Eergy Spa ha il moopolio della produzioe di eergia ella regioe. Quati milioi di euro di eergia al massimo la Eergy ha iteresse a produrre? Soluzioe. I questo esempio, i valori soo itervalli [x i, y i) (cioè abbiamo coppie di valori) metre la secoda riga dà le frequeze f i, espresse i percetuale (duque a somma = 100). Nel caso (i), la Electroics è iteressata alle frequeze della distribuzioe, e precisamete al valore x al di sotto del quale si trova il (10% del) reddito della maggioraza delle famiglie; pertato si calcolerà la mediaa dei redditi, o più precisamete u itervallo mediao, che ha estremi Me((x i) ) = 1.5 e Me((y i) ) = 2. La Electroics ha duque iteresse a produrre lettori di prezzo iferiore a 10% 1.5kAC = 150 euro. Nel caso (ii), la Eergy è iteressata più al al totale dei redditi che alla distribuzioe delle frequeze: essa deve provvedere al fabbisogo miimo di eergia, e o superare il massimo vedibile; quidi deve produrre almeo il 5%x i di euro di eergia per ogi i-ma fascia di reddito e o più del 5%y i. Sapedo che N è il umero totale di famiglie, segue che la Eergy dovrà produrre eergia, i euro, compresa tra i valori x = X N X N 5%x i f i = 5%N M((xi)) ed y = 5%y i f i = 5%N M((yi)) x i x j y i y j Come si vede, la risposta richiede duque il calcolo delle medie M((x i) ) = 16 e M((y i) ) = 20.85, e forisce x = 4 5 N e y = N. Esercizio A.2.4 ( ). I clieti di ua baca si distribuiscoo agli sportelli secodo la seguete statistica settimaale Gioro lu mar mer gio ve % Clieti (i) Secodo quale idicatore statistico u cliete (itelligete) sceglie il gioro i cui recarsi i baca? (ii) Secodo quale idicatore statistico il direttore misura l efficieza della propria filiale, e cosa vorrebbe miimizzare? Soluzioe. I questo caso, la distribuzioe ha come valori i giori della settimaa, ed è u esempio di utilità della moda. Si tratta chiaramete di ua distribuzioe bimodale, co due valori (il luedì e il mercoledì) che hao frequeza massima: u cliete accorto tede ad evitare tali giori i giori, corrispodeti alle due mode pari al 30%. D altrode, u direttore respodabile tederà a ifluezare il pubblico i modo che le frequeze f i dei vari giori della settimaa siao circa tutte uguali; poiché il totale delle frequeze (espresse i percetuale) è 100, ed i giori lavorativi soo 5, il direttore vorrebbe otteere delle frequeze f i il più possibile vicie a 20, la media delle frequeze (attezioe: o la media dei valori, che o soo umerici!). Uo stima di quato la filiale sia efficiete è duque dato dal umero P i fi 20 : più tale umero è vicio a zero, più si è vicii alla situazioe ideale.

7 A. Sambusetti 7 Esercizio A.2.5. I membri di u ammiistrazioe locale ha a disposizioe i segueti dati sulla atalità ella propria regioe: N. figli % Famiglie (i) Dire quale idice statistico studierao per sapere se la popolazioe locale è i aumeto o i decremeto, e per decidere ua coseguete politica demografica; (ii) se voglioo scegliere u cotributo miimo da erogare sulla base del umero di figli, assicuradosi la maggior parte dei cosesi, quale idicatore sceglierao e come lo userao? Esercizio A.2.6. La seguete rappreseta la tabella del tasso di mortalità (percetuale dei decessi per fascia di età, sul totale della popolazioe) di ua regioe italiaa el età mortalità 0.7% 0.05% 0.1% 0.2% 1% 2% 4% 1% 0.5% 0.2% (i) I ua coservatoria dell aagrafe si voglioo distribuire le pratiche i due staze di dimesioi più o meo uguali. Quale criterio statistico si seguirà per effettuare la divisioe delle pratiche? (ii) L INPS vuole avere ua stima grezza del umero totale di ai di pesioe che dovrà pagare alla popolazioe attuale della regioe, immagiado che tutti vadao i pesioe a 70 ai. Quale idicatore statistico studierà e perché? Quati soo gli ai attesi? Per ua persoa di età x, il umero M(X) x è detto aspettativa di vita della persoa. Ua compagia assicurativa, per le polizze-vita, chiede u premio che è strettamete correlato (egativamete) all aspettativa di vita della persoa che lo richiede. Vediamo qui u primo esempio i cui le distribuzioi statistiche soo utlizzate per la creazioe di modelli probabilistici, il cui studio ci porterebbe molto lotao. L itroduzioe e la giustificazioe di tali modelli a partire dai dati statistici è oggetto del calcolo delle probabilità. Esistoo aaloghi idicatori per distribuzioi cotiue. Se X : [a, b] V = [m, M] ha fuzioe desità f : [m, M] R si defiiscoo, i completa aalogia co il caso discreto: R media della distribuzioe X, il umero M(X) = 1 b X(t)dt = R 1 M xf(x)dx b a a b a m (questa ultima formula sarebbe da dimostrare!); mediaa di X, il valore Me(X) = x 0 tale che l[x 1 (, x 0)] = l[x 1 (x 0, + )], cioè che separa [a, b] i due sottoisiemi, che dao valori rispettivamete iferiori e superiori a x 0, di ugual misura (se si coosce la fuzioe di ripartizioe F (x), è l uico valore x 0 tale che F (x 0) = 1 (b a)); 2 mode Mo i(x), cioè i massimi relativi della fuzioe desità f(x) (ordiati i ordie decrescete). 3. Idici di dispersioe Per stimare, come ell Esercizio (ii), quato i valori di ua distribuzioe siao distati dal valore medio, si itroducoo gli idici di dispersioe: Defiizioe A.3.1. Sia X = (x 1,..., x ) ua distribuzioe di dati. Si defiisce: scarto di u valore x dalla media, il umero x M(X); aalogamete si parlerà di scarto assoluto e scarto quadratico per i umeri x M(X) e (x M(X)) 2 ; scarto assoluto medio della distribuzioe X, il umero MAD(X) = 1 x i M(X) (MAD sta per mea absolute deviatio ) ; scarto quadratico medio 5 o variaza di X, il umero V AR(X) = 1 (x i M(X)) 2 ; deviazioe stadard di X, il umero σ(x) = V AR(X) = 1 (x i M(X)) 2. 5 I alcui testi, co abuso di liguaggio, lo scarto quadratico medio è defiito differetemete da qui come la radice della media degli scarti quadratici.

8 8 Appedice : elemeti di statistica descrittiva Si oti che: i) per ua misura della botà delle distribuzioe di X attoro al valore medio M(X), si prede la media degli scarti assoluti o quadratici, e o semplicemete la media degli scarti; ciò i quato la media degli scarti dà sempre: M( (x i M(X)) ) = 1 quidi o è sigificativa! i (x i M(X)) = ( 1 i x i) M(X) = 0 ii) la deviazioe stadard è u idicatore preferibile rispetto alla variaza i quato ha la piacevole proprietà di essere dimesioalmete omogeeo co i dati (cioè: se i dati soo i metri, ache la deviazioe stadard è i metri, metre la variaza è i m 2 ). iii) MAD(X) e σ(x) soo ulli se e solo tutti i valori x i soo uguali al valore medio, e crescoo mao mao che ci soo più valori distati dal valore medio: i questo seso, soo degli stimatori di quato la distribuzioe è prossima o lotaa dalla media. Osservazioe A.3.2. È importate otare che tutti gli idici siora itrodotti possoo essere calcolati a partire dalla tabella della distribuzioe, i quato otteuti cooscedo i valori x i e le rispettive frequeze f i, tramite le formule equivaleti: MAD(X) = 1 f i x i M(X) x i x j V AR(X) = 1 f i (x i M(X)) 2 x i x j Queste formule soo otteute semplicemete raggruppado, ella defiizioe di M AD e V AR, gli f i addedi di ugual valore x i M(X), (x i M(X)) 2. La coosceza precisa della fuzioe distribuzioe (cioè X : Ω V) o è richiesta; azi, ai fii di ua descrizioe statistica, la tabella (cioè l istogramma delle frequeze) risulta sempre più chiara e leggibile, come lo dimostra u tetativo di lettura della Figura 1 rispetto alla Figura 4. Esempio A.3.3. Calcoliamo gli idici di dispersioe per la distribuzioe dell esercizio A.1.1, Figura 1. Per o fare errori, è cosigliato di sistemare i dati parziali (somma delle frequeze, scarti assoluti, scarti quadratici ecc) i ua tabella, quidi fare le somme: Si tratta evidetemete di ua distribuzioe uimodale co dati distribuiti molto vicio al valore medio: σ(x) è ifatti piccola rispetto ai valori delle età. Per distribuzioi co u gra umero di valori e frequeze, come il prossimo esempio, è vivamete cosigliato l uso di u foglio di calcolo...

9 A. Sambusetti 9 Esempio A.3.4. Calcoliamo idici di posizioe e idici di dispersioe per la distribuzioe dell età dei professori ordiari i Italia: Come si vede dall istogramma delle frequeze, si tratta di ua distribuzioe bimodale, e o sembra troppo cetrata attoro al valore medio. Eseguiamo i calcoli ecessari alla verifica i ua tabella:

10 10 Appedice : elemeti di statistica descrittiva Il calcolo degli idici di posizioe e di dispersioe ci dà due risultati iteressati: la media, i questo caso, è poco rappresetativa; difatti o è vero che la maggior parte dei doceti abbia età attoro ai 52 ai! Questa è ua caratteristica comue delle distribuzioi bimodali, le cui due mode siao relative a valori distati; i tal caso la media dei due valori più rappresetativi relativi alle due mode (i questo caso: 42 e 62) dà u valore otteuto co frequeza decisamete piú bassa. gli idici di dispersioe soo piuttosto alti (sempre rispetto ai valori della distribuzioe), e questo giustifica umericamete l impressioe di dispersioe della distribuzioe dal valore medio. Esercizio A.3.5. Calcolare media, mediaa, mode, scarto assoluto medio, scarto quadratico medio e deviazioe stadard, e dire i ciascu caso cosa suggeriscoo gli idicatori statistici, per: (i) le distribuzioi ell Esercizio A.1.1 (Figure 2 e 3); (ii) la distribuzioe ell Esempio A.2.3; (iii) la distribuzioe delle frequeze ell Esempio 3; (iv) la distribuzioe ell Esercizio A.2.5; (v) la distribuzioe ell Esercizio A.2.6. Perché media e mediaa si cosiderao valori caratteristici per ua distribuzioe di dati? Ua ragioe, oltre alle varie esposte precedetemete, è la seguete proprietà di questi due idici : Teorema A.3.6. Sia X = (x 1,..., x ) ua distribuzioe discreta di dati, e sia y u umero fissato. Cosideriamo le quatità MAD(X, y) = x i y, detta scarto assoluto medio di X da y Allora: V AR(X, y) = (x i y) 2, detta scarto quadratico medio di X da y (i) Me(X) è il valore di y per il quale MAD(X, y) è miimo ; (ii) M(X) è il valore di y per il quale V AR(X, y) è miimo. Cioè, se si vuole cosiderare ua ozioe di dispersioe, o distaza, di ua serie di dati da u valore fissato y (rispetto a misure aturali della dispersioe come: somma degli scarti assoluti o quadratici da y), i valori più adeguati per y soo proprio la media e mediaa, i quato miimizzao tale dispersioe. Dimostrazioe. (i) Sia y 0 = Me(X). Per defiizioe, vi soo tati valori x i miori (visualmete, alla siistra ) di y 0 di quati ve e soo alla destra di y 0. Suppoiamo ora che y = y 0 +, co > 0: allora, per tutti i valori x i a siistra di y 0, si ha che x i y è uguale a x i y 0 aumetato di, metre per tutti i valori x i alla destra di y 0, si ha x i y = (x i y 0 ) x i y 0 (disuguagliaza stretta se tra y 0 e y cade qualche x i ); pertato la somma di tutti i termii x i y risulta superiore o uguale alla somma di tutti i termii x i y 0. Ciò mostra che la fuzioe MAD(X, y) ha u miimo i y = y 0. (ii) Si ha (svolgedo i calcoli) ( ) 2 V AR(X, y) = x 2 i 2y x i + y 2 = y 1 x i + (1 1 ) x 2 i e questa fuzioe di y è miima quado il termie (y 1 i x i) 2 è miimo; ciò accade quado fa zero, cioè proprio per y = M(X).

11 A. Sambusetti 11 Riassumiamo quato imparato i questo capitolo dalla teoria e dagli esercizi i uo specchietto riepilogativo: idicatori di posizioe vataggi svataggi M(X) iteressa il totale dei valori poco rappresetativa se X è bimodale o fa (i geere) parte dei valori di X sesibile ad errori ei dati miimizza lo scarto quadratico medio X cetrata vicio a M(X) sse σ(x) è piccolo Me(X) descrive la maggioraza dei valori fa (i geere) parte dei valori di X poco sesibile ad errori ei dati scarsa rappresetazioe del totale dei valori miimizza lo scarto assoluto medio X cetrata vicio a Me(X) sse MAD(X) è piccolo Mo(X) utile per distribuzioi o umeriche poco iteressate se X o ha picchi Gli idici di dispersioe di ua distribuzioe cotiua X : [a, b] V = [m, M] si defiiscoo i maiera aturale, e si esprimoo tramite la fuzioe desità f : V R come V AR(X) = 1 b a MAD(X) = 1 b a Z b a Z b a X(t) M(X) dt = 1 b a (X(t) M(X)) 2 dt = 1 b a Z M m Z M m x M(X) f(x)dx [x M(X)] 2 f(x)dx σ(x) = p V AR(X). 4. Cambi di scala. Ua delle operazioi più frequeti i statistica è il cambio di scala. Ciò sigifica, data ua distribuzioe X = (x i ), applicare ua trasformazioe y = F (x) (biuivoca, mootoa) a tutti gli x i, otteedo ua uova distribuzioe Y = (y i ). I cambiameti di scala più comui soo i cambi di scala lieari e logaritmici, corrispodeti cioè a trasformazioi del tipo (4.1) y i = mx i + q (m 0) cambio di scala lieare 6 (4.2) y i = Log(px i ) (px i > 0) cambio di scala logaritmico I riscalameti lieari soo utilizzati per trasformare dei dati (x i ) i dati (y i ) i modo che y i y 1 x i x 1 = m cioè tali rapporti siao idipedeti da i. I valori vegoo quidi riscalati secodo u criterio di giustizia : a differeze uguali tra i valori x i corrispodoo differeze uguali tra i dati riscalati y i. Per esempio : Esercizio A.4.1. Sia X = (2, 4, 5, 6, 10, 14, 18, 20) la distribuzioe dei puti riportati da otto studeti al primo esoero, su u totale di 20 possibili per il totale degli esercizi. Riscalare liearmete i voti affiché 8 corrispoda al voto di 18 tretesimi e 20 corrispoda a 30 tretesimi. Soluzioe. Questo esercizio è importate per capire come procedere co i riscalameti lieari. Siao x i i voti origiali e y i i voti riscalati, da determiare. La formula di riscalameto lieare 4.1 rappreseta l equazioe di ua retta el piao oxy; i tale piao, u puto P rappreseta ua coppia (x, y) la cui ascissa è il valore x da riscalare, e la cui ordiata è il valore riscalato y. Per trovare la formula di riscalameto co le proprietà desiderate è allora sufficiete scrivere l equazioe della retta r che passa per i due puti y 18 P 1 = (x 1, y 1) = (6, 18) e P 2 = (x 2, y 2) = (20, 30) data da r : = x 6, cioè y = 6 (x + 15) U riscalameto lieare (4.1) si dirà cocorde se m > 0 (i tal caso, l ordie dei dati è coservato).

12 12 Appedice : elemeti di statistica descrittiva Le scale logaritmiche soo utilizzate ivece per serie di dati di gradezza molto variabile; è immediato verificare che se gli (y i ) soo otteuti per riscalameto logaritmico dagli (x i ) secodo la formula (4.2), si ha y i y 1 = Log( x i x 1 ) cioè i rapporti uguali tra gli x i corrispodoo differeze uguali tra i dati riscalati y i. Per esempio, per i terremoti, i cui l ampiezza delle ode e dell eergia rilasciata può avere variazioi molto gradi, si usa ua scala logaritmica (la scala Richter): ad u oscillazioe x del sismografo a 100km dall epicetro, si associa il valore y = Log(p x) ella uova scala (per ua certa costate di calibrazioe p): Esercizio A.4.2. La tabella mostra la scala Richter degli eveti a lato idicati: Cooscedo la legge di riscalameto logaritmico della scala Richter sopra descritta y = Log(p x): (i) calcolare la differeza di ampiezza delle ode sismiche tra quelle registrate per Cherobyl e quelle registrate per Haiti; (ii) trovare il valore delle ampiezze delle ode registrate, a partire dai dati sulla scala Richter (ammettiamo p = 1, per semplicità) e provare a fare u istogramma delle ampiezze. Soluzioe. Per etrambi i puti, per recuperare i valori delle ampiezze x a partire dai valori y ella scala Richter, si deve ivertire la formula y = Log(px). Per (i), sappiamo che y 5 y 3 = = 2.13 = Log(px 5) Log(px 3) = Log( x 5 x 3 ) da cui x 5 = x 3. Cioè le ode, el caso di Haiti, soo state circa 100 volte più ampie di quelle registrate a Cherobyl. 7 Quato a (ii), la formula iversa è x = p 1 10 y quidi otteiamo (per p = 1) la tabella: scala Richter ampiezza E E E Notate che o c è stato bisogo di utilizzare il valore della costate di calibrazioe p.

13 A. Sambusetti 13 dove gli ultimi dati soo scritti i otazioe scietifica per il gra umero di cifre. U tetativo di istogramma delle ampiezze darebbe: Questo esempio dovrebbe covicervi del perché si usi ua scala logaritmica: altrimeti l istogramma risulta illeggibile! La seguete proposizioe mostra come cambiao gli idici di posizioe e di dispersioe quado si esegue u cambiameto di scala lieare: Proposizioe A.4.3. Sia Y = (y i ) la distribuzioe otteuta riscalado liarmete la distribuzioe X = (x i ), secodo la formula y i = mx i + q. Allora si ha: (i) M(Y ) = mm(x) + q; (ii) Me(Y ) = mme(x) + q; (ii) Mo(Y ) = mmo(x) + q; (iii) MAD(Y ) = m MAD(X); (iv) V AR(Y ) = m 2 V AR(X); (v) σ(y ) = m σ(x). I particolare, ogi distribuzioe X = (x i ) può essere trasformata i ua uova distribuzioe ˆX = (ˆx i ) avete M( ˆX) = 0 e σ( ˆX) = 1, applicado il riscalameto lieare ˆx i = 1 σ(x) (x i M(X)) Questo riscalameto riveste ua particolare importaza, come vedremo el prossimo paragrafo, ed è detto riscalameto ormale o stadard di X. Dimostrazioe. Se i dati X = (x i ) soo ordiati i ordie crescete, u riscalameto lieare preserva l ordie se m > 0, o lo iverte se m < 0; i ogi caso, il valore mediao viee coservato, quidi la uova mediaa è il valore della vecchia mediaa, riscalato secodo la stessa legge. Discorso aalogo per le mode: la uova distribuzioe ha per valori y i di frequeza massima (assoluti o relativi) quelli corrispodeti agli x i di frequeza massima della vecchia distribuzioe. Ciò dimostra (i) e (iii). Verifichiamo ora le altre formule: M(Y ) = 1 y i = 1 (mx i + q) = m 1 x i + 1 q = mm(x) + q e duque MAD(Y ) = 1 y i M(Y ) = 1 mx i + q mm(x) q = m MAD(X) V ARY ) = 1 (y i M(Y )) 2 = 1 (mx i + q mm(x) q) 2 = m 2 V AR(X) da cui segue ache la formula per la deviazioe stadard.

14 14 Appedice : elemeti di statistica descrittiva 5. Correlazioe. Immagiiamo di avere due distribuzioi umeriche discrete di dati X = (x i ) ed Y = (y i ), che o ci sembrio del tutto idipedeti l ua dall altra. Potrebbe essere il caso, per esempio, per il umero di automobili che trasitao vicio ad u certo sito archeologico, e l idice di aerimeto dei moumeti i quel sito. Viee spotaeo il problema di defiire u idicatore statistico che misuri quato i due dati siao effettivamete legati tra loro: questo problema è oggetto della teoria della correlazioe, di cui di seguito riportiamo i primi elemeti. Due distribuzioi umeriche di dati X = (x i ) ed Y = (y i ) possoo essere visualizzate cotemporaeamete come u isieme di puti P i = (x i, y i ) el piao cartesiao oxy. Esse apparirao a priori come ua uvola disordiata di puti: el caso ivece i cui tale uvola approssimi l adameto del grafico di ua fuzioe y = f(x) è aturale supporre l esisteza di ua legge (rilevata dalla statistica) che lega i dati y i ai dati x i. Esempio A.5.1. Guardiamo i dati dell Esercizio A.1.1, Figura 1: sull asse delle ascisse abbiamo i umeri di matricola X = (x i) degli studeti, e sull asse delle ordiate le rispettive età Y = (y i). Le due distribuzioi di dati X, Y, visualizzate come puti (x i, y i) formao u isieme disordiato di puti el piao oxy, e o suggeriscoo alcua relazioe tra essi: d altrode, sarebbe be strao che ci fosse u legame tra il umero di matricola e l età di uo studete i ua classe! 8 Esempio A.5.2. Guardiamo ivece i dati dell Esercizio A.1.1, Figura 3, limitadoci alle temperature ella secoda metà del secolo: Figura 5. Aomalia termometrica ella secoda metà del secolo L adameto egli ai dell aomalia termometrica (dati i rosso) sembra approssimabile grossolaamete all adameto di ua retta (disegata i blu): questo suggerisce ua correlazioe lieare positiva tra il tempo e l ialzameto della temperatura terrestre. 8 Sarebbe altrimeti se, per esempio, la tabella riportasse le distribuzioi delle età e dei umeri di matricola di tutti gli studeti di u uiversità: i tal caso, probabilmete, i umeri di matricola più bassi corrispoderebbero a studeti immatricolati ai prima, e duque meo giovai, e dal grafico si riscotrerebbe ua correlazioe egativa: al crescere della matricola, l età dovrebbe ma mao scedere.

15 A. Sambusetti 15 Esempio A.5.3. Il volume X(t) di ua coltura batterica, misurato ad itervalli di tempo regolari, forisce i valori i rosso ella Figura 7. L adameto suggerisce ua legge espoeziale el tempo, del tipo f(t) = 1 2 et, rappresetata i blu. I tal caso, si parla di correlazioe espoeziale tra il tempo e la crescita della coltura. Figura 6. Volume di ua coltura batterica i fuzioe del tempo Come mostrato el precedete esempio, due distribuzioi di dati Y = (y i ), X = (x i ) possoo suggerire u legame tra loro di tipo lieare (cioè approssimabile co ua legge di lieare del tipo y = f(x) = mx + q), ed i tal caso si parlerà di correlazioe lieare; oppure ua relazioe di tipo espoeziale, come y = a x (si parla i tal caso di correlazioe espoeziale); oppure poliomiale, come per es. y = x a (correlazioe poliomiale), ecc. Nel seguito, oi ci iteresseremo esclusivamete alla teoria della correlazioe lieare: essa forisce degli idicatori umerici precisi che misurao quato sia corretto parlare di legame lieare tra due distribuzioi. Defiizioe A.5.4. Sia S = {(x i, y i )}, i = 1,.., u isieme di puti el piao oxy, ed r : y = mx + q ua retta. La distaza lieare dell isieme S dalla retta r è defiita come (S, r) = y i (mx i + q) e corrispode a sommare tutte le distaze tra i puti (x i, y i ) e i puti su r di uguali ascisse. La distaza lieare è ua misura di quato l isieme S approssimi ua retta (ovvero di quato i valori y i dipedao liearmete dai valori x i ); essa è ulla chiaramete se e solo se S r, cioè se esistoo m, q tali che y i = mx i + q per ogi i = 1,...,. Teorema A.5.5. Siao X =(x i ), Y =(y i ) due distribuzioi di dati, ed S ={(x i, y i )} l isieme dei puti corrispodeti el piao oxy; suppoiamo ioltre che esistao almeo x 1, x 2 co x 1 x 2 (altrimeti i puti di S giaccioo su ua retta verticale). Defiiamo covariaza delle due distribuzioi il umero COV AR(X, Y ) = 1 [x i M(X)] [y i M(Y )] Allora, la retta r 0 : y = m 0 x + q 0 co m 0 = COV AR(X, Y ) V AR(X) q 0 = M(Y ) m 0 M(X) miimizza la distaza lieare da S, cioè (S, r 0 ) (S, r) per ogi altra retta r del piao.

16 16 Appedice : elemeti di statistica descrittiva La retta r 0 del teorema è detta retta di regressioe di Y rispetto a X; essa è la retta che meglio approssima l isieme S dei puti (x i, y i ) defiiti dalle due distribuzioi (el seso spiegato dal teorema). Più i puti P i tedoo ad essere allieati, più la distaza (S, r 0 ) dalla retta di regressioe dimiuisce. Come caso limite, se (S, r 0 ) = 0 allora si deduce che tutti i puti soo sulla retta di regressioe, ovvero esiste ua relazioe lieare y i = m 0 x i + q 0 tra i dati; i tal caso i dati (x i ), (y i ) di dicoo perfettamete correlati. Quado m 0 > 0, i dati si dicoo correlati positivamete (i quato al crescere degli x i, gli y i tedoo a crescere); se ivece m 0 < 0, i dati si dicoo correlati egativamete (i quato al crescere degli x i, gli y i tedoo a dimiuire). È chiaro ifie che, maggiore è m 0 (i modulo), maggiore è la variazioe dei valori y i al crescere degli x i, i quato maggiore è la pedeza della retta di regressioe. Attezioe: la retta di regressioe per le distribuzioi X, Y dipede da quale dei due isiemi di dati è pesato come (possibilmete) dipedete dall altro. Difatti, il coefficiete agolare m 0 della retta di regressioe ha al deomiatore V AR(X), se si pesa ad ua relazioe di dipedeza del tipo y i = f(x i ), metre avrebbe V AR(Y ) se si pesa che gli x i dipedao dagli y i. Per questo, el calcolo della retta di regressioe, va sempre specificato quale distribuzioe di dati è pesata dipedete dall altra. Dimostrazioe. Sia r : y = mx + q ua retta qualsiasi. Si ha: (S, r) = (mx i + q y i ) 2 = (m, q) Per ogi m fissato, (m, q) è u poliomio di grado due i q, co termie di grado massimo uguale a q 2, duque ua parabola P m co cocavità rivolta verso l alto. Seza fare troppi calcoli, il vertice di tale parabola, cioè il miimo di (m, q) per m fissato, si trova impoedo q (m, q) = 2 (mx i +q y i ) = 0 (dove q idica la derivata rispetto a q, per m fissato), cioè ( ) (5.1) q + x i m = y i. Aalogamete, per ogi q fissato, (m, q) è u poliomio di grado due i m, co termie di grado massimo uguale a ( x2 i )m2, e rappreseta ua parabola P q co cocavità rivolta verso l alto. Il vertice di tale parabola, cioè il miimo di (m, q) per q fissato, si trova impoedo m (m, q) = 2 (mx i + q y i )x i = 0 (dove m idica ora la derivata rispetto a m, per q fissato), cioè (5.2) ( ) ( x i q + x 2 i ) m = x i y i Si oti che il sistema i (m, q) otteuto dalle due equazioi (5.1) e (5.2) ha matrice dei coefficieti il cui determiate vale 1 i x2 i M(X)2 = V AR(X), ed è o ullo poiché esistoo per ipotesi due valori x 1 x 2. Il miimo di (m, q) è allora otteuto dall uica coppia (m 0, q 0 ) che risolve tale sistema: ifatti, per ogi altro m, q si ha (m, q) (m, q 0 ) (m 0, q 0 ).

17 A. Sambusetti 17 Risolvedo co Cramer il sistema composto da (5.1) e (5.2) si trova l uica soluzioe i y i i m 0 = x i i x iy i 1 i i x = x iy i M(X)M(Y ) COV AR(X, Y ) 1 i i x2 i = M(X)2 V AR(X) i x i i x2 i y i x i q 0 = x iy i x2 1 i i x = x2 i M(Y ) 1 i x iy i M(X) 1 i i x2 i = M(X)2 x i x2 i [ 1 i = x2 i M(X)2] M(Y ) + M(X) 2 M(Y ) 1 i x iy i M(X) i x2 i = M(X)2 1 1 ( 1 i = M(Y ) x ) iy i M(X)M(Y ) i x2 i M(X) = M(Y ) m 0 M(X). M(X)2 Facciamo qualche esempio. Esercizio A.5.6 ( ). Sei reclute hao otteuto i segueti voti V = (v i) elle prove fisiche; per oguo di essi, idichiamo ache altezza H = (h i) e peso P = (p i): voto V altezza H peso P (i) Calcolare media e deviazioe stadard delle distribuzioi V, H, P ; (ii) calcolare coefficiete agolare m 0 ed itercetta q 0 delle rette di regressioe della distribuzioe V i dipedeza da H, e della distribuzioe V i dipedeza da P ; (iii) che tipo di correlazioe c è tra i dati? Soluzioe. Chiaramete, è ragioevole pesare che ci sia ua relazioe di dipedeza dei risultati otteuti elle prove fisiche dalle caratteristiche fisiche (altezza, peso) delle reclute, e o certo il viceversa. Questo spiega perché V è pesata dipedete da H e P. I calcoli diretti dao: M V AR σ COV AR(V, ) m 0(V, ) q 0(V, ) V H P Essedo m i etrambi i casi, i calcoli sembrao duque mostrare ua leggera correlazioe positiva di V co H e co P (le rette di regressioe relative alle coppie (V, H) e (V, P ) hao icliazioe α = arcta m 0 30 ). Questa coclusioe adrà rivista più i là, quado parleremo di retta di regressioe dei dati ormalizzati.

18 18 Appedice : elemeti di statistica descrittiva Esercizio A.5.7 ( ). Ua ditta di aspirapolvere pubblicizza i suoi prodotti tramite rappresetati iviati porta a porta. Nella seguete tabella riportiamo i profitti p (i migliaia di euro) otteuti e il umero c di clieti visitati da sei rappresetati: Rappresetate p 6 4, 5 3, 5 2, 5 4 5, 5 c (i) Calcolare medie e deviazioi stadard di ciascua distribuzioe; (ii) calcolare i coefficieti m 0, q 0 della retta di regressioe, prededo p dipedete da c; (iii) che tipo di correlazioe c e tra i dati? Soluzioe. I calcoli diretti dao i questo caso: M V AR σ COV AR(p, ) m 0(p, ) q 0(p, ) p c Essedo m 0 = , i calcoli sembrao mostrare ua correlazioe positiva dei profitti co il umero di clieti visitati, ma bassissima: la retta di regressioe relativa alle coppie (p, s) è ifatti quasi orizzotale, duque ad u aumeto ache cosistete di c corrispode u aumeto piccolissimo di p... Ache i questo caso, la coclusioe adrà rivista fra breve. I risultati otteuti ei due esempi precedeti (soprattutto el secodo) dovrebbero sollevare qualche obiezioe el lettore atteto. La prima obiezioe è che la teoria della correlazioe ha u seso per isiemi abbastaza umerosi di dati: si pesi al fatto che, se le distribuzioi avessero solo due dati, esisterebbe sempre ua retta che cotiee i due puti corrispodeti! Sei dati, come ei ostri esempi, soo certamete i umero isufficiete per dedurre ua qualsiasi legge empirica che leghi due serie di dati (egli esempi, si è scelto = 6 solo per facilità di calcolo!). La secoda obiezioe, più seria, è che le impressioi (grafiche e umeriche) di prossimità di ua uvola di puti alla retta di regressioe, e di pedeza di tale retta (cioè quato fortemete gli y i siao ifluezati da ua variazioe egli x i ) dipedoo dalle scale scelte per misurare i dati! Se, per esempio, i?? i profitti fossero misurati i euro, ivece di migliaia di euro, la retta di regressioe risulterebbe quasi verticale, idicado ua correlazioe fortissima tra umero di clieti visitati e profitti! Aalogamete, il coefficiete agolare delle rette di regressioe ell Esercizio A.5.6 cambierebbe drasticamete se le misure delle reclute fossero prese i metri, grammi ecc.

19 A. Sambusetti 19 Si potrebbe pesare di ovviare a questo problema scegliedo, per ciascu tipo di dato possibile, ua scala uiversalmete ricoosciuta (per le lughezze: i metri, per il dearo: gli euro, ecc.) ma questa è solo ua soluzioe apparete. Come cofroteremmo, ifatti, l iflueza di due serie di dati X, X o omogeee su ua distribuzioe Y? Si pesi, per esempio, a misurare l iflueza di altezze e peso sui risultati elle prove fisiche delle reclute: la pedeza delle rette di regressioe risulterebbe comuque dipedete dalla ostra arbitraria scelta di scala. Facciamo u esempio acora più cocreto: immagiiamo di essere chiamati a eseguire uo studio delle cause dell aerimeto dei moumeti i certi siti, al fie di stabilire ua politica di preservazioe: è chiara la ecessità di ua misura asettica dell iflueza di u dato (traffico, precipitazioi...) sull aerimeto: Esercizio A.5.8 ( ). I cique siti differeti si soo rilevati i segueti dati, relativi all ao 2008, sull idice di aerimeto 9 A dei moumeti preseti, sul umero medio gioraliero N di automobili i trasito i prossimità dei sito, e sulla quatità P di precipitazioi aue (espresse i mm): sito torre asielli (BO) palazzo Pitti (FI) S.Ambrogio (MI) S.Chiara (NA) S.Domeico (PA) colosseo (RM) A N P (i) calcolare media e deviazioe stadard delle distribuzioi A, N e P ; (ii) calcolare coefficiete agolare m 0 ed itercetta q 0 delle rette di regressioe della variabile A i dipedeza da N ed i dipedeza da P ; (iii) che tipo di correlazioe c e tra i dati? I risultati ella scala sopra utilizzata soo addirittura paradossali (svolgere l esercizio...). Qual è duque la scala giusta per misurare la correlazioe tra due serie di dati? Il seguete risultato risolve i ostri dubbi, spiegado che la scala giusta è quella ormale: Teorema A.5.9. Siao X = (x i ), Y = (y i ) due distribuzioi di dati (co almeo due valori x 1 x 2 ) e siao ˆX = (ˆx i ), Ŷ = (ŷ i ) i riscalameti ormali delle due distribuzioi. La retta di regressioe ˆr di Ŷ rispetto a ˆX ha le segueti proprietà: (i) o dipede dalla scala lieare (purché cocorde) scelta per misurare i dati (x i ), (y i ); (ii) ha equazioe ˆr : y = Cx, dove C = COV AR( ˆX, Ŷ ) V AR( ˆX) = ˆX Ŷ ˆX Ŷ = (x i M(X))(y i M(Y )) (x i M(X)) 2 (y i M(Y )) 2 (iii) il coefficiete agolare C appartiee all itervallo [ 1, 1], e vale C = 1 se e solo se ˆX = Ŷ, cioè i puti (ˆx i, ŷ i ) giaccioo sulla bisettrice del I quadrate, ed i puti origiali (x i, y i ) soo allieati (rispettivamete C = 1 ses ˆX = Ŷ, gli (ˆx i, ŷ i ) giaccioo sulla bisettrice del IV quadrate, e i puti origiali soo allieati); se C 1 < ɛ allora ŷ i ˆx i < 2ɛ, cioè più C è vicio ad 1 più la differeza tra tutti i valori ŷ i e ˆx i è piccola (rispettivamete se C ( 1) < ɛ allora ŷ i ( ˆx i ) < 2ɛ). 9 La brillaza B di u isieme di moumeti è la percetuale di superficie biaca sul totale (ad u certo mometo T ), e può essere misurata co appositi strumeti; l aerimeto è la percetuale restate. L idice di aerimeto A( T ) è la quatità di aerimeto (ovvero di brillaza persa) i u certo periodo di tempo T fissato.

20 20 Appedice : elemeti di statistica descrittiva Il coefficiete agolare C delle distribuzioi riscalate i modo ormale è duque la giusta misura di correlazioe tra le due serie di dati; questo importate coefficiete è oto come idice di correlazioe di Pearso. Attezioe: il putio tra ˆX ed Ŷ ella formula (ii) per C deota il prodotto scalare tra i vettori (-dimesioali) ˆX, Ŷ e o va cofuso co l usuale prodotto di due umeri! Dimostrazioe. Per mostrare (i), suppoiamo che X = ax + b e Y = cy + d siao due riscalameti lieari cocordi di X e Y (per es.: gli x i misurati i cm, e x i i metri, oppure gli y i i gradi Celsius e gli y i i gradi Farheheit...). Poiché a > 0, dalle formule (ii) e (v) della Proposizioe A.4.3, si deduce x i = 1 σ(x ) (x i M(X )) = 1 aσ(x) (ax i + b am(x) b) = 1 σ(x) (x i M(X)) = ˆx i ed aalogamete ŷ i = ŷ i. Pertato le rette di regressioe di ˆX, Ŷ e di X, Ŷ soo le stesse. Quidi, calcoliamo la covariaza delle distribuzioi X, Y riscalate ormalmete: COV AR( ˆX, Ŷ ) = 1 (ˆx i M( ˆX))(ŷ i M(Ŷ )) = 1 ˆx i ŷ i = ˆX Ŷ ˆX Ŷ i quato M( ˆX)=M(Ŷ )=0 e ˆX = i ˆx2 i = σ( ˆX) =, ed aalogamete Ŷ =. Pertato il coefficiete agolare ˆm 0 della retta di regressioe di ˆX, Ŷ è ˆm 0 = COV AR( ˆX, Ŷ ) V AR( ˆX) = ˆX Ŷ ˆX Ŷ = 1 1 (x i M(X)) (y i M(Y )) (xi M(X)) 2 (y i M(Y )) 2 1 che dà la formula auciata i (ii). Il fatto poi che ˆm 0 1 segue dalla disuguagliaza di Cauchy-Schwarz: essa implica ˆX Ŷ ˆX Ŷ e dice che vale l uguagliaza ˆX Ŷ = ˆX Ŷ (rispettivamete, ˆX Ŷ = ˆX Ŷ ) se e solo se Ŷ = λ ˆX per qualche λ > 0 (risp. per λ < 0); ma essedo Ŷ, ˆX vettori di ugual orma, uguale a, questa codizioe sigifica precisamete Ŷ = ˆX (risp. Ŷ = ˆX). Pertato, ˆm 0 = ±1 se e solo se, rispettivamete, Ŷ = ± ˆX, cioè i puti riscalati (ˆx i, ŷ i ) soo allieati sulla bisettrice del I o IV quadrate. Ioltre, poiché u riscalameto lieare dei due assi del piao oxy trasforma rette i rette, ciò accade se e solo se i puti origiali (x i, y i ) erao a loro volta tutti allieati. Suppoiamo ifie che ˆm 0 1 < ɛ; allora ˆX Ŷ X Y > 1 ɛ e si calcola: ˆX Ŷ 2 = ˆX 2 + Ŷ 2 2 ˆX Ŷ < ˆX 2 + Ŷ 2 2(1 ɛ) ˆX Ŷ = ɛ il che prova che y i x i < 2ɛ e dimostra l ultima asserzioe i (iii). Ripetere i calcoli degli Esercizi A.5.6 e A.5.7 e A.5.8, prededo come dati le distribuzioi ormalizzate e calcolado l idice di correlazioe di Pearso. Reiterpretare quidi correttamete i risultati trovati.

21 A. Sambusetti 21 Esercizio A.5.10 ( ). Nelle segueti città si soo registrati, el 2010, i segueti dati di afflueza ei musei, espressi i termii di umero di biglietti B = (b i): Roma , Madrid , Parigi , Lodra , Berlio Il umero di abitati di queste città (idicata co A = (a i)) è riportata i tabella, espressa i milioi di abitati: (i) Calcolare medie e variaze della popolazioe A ed del umero di biglietti B (espressi ella scala più comoda) elle cique città; (ii) calcolare la covariaza dei due isiemi di dati, idicado quale dei due ha seso cosiderare come variabile dipedete; (iii) calcolare l idice di correlazioe di Pearso C e l agolo ϑ che la retta di regressioe dei dati ormalizzati forma co l asse x; (iv) cosa si può dedurre dall aalisi statistica di tali dati? Esercizio A.5.11 ( ). La tabella riporta, il umero A di automobili immatricolate (per migliaio di abitati) ed il tempo medio H del tragitto da casa a lavoro (per abitate, espresso i miuti), elle pricipali capitali europee: Roma Madrid Parigi Lodra Berlio A H (i) Calcolare medie e variaze delle due distribuzioi; (ii) calcolare la covariaza dei due isiemi di dati, idicado quale dei due ha seso cosiderare come variabile dipedete; (iii) calcolare l idice di correlazioe di Pearso, l equazioe della retta di regressioe dei dati ormalizzati e l agolo che essa forma co l asse x; (iv) descrivere il tipo di correlazioe lieare che sussiste tra i due isiemi di dati. (Costruire ua tabella come quella dell esercizio precedete). Esercizio A.5.12 ( ). I dati segueti soo relativi al umero di decessi, i ua determiata popolazioe, dovuti a problemi cardiocircolatori e a tumori i 10 ai. ao (a i) decessi decessi per malattie cardiache decessi per tumori Si calcolio: (i) le percetuali C = (c i%) e T = (t i%) delle due differeti cause di decesso sul totale dei decessi, i ciascu ao A = (a i); (ii) le distribuzioi Â, Ĉ, ˆT riscalate i modo ormale; (iii) media e deviazioe stadard delle distribuzioi A, Â, C, Ĉ, T, ˆT ; (iv) coefficieti agolari delle rette di regressioe delle distribuzioi C, T i dipedeza dal tempo A; calcolare gli stessi coefficieti per le distribuzioi ormalizzate Ĉ, ˆT i dipedeza da  (cioè gli idici di correlazioe di Pearso); (v) che tipo di correlazioe c e tra i dati? E possibile dire che ua delle due malattie ha seguito u evidete icremeto/decremeto lieare el tempo? (Costruire ua tabella come quella dell esercizio precedete).

22 22 Appedice : elemeti di statistica descrittiva Soluzioi Soluzioe corretta dell Esercizio A.5.6. Le rette di regressioe dei dati ormalizzati mostrao ua correlazioe decisamete più forte tra voti e peso (C(V, P ) = 0.85), piuttosto che tra voti e altezza (C(V, H) = 0.45), correlazioe che o è evidete dalle rette di regressioe dei dati o ormalizzati. Soluzioe corretta dell Esercizio A.5.7. I questo esempio la differeza tra coefficiete agolare della retta di regressioe rispetto ai dati iiziali e rispetto ai dati ormalizzati è acora più evidete. Chiaramete, la retta di regressioe rispetto ai dati iiziali risulta molto schiacciata sull asse x (m = 0.05) a causa della otevole differeza di scala utilizzata per studi e profitti. Il coefficiete di Pearso rivela ivece ua fortissima correlazioe positva tra i due dati, quasi perfetta (C = 0.99). Soluzioe dell Esercizio A.5.8. Ache i questo caso, i calcoli mostrao ua correlazioe positiva quasi perfetta tra idice di aerimeto e umero di auto i trasito, metre la correlazioe tra aerimeto e precipitazioi è positiva ma debole. Questa differeza o era evideziata dai dati prima della ormalizzazioe (a causa della differeza otevole di scala tra i dati N, P ed A).

23 A. Sambusetti 23 Soluzioe dell Esercizio A Si è scelto di riportare i dati di afflueza i i decie di migliaia di biglietti (o dipededo il risultato dell aalisi dalla scala lieare scelta). Il coefficiete di Pearso mostra che c è ua correlazioe positiva debolissima tra umero di abitati e umero di biglietti veduti C = 0.15). L afflueza ai musei dipede quidi da altri fattori che o semplicemete la umerosità della popolazioe (pubblicità, livello di educazioe medio ecc.) Soluzioe dell Esercizio A Il calcolo di C dimostra ua correlazioe positiva tra umero di auto immatricolate e tempo di percorreza: l agolo della retta di regressioe è ifatti 38.3, prossimo al massimo di 45. (I dati soo veritieri) Soluzioe dell Esercizio A L idice di Pearso dimostra ua correlazioe egativa otevole tra tempo e umero di decessi per malattie cardiocircolatorie (cioè i casi di decesso per tali cause soo dimiuiti liearmete i modo cosistete ao per ao), essedo C 1. No si può dire uguale per il umero di decessi per malattie tumorali, che mostra ua correlazioe positiva, beché debole (C = 0.27), co il tempo. Si oti il riscalameto comodo (e iifluete sul coefficiete di Pearso) degli ai tra 1 e 10.

SUCCESSIONI NUMERICHE

SUCCESSIONI NUMERICHE SUCCESSIONI NUMERICHE Ua fuzioe reale di ua variabile reale f di domiio A è ua legge che ad ogi x A associa u umero reale che deotiamo co f(x). Se A = N, la f è detta successioe di umeri reali. Se co si

Dettagli

Successioni. Grafico di una successione

Successioni. Grafico di una successione Successioi Ua successioe di umeri reali è semplicemete ua sequeza di ifiiti umeri reali:, 2, 3,...,,... dove co idichiamo il termie geerale della successioe. Ad esempio, discutedo il sigificato fiaziario

Dettagli

Anno 5 Successioni numeriche

Anno 5 Successioni numeriche Ao 5 Successioi umeriche Itroduzioe I questa lezioe impareremo a descrivere e calcolare il limite di ua successioe. Ma cos è ua successioe? Come si calcola il suo limite? Al termie di questa lezioe sarai

Dettagli

52. Se in una città ci fosse un medico ogni 500 abitanti, quale sarebbe la percentuale di medici? A) 5 % B) 2 % C) 0,2 % D) 0,5% E) 0,02%

52. Se in una città ci fosse un medico ogni 500 abitanti, quale sarebbe la percentuale di medici? A) 5 % B) 2 % C) 0,2 % D) 0,5% E) 0,02% RISPOSTE MOTIVATE QUIZ D AMMISSIONE 2000-2001 MATEMATICA 51. L espressioe log( 2 ) equivale a : A) 2log B) log2 C) 2log D) log E) log 2 Dati 2 umeri positivi a e b (co a 1), si defiisce logaritmo i base

Dettagli

SUCCESSIONI E SERIE NUMERICHE

SUCCESSIONI E SERIE NUMERICHE SUCCESSIONI E SERIE NUMERICHE. Successioi umeriche a. Defiizioi: successioi aritmetiche e geometriche Cosideriamo ua sequeza di umeri quale ad esempio:,5,8,,4,7,... Tale sequeza è costituita mediate ua

Dettagli

CONCETTI BASE DI STATISTICA

CONCETTI BASE DI STATISTICA CONCETTI BASE DI STATISTICA DEFINIZIONI Probabilità U umero reale compreso tra 0 e, associato a u eveto casuale. Esso può essere correlato co la frequeza relativa o col grado di credibilità co cui u eveto

Dettagli

LA DERIVATA DI UNA FUNZIONE

LA DERIVATA DI UNA FUNZIONE LA DERIVATA DI UNA FUNZIONE OBIETTIVO: Defiire lo strumeto matematico ce cosete di studiare la cresceza e la decresceza di ua fuzioe Si comicia col defiire cosa vuol dire ce ua fuzioe è crescete. Defiizioe:

Dettagli

Statistica 1 A.A. 2015/2016

Statistica 1 A.A. 2015/2016 Corso di Laurea i Ecoomia e Fiaza Statistica 1 A.A. 2015/2016 (8 CFU, corrispodeti a 48 ore di lezioe frotale e 24 ore di esercitazioe) Prof. Luigi Augugliaro 1 / 19 Iterdipedeza lieare fra variabili quatitative

Dettagli

SERIE NUMERICHE Con l introduzione delle serie vogliamo estendere l operazione algebrica di somma ad un numero infinito di addendi.

SERIE NUMERICHE Con l introduzione delle serie vogliamo estendere l operazione algebrica di somma ad un numero infinito di addendi. Serie SERIE NUMERICHE Co l itroduzioe delle serie vogliamo estedere l operazioe algebrica di somma ad u umero ifiito di addedi. Def. Data la successioe {a }, defiiamo la successioe {s } poedo s = a k.

Dettagli

Sintassi dello studio di funzione

Sintassi dello studio di funzione Sitassi dello studio di fuzioe Lavoriamo a perfezioare quato sapete siora. D ora iazi pretederò che i risultati che otteete li SCRIVIATE i forma corretta dal puto di vista grammaticale. N( x) Data la fuzioe:

Dettagli

ESERCIZI DI STATISTICA DESCRITTIVA ALCUNI TRATTI DA PROVE D ESAME DA REALIZZARE ANCHE CON L AUSILIO DI UN FOGLIO DI CALCOLO. Angela Donatiello 1

ESERCIZI DI STATISTICA DESCRITTIVA ALCUNI TRATTI DA PROVE D ESAME DA REALIZZARE ANCHE CON L AUSILIO DI UN FOGLIO DI CALCOLO. Angela Donatiello 1 ESERCIZI DI STATISTICA DESCRITTIVA ALCUNI TRATTI DA PROVE D ESAME DA REALIZZARE ANCHE CON L AUSILIO DI UN FOGLIO DI CALCOLO Agela Doatiello 1 Esercizio. E stato tabulato il peso di ua certa popolazioe

Dettagli

STATISTICA DESCRITTIVA

STATISTICA DESCRITTIVA STATISTICA DESCRITTIVA La statistica descrittiva serve per elaborare e sitetizzare dati. Tipicamete i dati si rappresetao i tabelle. Esempio. Suppoiamo di codurre u idagie per cooscere gli iscritti al

Dettagli

5 ln n + ln. 4 ln n + ln. 6 ln n + ln

5 ln n + ln. 4 ln n + ln. 6 ln n + ln DOMINIO FUNZIONE Determiare il domiio della fuzioe f = l e e + e + e Deve essere e e + e + e >, posto e = t si ha t e + t + e = per t = e e per t = / Il campo di esisteza è:, l, + Determiare il domiio

Dettagli

Soluzione La media aritmetica dei due numeri positivi a e b è data da M

Soluzione La media aritmetica dei due numeri positivi a e b è data da M Matematica per la uova maturità scietifica A. Berardo M. Pedoe 6 Questioario Quesito Se a e b soo umeri positivi assegati quale è la loro media aritmetica? Quale la media geometrica? Quale delle due è

Dettagli

V Tutorato 6 Novembre 2014

V Tutorato 6 Novembre 2014 1. Data la successioe V Tutorato 6 Novembre 01 determiare il lim b. Data la successioe b = a = + 1 + 1 8 6 + 1 80 + 18 se 0 se < 0 scrivere i termii a 0, a 1, a, a 0 e determiare lim a. Data la successioe

Dettagli

PARTE QUARTA Teoria algebrica dei numeri

PARTE QUARTA Teoria algebrica dei numeri Prerequisiti: Aelli Spazi vettoriali Sia A u aello commutativo uitario PARTE QUARTA Teoria algebrica dei umeri Lezioe 7 Cei sui moduli Defiizioe 7 Si dice modulo (siistro) su A (o semplicemete, A-modulo)

Dettagli

LA VERIFICA DELLE IPOTESI SUI PARAMETRI

LA VERIFICA DELLE IPOTESI SUI PARAMETRI LA VERIFICA DELLE IPOTESI SUI PARAMETRI E u problema di ifereza per molti aspetti collegato a quello della stima. Rispode ad u esigeza di carattere pratico che spesso si preseta i molti campi dell attività

Dettagli

ANALISI MATEMATICA 1 Area dell Ingegneria dell Informazione. Appello del 5.02.2013 TEMA 1. f(x) = arcsin 1 2 log 2 x.

ANALISI MATEMATICA 1 Area dell Ingegneria dell Informazione. Appello del 5.02.2013 TEMA 1. f(x) = arcsin 1 2 log 2 x. ANALISI MATEMATICA Area dell Igegeria dell Iformazioe Appello del 5.0.0 TEMA Esercizio Si cosideri la fuzioe f(x = arcsi log x. Determiare il domiio di f e discutere il sego. Discutere brevemete la cotiuità

Dettagli

Terzo appello del. primo modulo. di ANALISI 18.07.2006

Terzo appello del. primo modulo. di ANALISI 18.07.2006 Terzo appello del primo modulo di ANALISI 18.7.26 1. Si voglioo ifilare su u filo delle perle distiguibili tra loro solo i base alla dimesioe: si hao a disposizioe perle gradi di diametro di 2 cetimetri

Dettagli

Limiti di successioni

Limiti di successioni Argometo 3s Limiti di successioi Ua successioe {a : N} è ua fuzioe defiita sull isieme N deiumeriaturaliavalori reali: essa verrà el seguito idicata più brevemeteco{a } a èdettotermie geerale della successioe

Dettagli

EQUAZIONI ALLE RICORRENZE

EQUAZIONI ALLE RICORRENZE Esercizi di Fodameti di Iformatica 1 EQUAZIONI ALLE RICORRENZE 1.1. Metodo di ufoldig 1.1.1. Richiami di teoria Il metodo detto di ufoldig utilizza lo sviluppo dell equazioe alle ricorreze fio ad u certo

Dettagli

Esercizi riguardanti limiti di successioni

Esercizi riguardanti limiti di successioni Esercizi riguardati iti di successioi Davide Boscaii Queste soo le ote da cui ho tratto le esercitazioi del gioro 27 Ottobre 20. Come tali soo be lugi dall essere eseti da errori, ivito quidi chi e trovasse

Dettagli

Numerazione binaria Pagina 2 di 9 easy matematica di Adolfo Scimone

Numerazione binaria Pagina 2 di 9 easy matematica di Adolfo Scimone Numerazioe biaria Pagia di 9 easy matematica di Adolfo Scimoe SISTEMI DI NUMERAZIONE Sistemi di umerazioe a base fissa Facciamo ormalmete riferimeto a sistemi di umerazioe a base fissa, ad esempio el sistema

Dettagli

Strumenti di indagine per la valutazione psicologica

Strumenti di indagine per la valutazione psicologica Strumeti di idagie per la valutazioe psicologica 1.2 - Richiami di statistica descrittiva Davide Massidda davide.massidda@gmail.com Descrivere i dati Dovedo scegliere u esame opzioale, uo studete ha itezioe

Dettagli

Sistemi e Tecnologie della Comunicazione

Sistemi e Tecnologie della Comunicazione Sistemi e ecologie della Comuicazioe Lezioe 4: strato fisico: caratterizzazioe del segale i frequeza Lo strato fisico Le pricipali fuzioi dello strato fisico soo defiizioe delle iterfacce meccaiche (specifiche

Dettagli

Foglio di esercizi N. 1 - Soluzioni

Foglio di esercizi N. 1 - Soluzioni Foglio di esercizi N. - Soluzioi. Determiare il domiio della fuzioe f) = log 3 + log 3 3)). Deve essere + log 3 3) > 0, ovvero log 3 3) >, ovvero prededo l espoeziale i base 3 di etrambi i membri) 3 >

Dettagli

Teorema 13. Se una sere converge assolutamente, allora converge:

Teorema 13. Se una sere converge assolutamente, allora converge: Apputi sul corso di Aalisi Matematica complemeti (a) - prof. B.Bacchelli Apputi 03: Riferimeti: R.Adams, Calcolo Differeziale.- Si cosiglia vivamete di fare gli esercizi del testo. Covergeza assoluta e

Dettagli

Serie numeriche: esercizi svolti

Serie numeriche: esercizi svolti Serie umeriche: esercizi svolti Gli esercizi cotrassegati co il simbolo * presetao u grado di difficoltà maggiore. Esercizio. Dopo aver verificato la covergeza, calcolare la somma delle segueti serie:

Dettagli

1 Limiti di successioni

1 Limiti di successioni Esercitazioi di matematica Corso di Istituzioi di Matematica B Facoltà di Architettura Ao Accademico 005/006 Aa Scaramuzza 4 Novembre 005 Limiti di successioi Esercizio.. Servedosi della defiizioe di ite

Dettagli

SUCCESSIONI e LIMITI DI SUCCESSIONI. c Paola Gervasio - Analisi Matematica 1 - A.A. 15/16 Successioni cap3b.pdf 1

SUCCESSIONI e LIMITI DI SUCCESSIONI. c Paola Gervasio - Analisi Matematica 1 - A.A. 15/16 Successioni cap3b.pdf 1 SUCCESSIONI e LIMITI DI SUCCESSIONI c Paola Gervasio - Aalisi Matematica 1 - A.A. 15/16 Successioi cap3b.pdf 1 Successioi Def. Ua successioe è ua fuzioe reale (Y = R) a variabile aturale, ovvero X = N:

Dettagli

Corso di Laurea Magistrale in Ingegneria Informatica A.A. 2014/15. Complementi di Probabilità e Statistica. Prova scritta del del 23-02-15

Corso di Laurea Magistrale in Ingegneria Informatica A.A. 2014/15. Complementi di Probabilità e Statistica. Prova scritta del del 23-02-15 Corso di Laurea Magistrale i Igegeria Iformatica A.A. 014/15 Complemeti di Probabilità e Statistica Prova scritta del del 3-0-15 Puteggi: 1. 3+3+4;. +3 ; 3. 1.5 5 ; 4. 1 + 1 + 1 + 1 + 3.5. Totale = 30.

Dettagli

LE MISURE DI VARIABILITÀ DI CARATTERI QUANTITATIVI

LE MISURE DI VARIABILITÀ DI CARATTERI QUANTITATIVI Apputi di Statistica Sociale Uiversità ore di Ea LE MISURE DI VARIABILITÀ DI CARATTERI QUATITATIVI La variabilità di u isieme di osservazioi attiee all attitudie delle variabili studiate ad assumere modalità

Dettagli

Corso di laurea in Matematica Corso di Analisi Matematica 1-2 Dott.ssa Sandra Lucente 1 Funzioni potenza ed esponenziale.

Corso di laurea in Matematica Corso di Analisi Matematica 1-2 Dott.ssa Sandra Lucente 1 Funzioni potenza ed esponenziale. Corso di laurea i Matematica Corso di Aalisi Matematica -2 Dott.ssa Sadra Lucete Fuzioi poteza ed espoeziale. Teorema. Teorema di esisteza della radice -esima. Sia N. Per ogi a R + esiste uo ed u solo

Dettagli

IL CALCOLO COMBINATORIO

IL CALCOLO COMBINATORIO IL CALCOLO COMBINATORIO Calcolo combiatorio è il termie che deota tradizioalmete la braca della matematica che studia i modi per raggruppare e/o ordiare secodo date regole gli elemeti di u isieme fiito

Dettagli

Statistica (Prof. Capitanio) Alcuni esercizi tratti da prove scritte d esame

Statistica (Prof. Capitanio) Alcuni esercizi tratti da prove scritte d esame Statistica (Prof. Capitaio) Alcui esercizi tratti da prove scritte d esame Esercizio 1 Il tempo (i miuti) che Paolo impiega, i auto, per arrivare i ufficio, può essere modellato co ua variabile casuale

Dettagli

Corsi di Laurea in Ingegneria Edile e Architettura Prova scritta di Analisi Matematica 1 del 6/02/2010. sin( x) log((1 + x 2 ) 1/2 ) = 1 3.

Corsi di Laurea in Ingegneria Edile e Architettura Prova scritta di Analisi Matematica 1 del 6/02/2010. sin( x) log((1 + x 2 ) 1/2 ) = 1 3. Corsi di Laurea i Igegeria Edile e Architettura Prova scritta di Aalisi Matematica del 6// ) Mostrare che + si( ) cos () si( ) log(( + ) / ) = 3. Possibile soluzioe: Cosiderado dapprima il deomiatore otiamo

Dettagli

Risposte. f v = φ dove φ(x,y) = e x2. f(x) = e x2 /2. +const. Soluzione. (i) Scriviamo v = (u,w). Se f(x) è la funzione richiesta, si deve avere

Risposte. f v = φ dove φ(x,y) = e x2. f(x) = e x2 /2. +const. Soluzione. (i) Scriviamo v = (u,w). Se f(x) è la funzione richiesta, si deve avere Eserciio 1 7 puti. Dato il campo vettoriale v, + 1,, i si determii ua fuioe f > i modo tale che il campo vettoriale f v sia irrotaioale, cioè abbia le derivate icrociate uguali; ii si spieghi se i risultati

Dettagli

Campi vettoriali conservativi e solenoidali

Campi vettoriali conservativi e solenoidali Campi vettoriali coservativi e soleoidali Sia (x,y,z) u campo vettoriale defiito i ua regioe di spazio Ω, e sia u cammio, di estremi A e B, defiito i Ω. Sia r (u) ua parametrizzazioe di, fuzioe della variabile

Dettagli

DEFINIZIONE PROCESSO LOGICO E OPERATIVO MEDIANTE IL QUALE, SULLA BASE

DEFINIZIONE PROCESSO LOGICO E OPERATIVO MEDIANTE IL QUALE, SULLA BASE DEFINIZIONE PROCESSO LOGICO E OPERATIVO MEDIANTE IL QUALE, SULLA BASE DI UN GRUPPO DI OSSERVAZIONI O DI ESPERIMENTI, SI PERVIENE A CERTE CONCLUSIONI, LA CUI VALIDITA PER UN COLLETTIVO Più AMPIO E ESPRESSA

Dettagli

8. Quale pesa di più?

8. Quale pesa di più? 8. Quale pesa di più? Negli ultimi ai hao suscitato particolare iteresse alcui problemi sulla pesatura di moete o di pallie. Il primo problema di questo tipo sembra proposto da Tartaglia el 1556. Da allora

Dettagli

SUCCESSIONI NUMERICHE

SUCCESSIONI NUMERICHE SUCCESSIONI NUMERICHE LORENZO BRASCO. Teoremi di Cesaro Teorema di Stolz-Cesaro. Siao {a } N e {b } N due successioi umeriche, co {b } N strettamete positiva, strettamete crescete e ilitata. Se esiste

Dettagli

Elementi di matematica finanziaria

Elementi di matematica finanziaria Elemeti di matematica fiaziaria 18.X.2005 La matematica fiaziaria e l estimo Nell ambito di umerosi procedimeti di stima si rede ecessario operare co valori che presetao scadeze temporali differeziate

Dettagli

19 31 43 55 67 79 91 103 870,5 882,5 894,5 906,5 918,5 930,5 942,5 954,5

19 31 43 55 67 79 91 103 870,5 882,5 894,5 906,5 918,5 930,5 942,5 954,5 Il 16 dicembre 015 ero a Napoli. Ad u agolo di Piazza Date mi soo imbattuto el "matematico di strada", come egli si defiisce, Giuseppe Poloe immerso el suo armametario di tabelle di umeri. Il geiale persoaggio

Dettagli

Calcolo della risposta di un sistema lineare viscoso a più gradi di libertà con il metodo dell Analisi Modale

Calcolo della risposta di un sistema lineare viscoso a più gradi di libertà con il metodo dell Analisi Modale Calcolo della risposta di u sistema lieare viscoso a più gradi di libertà co il metodo dell Aalisi Modale Lezioe 2/2 Prof. Adolfo Satii - Diamica delle Strutture 1 La risposta a carichi variabili co la

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioi di Statistica Il modello di Regressioe Prof. Livia De Giovai statistica@dis.uiroma.it Esercizio Solitamete è accertato che aumetado il umero di uità prodotte, u idustria possa ridurre i costi

Dettagli

Matematica II: Calcolo delle Probabilità e Statistica Matematica

Matematica II: Calcolo delle Probabilità e Statistica Matematica Matematica II: Calcolo delle Probabilità e Statistica Matematica ELT A-Z Docete: dott. F. Zucca Esercitazioe # 4 1 Distribuzioe Espoeziale Esercizio 1 Suppoiamo che la durata della vita di ogi membro di

Dettagli

Successioni ricorsive di numeri

Successioni ricorsive di numeri Successioi ricorsive di umeri Getile Alessadro Laboratorio di matematica discreta A.A. 6/7 I queste pagie si voglioo predere i esame alcue tra le più famose successioi ricorsive, presetadoe alcue caratteristiche..

Dettagli

I numeri complessi. Pagine tratte da Elementi della teoria delle funzioni olomorfe di una variabile complessa

I numeri complessi. Pagine tratte da Elementi della teoria delle funzioni olomorfe di una variabile complessa I umeri complessi Pagie tratte da Elemeti della teoria delle fuzioi olomorfe di ua variabile complessa di G. Vergara Caffarelli, P. Loreti, L. Giacomelli Dipartimeto di Metodi e Modelli Matematici per

Dettagli

Le carte di controllo

Le carte di controllo Le carte di cotrollo Dott.ssa Bruella Caroleo 07 dicembre 007 Variabilità ei processi produttivi Le caratteristiche di qualsiasi processo produttivo soo caratterizzate da variabilità Le cause di variabilità

Dettagli

Appunti sulla MATEMATICA FINANZIARIA

Appunti sulla MATEMATICA FINANZIARIA INTRODUZIONE Apputi sulla ATEATIA FINANZIARIA La matematica fiaziaria si occupa delle operazioi fiaziarie. Per operazioe fiaziaria si itede quella operazioe ella quale avviee uo scambio di capitali, itesi

Dettagli

Rendita perpetua con rate crescenti in progressione aritmetica

Rendita perpetua con rate crescenti in progressione aritmetica edita perpetua co rate cresceti i progressioe aritmetica iprediamo l'esempio visto ella scorsa lezioe di redita perpetua co rate cresceti i progressioe arimetica: Questa redita può ache essere vista come

Dettagli

Percorsi di matematica per il ripasso e il recupero

Percorsi di matematica per il ripasso e il recupero Giacomo Pagia Giovaa Patri Percorsi di matematica per il ripasso e il recupero 2 per la Scuola secodaria di secodo grado UNITÀ CAMPIONE Edizioi del Quadrifoglio à t i U 2 Radicali I questa Uità affrotiamo

Dettagli

I appello - 29 Giugno 2007

I appello - 29 Giugno 2007 Facoltà di Igegeria - Corso di Laurea i Ig. Iformatica e delle Telecom. A.A.6/7 I appello - 9 Giugo 7 ) Studiare la covergeza putuale e uiforme della seguete successioe di fuzioi: [ ( )] f (x) = cos (

Dettagli

Approfondimenti di statistica e geostatistica

Approfondimenti di statistica e geostatistica Approfodimeti di statistica e geostatistica APAT Agezia per la Protezioe dell Ambiete e per i Servizi Tecici Cos è la geostatistica? Applicazioe dell aalisi di Rischio ai siti Cotamiati Geostatistica La

Dettagli

5. Le serie numeriche

5. Le serie numeriche 5. Le serie umeriche Ricordiamo che ua successioe reale è ua fuzioe defiita da N, evetualmete privato di u umero fiito di elemeti, a R. Solitamete si idica ua successioe co la lista dei suoi valori: (a

Dettagli

APPUNTI DI MATEMATICA ALGEBRA \ ARITMETICA \ NUMERI NATURALI (1)

APPUNTI DI MATEMATICA ALGEBRA \ ARITMETICA \ NUMERI NATURALI (1) ALGEBRA \ ARITMETICA \ NUMERI NATURALI (1) I umeri aturali hao u ordie; ogi umero aturale ha u successivo (otteuto aggiugedo 1), e ogi umero aturale diverso da zero ha u precedete (otteuto sottraedo 1).

Dettagli

Il confronto tra DUE campioni indipendenti

Il confronto tra DUE campioni indipendenti Il cofroto tra DUE camioi idiedeti Il cofroto tra DUE camioi idiedeti Cofroto tra due medie I questi casi siamo iteressati a cofrotare il valore medio di due camioi i cui i le osservazioi i u camioe soo

Dettagli

DISTRIBUZIONI DOPPIE

DISTRIBUZIONI DOPPIE DISTRIBUZIONI DOPPIE Fio ad ora abbiamo visto teciche di aalisi dei dati per il solo caso i cui ci si occupi di u solo carattere rilevato su u collettivo (distribuzioi semplici). I termii formali fio ad

Dettagli

Una funzione è una relazione che ad ogni elemento del dominio associa uno e un solo elemento del codominio

Una funzione è una relazione che ad ogni elemento del dominio associa uno e un solo elemento del codominio Radicali Per itrodurre il cocetto di radicali che già avete icotrato alle medie quado avete imparato a calcolare la radice quadrata e cubica dei umeri iteri, abbiamo bisogo di rivedere il cocetto di uzioe

Dettagli

Metodi statistici per l'analisi dei dati

Metodi statistici per l'analisi dei dati Metodi statistici per l aalisi dei dati due Motivazioi Obbiettivo: Cofrotare due diverse codizioi (ache defiiti ) per cui soo stati codotti gli esperimeti. Metodi tatistici per l Aalisi dei Dati due Esempio

Dettagli

Le onde elettromagnetiche. Origine e natura, spettro delle onde e.m., la polarizzazione

Le onde elettromagnetiche. Origine e natura, spettro delle onde e.m., la polarizzazione Le ode elettromagetiche Origie e atura, spettro delle ode e.m., la polarizzazioe Origie e atura delle ode elettromagetiche: Ua carica elettrica che oscilla geera u campo elettrico E che oscilla e a questo

Dettagli

Analisi statistica dell Output

Analisi statistica dell Output Aalisi statistica dell Output IL Simulatore è u adeguata rappresetazioe della Realtà! E adesso? Come va iterpretato l Output? Quado le Osservazioi soo sigificative? Quati Ru del Simulatore è corretto effettuare?

Dettagli

Università degli Studi di Bergamo - Corsi di laurea in Ingegneria Edile e Tessile Indici di posizione e variabilità Esercitazione 2

Università degli Studi di Bergamo - Corsi di laurea in Ingegneria Edile e Tessile Indici di posizione e variabilità Esercitazione 2 Uiversità degli Studi di Bergamo - Corsi di laurea i Igegeria Edile e Tessile Idici di posizioe e variabilità Esercitazioe 2 1. Nella seguete tabella si riporta la distribuzioe di frequeza del cosumo i

Dettagli

Il test parametrico si costruisce in tre passi:

Il test parametrico si costruisce in tre passi: R. Lombardo I. Cammiatiello Dipartimeto di Ecoomia Secoda Uiversità degli studi Napoli Facoltà di Ecoomia Ifereza Statistica La Verifica delle Ipotesi Obiettivo Verifica (test) di u ipotesi statistica

Dettagli

Metodi statistici per l analisi dei dati

Metodi statistici per l analisi dei dati Metodi statistici per l aalisi dei dati due ttameti Motivazioi ttameti Obbiettivo: Cofrotare due diverse codizioi (ache defiiti ttameti) per cui soo stati codotti gli esperimeti. due ttameti Esempio itroduttivo

Dettagli

SERIE NUMERICHE Esercizi risolti. 2 b) n=1. n n 2 +n

SERIE NUMERICHE Esercizi risolti. 2 b) n=1. n n 2 +n SERIE NUMERICHE Esercizi risolti. Applicado la defiizioe di covergeza di ua serie stabilire il carattere delle segueti serie, e, i caso di covergeza, trovare la somma: = + b) = + +. Verificare utilizzado

Dettagli

Statistica di base. Luca Mari, versione 31.12.13

Statistica di base. Luca Mari, versione 31.12.13 Statistica di base Luca Mari, versioe 31.12.13 Coteuti Moda...1 Distribuzioi cumulate...2 Mediaa, quartili, percetili...3 Sigificatività empirica degli idici ordiali...3 Media...4 Acora sulla media...4

Dettagli

che sono una l inversa dell altra; l insieme dei messaggi cifrati C i cui elementi sono indicati con la lettera c.

che sono una l inversa dell altra; l insieme dei messaggi cifrati C i cui elementi sono indicati con la lettera c. I LEZIONE Il ostro iteto è aalizzare i dettaglio i metodi di cifratura che si soo susseguiti el corso della storia prestado particolare attezioe all impiato matematico che e cosete la realizzazioe Iiziamo

Dettagli

LA GESTIONE DELLA QUALITA : IL TOTAL QUALITY MANAGEMENT

LA GESTIONE DELLA QUALITA : IL TOTAL QUALITY MANAGEMENT LA GESTIONE DELLA QUALITA : IL TOTAL QUALITY MANAGEMENT La gestioe, il cotrollo ed il migliorameto della qualità di u prodotto/servizio soo temi di grade iteresse per l azieda. Il problema della qualità

Dettagli

1 Successioni 1 1.1 Limite di una successione... 2. 2 Serie 3 2.1 La serie armonica... 6 2.2 La serie geometrica... 6

1 Successioni 1 1.1 Limite di una successione... 2. 2 Serie 3 2.1 La serie armonica... 6 2.2 La serie geometrica... 6 SUCCESSIONI Successioi e serie Idice Successioi. Limite di ua successioe........................................... Serie 3. La serie armoica................................................ 6. La serie

Dettagli

ESAME DI STATO DI LICEO SCIENTIFICO CORSO DI ORDINAMENTO 2006

ESAME DI STATO DI LICEO SCIENTIFICO CORSO DI ORDINAMENTO 2006 ESAME DI STAT DI LICE SCIENTIFIC CRS DI RDINAMENT 006 Il cadidato risolva uo dei due problemi e 5 dei 0 quesiti i cui si articola il questioario. PRBLEMA U filo metallico di lughezza l viee utilizzato

Dettagli

Successioni. Capitolo 2. 2.1 Definizione

Successioni. Capitolo 2. 2.1 Definizione Capitolo 2 Successioi 2.1 Defiizioe Ua prima descrizioe, più ituitiva che rigorosa, di quel che itediamo per successioe cosiste i: Ua successioe è ua lista ordiata di oggetti, avete u primo ma o u ultimo

Dettagli

Capitolo uno STATISTICA DESCRITTIVA BIVARIATA

Capitolo uno STATISTICA DESCRITTIVA BIVARIATA Capitolo uo STATISTICA DESCRITTIVA BIVARIATA La statistica bidimesioale o bivariata si occupa dello studio del grado di dipedeza di due caratteri distiti della stessa uità statistica. E possibile, ad esempio,

Dettagli

II-9 Successioni e serie

II-9 Successioni e serie SUCCESSIONI II-9 Successioi e serie Idice Successioi. Limite di ua successioe........................................... Serie 3. La serie armoica................................................ 6. La

Dettagli

STATISTICA 1 parte 2/2 STATISTICA INFERENZIALE

STATISTICA 1 parte 2/2 STATISTICA INFERENZIALE STATISTICA parte / U test statistico è ua regola di decisioe Effettuare u test statistico sigifica verificare IPOTESI sui parametri. STATISTICA INFERENZIALE STIMA PUNTUALE STIMA PER INTERVALLI TEST PARAMETRICI

Dettagli

Disposizioni semplici. Disposizioni semplici esercizi

Disposizioni semplici. Disposizioni semplici esercizi Disposizioi semplici Ua disposizioe (semplice) di oggetti i k posti (duque 1 < k < ) è ogi raggruppameto di k oggetti, seza ripetizioi, scelti fra gli oggetti dati, cioè ciascuo dei raggruppameti ordiati

Dettagli

ESERCIZI SULLE SERIE

ESERCIZI SULLE SERIE ESERCIZI SULLE SERIE Studiare la atura delle segueti serie. ) cos 4 + ; ) + si ; ) + ()! 4) ( ) 5) ( ) + + 6) ( ) + + + 7) ( log ) 8) ( ) + 9) log! 0)! Studiare al variare di x i R la atura delle segueti

Dettagli

Interesse e formule relative.

Interesse e formule relative. Elisa Battistoi, Adrea Frozetti Collado Iteresse e formule relative Esercizio Determiare quale somma sarà dispoibile fra 7 ai ivestedo oggi 0000 ad u tasso auale semplice del 5% Soluzioe Il diagramma del

Dettagli

IMPLICAZIONE TRA VARIABILI BINARIE: L Implicazione di Gras

IMPLICAZIONE TRA VARIABILI BINARIE: L Implicazione di Gras IMPLICAZIONE TRA VARIABILI BINARIE: L Implicazioe di Gras Date due variabili biarie a e b, i quale misura posso assicurare che i ua popolazioe da ogi osservazioe di a segue ecessariamete quella di b? E

Dettagli

La matematica finanziaria

La matematica finanziaria La matematica fiaziaria La matematica fiaziaria forisce gli strumeti ecessari per cofrotare fatti fiaziari che avvegoo i mometi diversi Esempio: Come posso cofrotare i ricavi e i costi legati all acquisto

Dettagli

Tecnica delle misurazioni applicate Esame del 4 dicembre 2007

Tecnica delle misurazioni applicate Esame del 4 dicembre 2007 Tecica delle misurazioi applicate Esame del 4 dicembre 7 Problema 1. Il propulsore Mod. WEC viee prodotto da ACME Ic. mediate u processo automatizzato: dati storici cofermao che la lavorazioe di ogi elemeto

Dettagli

Campionamento stratificato. Esempio

Campionamento stratificato. Esempio ez. 3 8/0/05 Metodi Statiici per il Marketig - F. Bartolucci Uiversità di Urbio Campioameto ratificato Ua tecica molto diffusa per sfruttare l iformazioe coteuta i ua variabile ausiliaria (o evetualmete

Dettagli

Selezione avversa e razionamento del credito

Selezione avversa e razionamento del credito Selezioe avversa e razioameto del credito Massimo A. De Fracesco Dipartimeto di Ecoomia politica e statistica, Uiversità di Siea May 3, 013 1 Itroduzioe I questa lezioe presetiamo u semplice modello del

Dettagli

STATISTICA INFERENZIALE SCHEDA N. 2 INTERVALLI DI CONFIDENZA PER IL VALORE ATTESO E LA FREQUENZA

STATISTICA INFERENZIALE SCHEDA N. 2 INTERVALLI DI CONFIDENZA PER IL VALORE ATTESO E LA FREQUENZA Matematica e statistica: dai dati ai modelli alle scelte www.dima.uige/pls_statistica Resposabili scietifici M.P. Rogati e E. Sasso (Dipartimeto di Matematica Uiversità di Geova) STATISTICA INFERENZIALE

Dettagli

Formula per la determinazione della Successione generalizzata di Fibonacci.

Formula per la determinazione della Successione generalizzata di Fibonacci. Formula per la determiazioe della uccessioe geeralizzata di Fiboacci. A cura di Eugeio Amitrao Coteuto dell articolo:. Itroduzioe......... uccessioe di Fiboacci....... 3. Formula di Biet per la successioe

Dettagli

CAPITOLO SETTIMO GLI INDICI DI FORMA 1. INTRODUZIONE

CAPITOLO SETTIMO GLI INDICI DI FORMA 1. INTRODUZIONE CAPITOLO SETTIMO GLI INDICI DI FORMA SOMMARIO: 1. Itroduzioe. - 2. Asimmetria. - 3. Grafico a scatola (box plot). - 4. Curtosi. - Questioario. 1. INTRODUZIONE Dopo aver aalizzato gli idici di posizioe

Dettagli

Distribuzione di un carattere

Distribuzione di un carattere Distribuzioe di u carattere Dopo le fasi di acquisizioe e di registrazioe dei dati, si passa al loro cotrollo e quidi alle loro elaborazioe. Si defiisce distribuzioe uitaria semplice di u carattere l elecazioe

Dettagli

Progressioni aritmetiche

Progressioni aritmetiche Progressioi aritmetiche Comiciamo co due esempi: Esempio Cosideriamo la successioe di umeri:, 7,, 5, 9, +4 +4 +4 +4 +4 La successioe è tale che si passa da u termie al successivo aggiugedo sempre +4. Si

Dettagli

DIPENDENZA O CONNESSIONE. Ovvero quando la conoscenza della modalità di X presente su un unità è informativa della presenza della modalità di Y.

DIPENDENZA O CONNESSIONE. Ovvero quando la conoscenza della modalità di X presente su un unità è informativa della presenza della modalità di Y. DIPENDENZA O CONNESSIONE Due caratteri X e Y cogiutamete cosiderati si dicoo tra loro coessi quado le modalità di u carattere ifluezao il maifestarsi delle modalità dell altro. Ovvero quado la coosceza

Dettagli

ESEMPIO 1. Immaginiamo come si distribuirebbero le stime campionarie se l operazione di campionamento venisse ripetuta più volte.

ESEMPIO 1. Immaginiamo come si distribuirebbero le stime campionarie se l operazione di campionamento venisse ripetuta più volte. ESEMPIO Prima dell esplosioe di ua cetrale ucleare, i terrei di ua certa regioe avevao ua produzioe media di grao pari a 00 quitali co uo scarto di 5. Dopo la catastrofe si selezioao 00 uità di superficie

Dettagli

3.1 Il principio di inclusione-esclusione

3.1 Il principio di inclusione-esclusione Capitolo 3 Calcolo combiatorio 3.1 Il pricipio di iclusioe-esclusioe Il calcolo combiatorio prede i cosiderazioe degli isiemi fiiti particolari e e cota il umero di elemeti. Questo può dar luogo ad iteressati

Dettagli

Prova scritta di Statistica per Biotecnologie. 29 Aprile Programma Cristallo 1

Prova scritta di Statistica per Biotecnologie. 29 Aprile Programma Cristallo 1 Prova scritta di Statistica per Biotecologie 9 Aprile Programma Cristallo. Uo dei processi di purificazioe impiegati i ua certa sostaza chimica prevede di metterla i soluzioe e di filtrarla co ua resia

Dettagli

Lezione n 19-20. Lezioni di Ricerca Operativa. Corso di Laurea in Informatica Università di Salerno. Prof. Cerulli Dott. Carrabs

Lezione n 19-20. Lezioni di Ricerca Operativa. Corso di Laurea in Informatica Università di Salerno. Prof. Cerulli Dott. Carrabs Lezioi di Riera Operativa Corso di Laurea i Iformatia Uiversità di Salero Lezioe 9- - Problema del trasporto Prof. Cerulli Dott. Carrabs Problema del Flusso a osto Miimo FORMULAZIONE mi ( i, ) A o violi

Dettagli

Corso di Laurea in Ing. Edile Politecnico di Bari A.A. 2008-2009 Prof. ssa Letizia Brunetti DISPENSE DEL CORSO DI GEOMETRIA

Corso di Laurea in Ing. Edile Politecnico di Bari A.A. 2008-2009 Prof. ssa Letizia Brunetti DISPENSE DEL CORSO DI GEOMETRIA Corso di Laurea i Ig Edile Politecico di Bari AA 2008-2009 Prof ssa Letizia Bruetti DISPENSE DEL CORSO DI GEOMETRIA 2 Idice Spazi vettoriali Cei sulle strutture algebriche 4 2 Defiizioe di spazio vettoriale

Dettagli

Calcolo Combinatorio (vers. 1/10/2014)

Calcolo Combinatorio (vers. 1/10/2014) Calcolo Combiatorio (vers. 1/10/2014 Daiela De Caditiis modulo CdP di teoria dei segali Igegeria dell Iformazioe - sede di Latia, CALCOLO COMBINATORIO Pricipio Fodametale del Calcolo Combiatorio: Si realizzio

Dettagli

Tutti i diritti di sfruttamento economico dell opera appartengono alla Esselibri S.p.A. (art. 64, D.Lgs. 10-2-2005, n. 30)

Tutti i diritti di sfruttamento economico dell opera appartengono alla Esselibri S.p.A. (art. 64, D.Lgs. 10-2-2005, n. 30) Copyright 2005 Esselibri S.p.A. Via F. Russo, 33/D 8023 Napoli Azieda co sistema qualità certificato ISO 400: 2003 Tutti i diritti riservati. È vietata la riproduzioe ache parziale e co qualsiasi mezzo

Dettagli

Principi base di Ingegneria della Sicurezza

Principi base di Ingegneria della Sicurezza Pricipi base di Igegeria della Sicurezza L aalisi delle codizioi di Affidabilità del sistema si articola i: (i) idetificazioe degli sceari icidetali di riferimeto (Eveti critici Iiziatori - EI) per il

Dettagli

Random walk classico. Simulazione di un random walk

Random walk classico. Simulazione di un random walk Radom walk classico Il radom walk classico) è il processo stocastico defiito da co prob. S = S0 X k, co X k = k= co prob. e le X soo tra di loro idipedeti. k Si tratta di u processo a icremeti idipedeti

Dettagli

Serie numeriche e serie di potenze

Serie numeriche e serie di potenze Serie umeriche e serie di poteze Sommare u umero fiito di umeri reali è seza dubbio u operazioe che o può riservare molte sorprese Cosa succede però se e sommiamo u umero ifiito? Prima di dare delle defiizioi

Dettagli

Random walk classico. Simulazione di un random walk

Random walk classico. Simulazione di un random walk Radom walk classico Il radom walk classico) è il processo stocastico defiito da co prob. S S0 X k, co X k k co prob. e le X soo tra di loro idipedeti. k Si tratta di u processo a icremeti idipedeti e ideticamete

Dettagli