Appunti di Probabilità e Statistica. a.a. 2014/2015 C.d.L. Informatica Bioinformatica I. Oliva. 1 Indici statistici. Lezione 2

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Appunti di Probabilità e Statistica. a.a. 2014/2015 C.d.L. Informatica Bioinformatica I. Oliva. 1 Indici statistici. Lezione 2"

Transcript

1 Apputi di Probabilità e Statistica a.a. 2014/2015 C.d.L. Iformatica Bioiformatica I. Oliva Lezioe 2 1 Idici statistici Idici statistici Idici di posizioe Idici di variabilità Idici di forma medie aalitiche medie lasche scostameti medi idici di variabilità relativi eterogeeità asimmetria curtosi cocetrazioe 1.1 Idici di variabilità La variabilità si deisce come l'attitudie di u feomeo ad assumere modalità diereti. Può essere misurata i diversi modi: variabilità delle sigole modalità x 1, x 2,..., x rispetto ad u idice di posizioe 1

2 mutua variabilità variabilità delle modalità x 1, x 2,..., x, ordiate i modo crescete (usado la f. di ripartizioe) variabilità delle frequeze relative Proprietà geerali degli idici di variabilità (IV): 1. o esiste variabilità se IV = 0 2. u idice di variabilità deve assumere valori maggiori o uguali a 0 3. gli idici di variabilità assumoo valori cresceti, all'aumetare della variabilità 4. ivariaza per traslazioi (IV (x) = IV (x + a)) Variaza: misura la variabilità di u carattere X rispetto alla media aritmetica. Si idica co σ 2 o co V ar(x) e si calcola el modo seguete: σ 2 := 1 N σ 2 := 1 N σ 2 := (x i µ) 2 per dati disaggregati (x i µ) 2 i per dati i distribuzioe di frequeze assolute (x i µ) 2 f i per dati i distribuzioe di frequeze relative σ 2 := 1 N ( x i µ) 2 i per dati raggruppati i classi dove i idica la frequeza assoluta, f i idica la frequeza relativa, x i idica il valore cetrale della classe (c i 1, c i ). Formula alterativa per il calcolo della variaza (formula operativa): σ 2 = µ x 2 µ 2 x, dove µ x rappreseta la media (aritmetica) rispetto alla modalità x (mometo primo) e µ x 2 rappreseta la media (aritmetica) rispetto al 2

3 quadrato della modalità x (mometo secodo). Più precisamete, si ha: σ 2 = 1 x 2 i µ 2 per dati disaggregati (1) N σ 2 := 1 N σ 2 := x 2 i i µ 2 per dati i distr. fr. ass. (2) x 2 i f i µ 2 per dati i distr. fr. rel. (3) σ 2 := 1 N x 2 i µ 2 per dati raggruppati i classi (4) Dimostriamo l'equazioe (1). Proof. σ 2 = 1 N (x i µ x ) 2 = 1 N (x 2 i 2x i µ x + µ 2 x) = 1 N = 1 N x 2 i 1 N x 2 i 2µ x 1 N 2x i µ x + 1 N x i + µ 2 x = µ x 2 2µ x µ x + µ 2 x = µ x 2 + µ 2 x. µ 2 x Esercizio 1.1. Vericare le relazioi (2), (3) e (4). La radice quadrata della variaza si idica co σ e si chiama scarto quadratico medio o deviazioe stadard, la cui utilità dipede dal fatto che la variaza si esprime ell'uità di misura al quadrato della variabile cui si riferisce. Esempio 1.1. Distribuzioe delle superci di appartemeti (i mq): {110, 97, 120, 125} Calcoliamo la media (aritmetica): µ = = 113.

4 Calcoliamo la variaza: σ 2 = ( )2 + (97 113) 2 + ( ) 2 + ( ) 2 4 = Quidi, σ = σ 2 = = 10.7 Da questi calcoli, si ricava che la supercie media degli appartameti è pari a m 2 e, mediamete, le superci dieriscoo dalla media di 10.7 m 2. Esempio 1.2. Distribuzioe dei laureati ello scorso a.a. per umero di esami sosteuti alla e del primo ao di corso: (si cooscoo solo il umero degli esami e la corrispodete frequeza assoluta) Duque: Num. esami i x i i x 2 i x 2 i i Tot µ = = σ = (2.55) 2 = σ = 1.24 = 1.11 Questi dati ci dicoo che il collettivo statistico ha sosteuto i media 2.55 esami alla e del primo ao di corso e che il umero di esami sosteuti al primo ao si discosta dal umero medio di 1.11, ossia, 1.11 rappreseta la dispersioe dei valori itoro alla media. Vediamo le proprietà pricipali soddisfatte dalla variaza. Proposizioe 1.1. La variaza di X risulta essere sempre u umero o egativo ed è pari a 0 se e solo se X ua costate. Proposizioe 1.2. Se alla variabile X si aggiuge ua costate, la variaza o cambia. Se si moltiplica la variabile X per ua costate, 4

5 la variaza coicide co il prodotto della variaza di X per il quadrato della costate. I simboli, Y := ax + b V ar(y ) = a 2 V ar(x). Esercizio 1.2. Dimostrare la Prop. 1.1 e 1.2. Proposizioe 1.3. La situazioe di massima variabilità per u collettivo co media µ si ha quado, x k = Nµ e x i = 0, per ogi i = 1,..., N, k i. I simboli, σ max = µ N 1. Proof. Suppoiamo x k = Nµ 0 e x j = 0, per ogi j k, co k = 1,..., N. Allora, si ha: σmax 2 = 1 ( (N 1)(0 µ) 2 + (Nµ µ) 2) N = 1 ( (N 1)µ 2 + (N 2 µ 2 2Nµ + µ 2 ) ) N = 1 ( (N 1)µ 2 + µ 2 (N 2 2N + 1) ) N = 1 ( N µ2 N 1 + N 2 2N + 1 ) = 1 N µ2 ( N 2 N ) = 1 N Nµ2 (N 1) = µ 2 (N 1). Duque, σ max = µ 2 (N 1) = µ N 1. Coeciete di variazioe: si idica co CV e rappreseta u idice relativo di variabilità, che cosete il cofroto fra feomei rilevati i mometi diversi o espressi i uità di misura diverse. CV := σ µ. Problemi legati a CV: CV deito solo per valori positivi della media se la media diveta molto piccola, CV assume valori molto gradi 5

6 Scostameto medio semplice: permette di determiare se le modalità soo stabili rispetto ad u idice di posizioe riteuto rappresetativo della distribuzioe. S µ = 1 N S µ = 1 N S µ = x i µ per dati disaggregati x i µ i per dati i distr. fr. ass. x i µ f i per dati i distr. fr. rel. S µ = 1 N x i µ i per dati raggruppati i classi 1.2 Idici di forma Le distribuzioi aveti stessa posizioe e variabilità possoo dierire tra loro per la forma, che dipede dal valore delle modalità più piccole (o più gradi) del valore cetrale della distribuzioe. La forma di ua distribuzioe si misura attraverso gli idici di asimmetria e di curtosi. Asimmetria (skewess): idice che mostra la macaza di specularità di ua distribuzioe rispetto a qualsiasi asse verticale. 6

7 Per capire meglio di cosa si tratta, partiamo dalla deizioe di simmetria. Cosideriamo la seguete tabella, relativa ad ua geerica distribuzioe co mediaa M e: Modalità x 1 x 2... x i... x k tot Frequeza i... k N Cosideriamo le coppie (x 1, x k ), (x 2, x k 1 ), (x 3, x k 3 ) etc etc. La distribuzioe si dice simmetrica se, per ciascua coppia, le modalità soo equidistati dalla mediaa ed hao la stessa frequeza, i simboli per ogi i = 1, 2,..., k δ 2. (x i Me) = (x k+i 1 Me) i = k+i 1, Proposizioe 1.4. Ua distribuzioe simmetrica soddisfa le segueti proprietà: 1. la media aritmetica coicide co la mediaa 2. la somma degli scarti dalla media, elevati ad ua poteza dispari, è ulla 3. il primo ed il terzo quartile hao la stessa distaza dalla mediaa. Proof. Esercizio Ua distribuzioe o simmetrica si dice asimmetrica. I particolare, si parla di asimmetria positiva, se la distribuzioe preseta ua coda verso destra, e di asimmetria egativa, se la distribuzioe preseta ua coda verso siistra. Tale asimmetria si misura attraverso idici assoluti o idici relativi. Alla prima categoria appartegoo gli idici otteuti tramite cofroto della media co moda e mediaa: α 1 := µ Me; α 2 := µ Mo. Be più utile per ua aalisi statistica risulta essere il seguete idice relativo di asimmetria, oto come idice di Fisher: ( ) 3 xi µ. γ := 1 N 7 σ

8 Se γ = 0, allora la distribuzioe è simmetrica. Se γ > 0, allora la distribuzioe è asimmetrica positiva. Se γ < 0, allora la distribuzioe è asimmetrica egativa. Esempio 1.3. Cosideriamo i dati dell'esempio 1.2: sappiamo già che µ = 2.55 e σ = 1.11 Duque, si ha: Num. esami i (x i µ) 3 i Tot γ = 1 N (x i µ) 3 i σ 3 = (1.11) 3 = Il modo migliore per vericare se ua distribuzioe sia simmetrica o meo cosiste el guardare opportui graci. Gli istogrammi oroo u otevole aiuto i questo seso, ma la rappresetazioe graca maggiormete utile è data dal box-plot. Si tratta di u graco a scatola, el quale i dati presi i cosiderazioe soo i quartili della distribuzioe ed il campo di variazioe (i.e., il rage i cui variao i valori della distribuzioe). Si costruisce come segue: calcolo del valore miimo e del valore massimo della distribuzioe calcolo del primo, secodo e terzo quartile costruzioe di u rettagolo i cui estremi soo Q 1 e Q 3 e la cui larghezza vale Q 3 Q 1 idividuazioe della mediaa all'itero del box (si traccia ua liea i corrispodeza) collegameto del box ai valori miimo e massimo 8

9 È possibile che alcui valori della distribuzioe o cadao all'itero della scatola. I questo caso, si parla di outliers o valori aomali. Essi vegoo determiati dal raroto co dei valori-soglia. Più precisamete, x è u outlier se x < Q (Q 3 Q 1 ) oppure x > Q (Q 3 Q 1 ). Curtosi: misura la maggiore o miore sporgeza di ua curva di distribuzioe i prossimità del suo massimo e la maggiore o miore lughezza delle code. Si misura attraverso l'idice di curtosi di Pearso: ( ) 4 xi µ per dati disaggregati β := 1 N σ β := 1 σ 4 N (x i µ) 4 i N i per distr. freq. ass. β := 1 σ 4 N ( x i µ) 4 i N i per dati raggruppati i classi A questo si aggiuge l'idice di curtosi di Fisher γ 2 = β 3, che permette u migliore cofroto dei dati. Ifatti, la distribuzioe o ha curtosi se γ 2 = 0, ossia, β = 3. La distribuzioe di dice leptocurtica se β > 3 (quidi γ 2 > 0) oppure platicurtica se β < 3 (e γ 2 < 0). 9

10 2 Le relazioi tra i feomei 2.1 Distribuzioi multiple Le distribuzioi statistiche ora aalizzate prevedevao che su ciascua delle uità statistiche fosse rilevato u solo carattere, le cui modalità veivao descritte attraverso distribuzioi uitarie, ossia dati disaggregati, o attraverso distribuzioi di frequeze. I questo caso, si parla di distribuzioi semplici. Quado, ivece, su ciascua delle uità statistiche vegoo rilevati due o più caratteri, si hao distribuzioi statistiche multiple. Ache i questo caso, i dati vegoo raccolti i tabelle a doppia etrata, chiamate matrici di cotigeza. Esempio 2.1. Cosideriamo la seguete distribuzioe doppia, di u campioe di famiglie secodo il umero di vai (Y ) dell'appartameto i cui vivoo ed il umero di compoeti (X) il ucleo familiare: TOT TOT Come si leggoo i risultati di questa tabella? Il dato i rosso rappreseta il umero di famiglie, composte da 3 elemeti ciascua, che vivoo i altrettati appartameti da 5 vai ciascuo. Il dato i blu rappreseta il umero di famiglie costituite da u solo compoete, a prescidere dal umero di vai di cui è composto il suo appartameto. Il dato i verde rappreseta il umero di famiglie che vive i appartameti da 3 vai, seza iteressarsi del umero dei compoeti. Il dato i giallo rappreseta il umero totale di famiglie prese i esame. 10

11 y 1 y 2 y t TOT x t 10 x t x s s1 s2 st s0 TOT t N L'esempio precedete può essere geeralizzato. Cosideriamo due caratteri: X, co modalità x 1,..., x s, e Y, co modalità y 1,..., y t. La matrice di cotigeza assume la seguete forma: La parte cetrale della tabella, ossia: y 1 y 2 y t x t x t..... x s s1 s2 st N rappreseta la distribuzioe di frequeza assoluta cogiuta delle due variabili, metre i bordi della tabella (ultima riga e ultima coloa) rappresetao la distribuzioe di frequeza assoluta margiale delle sigole variabili, dove: ij rappreseta il umero di uità co la modalità i-sima di X e co la modalità j-sima di Y, ossia, la modalità assoluta cogiuta della coppia (x i, y j ). Ioltre, si ha s t ij = N. j=1 i0 := t j=1 ij, i = 1,..., s rappreseta la distribuzioe margiale del carattere X (i.e., la distribuzioe di X, idipedetemete da Y ) 0h := s j=1 jh, h = 1,..., t rappreseta la distribuzioe margiale del carattere Y (i.e., la distribuzioe di Y, idipedetemete da X) N := s i0 = t h=1 0h 11

12 la coloa j-sima della matrice dei dati rappreseta la distribuzioe codizioata del carattere X (i.e., la distribuzioe di X, i corrispodeza di ciascua modalità di Y ) e si idica co X Y = y j oppure X y j. la riga i-sima della matrice dei dati rappreseta la distribuzioe codizioata del carattere Y (i.e., la distribuzioe di Y, i corrispodeza di ciascua modalità di X) e si idica co Y X = x i oppure Y x i. Le tabelle di cotigeza possoo essere costruite ache el caso di distribuzioi di frequeza relativa: dove: y 1 y 2 y t TOT x 1 f 11 f 12 f 1t f 10 x 2 f 21 f 22 f 2t f x s f s1 f s2 f st f s0 TOT f 01 f 02 f 0t 1 f ij = ij N rappreseta la frequeza relativa cogiuta della coppia (x i, y j ). Ioltre, si ha t s f ij = 1. j=1 f i0 = i0 := t N j=1 f ij, i = 1,..., s rappreseta la frequeza relativa margiale del carattere X f 0h = 0h := s N ih, h = 1,..., t rappreseta la frequeza relativa margiale del carattere Y Abbiamo detto che le frequeze margiali e codizioate di X e Y soo uivariate, duque possiamo calcolare medie e variaze margiali e codizioate: 12

13 margiali: M(X) = 1 N t x i i0 = t x i f i0, V ar(x) = 1 N t x2 i i0 M 2 (X) M(Y ) = 1 N s j=1 y j 0j = s y j f 0j, V ar(y ) = 1 N s j=1 y2 j 0j M 2 (Y ) codizioate: M(X Y = y j ) = 1 0j t x i ij V ar(x Y = y j ) = 1 0j t x2 i ij M 2 (X Y = y j ) M(Y X = x i ) = 1 i0 s j=1 y j ij V ar(y X = x i ) = 1 i0 s j=1 y2 j ij M 2 (Y X = x i ) Esempio 2.2. Cosideriamo u campioe di 20 studeti del Corso di Statistica ed esamiiamo i caratteri sesso X e voto d'esame Y : TOT uomo doa TOT M(Y ) = = V ar(y ) = = M(Y X = uomo) = = 28 M(Y X = doa) = V ar(y X = uomo) = V ar(y X = doa) = = = =

14 2.2 Dipedeza tra variabili Nella pratica, si è iteressati a stabilire se certi feomei iuezao o meo u carattere statistico ed, i caso aermativo, si vuol misurare l'itesità di tale iueza. Ciò equivale a studiare la dipedeza tra caratteri. Dipedeza Logica Statistica Dipedeza logica: esiste ua relazioe di causa/eetto tra i caratteri (e.g., la statura è iuezata dalla alimetazioe) Dipedeza statistica: tra i caratteri esistoo delle regolarità ella associazioe tra le modalità (e.g., reddito e spesa cosumi) Noi focalizziamo l'attezioe sulla dipedeza statistica e vogliamo capire se esiste dipedeza e misurare l'evetuale itesità. Dipedeza statistica Assoluta Parametrica Fuzioale Dip. assoluta: diciamo che u carattere X è idipedete da Y se assume la stessa distribuzioe codizioata per ciascua modalità di X. I simboli, si ha: ij = i0, per ogi i = 1,..., s, j = 1,..., t. 0j N Se X è idipedete da Y, allora Y è idipedete da X. Se la codizioe di idipedeza o è soddisfatta, allora si parla di caratteri dipedeti. Diremo che Y dipede perfettamete da X se, i corrispodeza di ogi modalità di X, si verica ua sola modalità di Y. I termii matematici, questo vuol dire che i,! j : ij = 0. 14

15 Diremo, allora, che X è perfettamete iteridipedete co Y se i due caratteri dipedoo perfettamete l'uo dall'altro. La coessioe tra due caratteri si misura attraverso l'idice quadratico di coessioe o idice chi-quadrato: χ 2 = s t j=1 c 2 ij ˆ ij, dove: ij, per ogi i = 1,..., s e per ogi j = 1,..., t, soo le frequeze assolute osservate ˆ ij := i0 0j, per ogi i = 1,..., t e per ogi j = 1,..., s, soo N le frequeze teoriche assolute cogiute, ossia i valori che si avrebbero se i caratteri fossero idipedeti c ij = ij ˆ ij soo le cotigeze, ossia le diereze tra le frequeze eettive e quelle teoriche Proprietà dell'idice chi-quadrato: 1. 0 χ 2 N mi(s 1, r 1). I particolare, χ 2 = 0 i caso di idipedeza assoluta dei caratteri e χ 2 = N mi(s 1, r 1) i caso di massima dipedeza. 2. Per poter eettivamete quaticare la dipedeza, occorre ormalizzare l'idice chi-quadrato: χ ν = 2 N mi(s 1, r 1). Tale valore, che varia tra 0 e 1, prede il ome di idice di Cramer. 3. Chi-quadrato è u idice simmetrico, el seso che rimae ivariato se ivertiamo X e Y. Esempio 2.3. Prediamo i cosiderazioe i dati relativi ai miorei codaati secodo la tipologia di delitto (Y ) ed il sesso (X) [Fote: dati Istat, 1989] 15

16 Omicidio Lesioi Furto Altro TOT uomo doa TOT Vogliamo misurare il grado di dipedeza tra i due caratteri. Per poter fare ciò, occorre costruire la tabella delle frequeze teoriche: ˆ 11 = ˆ 12 = ˆ 13 = ˆ 14 = ˆ 21 = ˆ 22 = ˆ 23 = ˆ 24 = = = = = = = = = Omicidio Lesioi Furto Altro TOT uomo doa TOT Quidi, applichiamo la formula dell'idice chi-quadrato e avremo: χ 2 = + ( )2 ( )2 ( )2 ( ) (3 4.66)2 (2 4.31)2 ( )2 ( ) = Ie, calcoliamo l'idice di Cramer per otteere u valore umerico 16

17 facilmete iterpretabile: ν = mi(4 1, 2 1) = mi(3, 1) = = Possiamo cocludere dicedo che, poiché l'idice ormalizzato è molto prossimo a zero, deduciamo che i due caratteri aalizzati presetao ua debole dipedeza assoluta. Dip. parametrica: permette di stabilire se e quata iueza hao le modalità di u carattere, rispetto ad u parametro costate di sitesi delle medesime distribuzioi. Per questo motivo, si parla di distribuzioe i media, distribuzioe i variaza, distribuzioe i mediaa, e così via. Noi ci occuperemo del modello di dipedeza i media. calcola attraverso il rapporto di correlazioe di Pearso: Questa si η 2 X Y = η 2 Y X = t j=1 [M(X Y = y j) M(X)] 2 0j s (x i M(X)) 2 i0 s [M(Y X = x i) M(Y )] 2 i0 t j=1 (y j M(Y )) 2 0j Proprietà dell'idice di correlazioe di Pearso: 1. 0 η η 2 aumeta, al crescere della variabilità delle medie codizioate Esempio 2.4. I u collettivo di 420 volotari si é osservata la frequeza di attivitá di volotariato per classi di etá, otteedo la seguete distribuzioe di frequeze relative percetuali: X\Y [14, 20] (20, 35] (35, 55] (55, 60] Almeo ua volta a settimaa Ua o piú volte al mese Determiare il coe. di correlazioe dell'etá dalla regolaritá del servizio di volotariato. Si scelga X = frequeza del servizio di volotariato e Y = etá. Sia poi la totalitá percetuale del campioe preso i cosiderazioe. Si 17

18 vede, ioltre, che la tabella preseta S = 2 righe e T = 4 coloe. Per valutare la correlazioe tra due feomei espressi i forma di frequeze relative percetuali si fa riferimeto al rapporto di correlazioe (si veda Deizioe 9.8 pag. 215 del libro di testo cosigliato) η 2 Y X = S [(µ(y X i) µ(y )) 2 ] i0 T j=1 [(Ȳj µ(y )) 2 ] 0j, dove: poiché i dati soo raccolti i classi, bisoga calcolare il valore cetrale di ciascua classe, idicato co Ȳj, per ogi j = 1,..., T µ(y X i ) é la media codizioata del carattere Y rispetto alla modalitá X i. Si ha: µ(y X i ) = 1 i0 T Ȳ j ij, i = 1, 2 j=1 µ(y X 1 ) = ( )/40 = 33 µ(y X 2 ) = ( )/60 = µ(y ) é la media del carattere Y. Si ha: µ(y ) = 1 T Ȳ j 0j = ( )/100 = j=1 Quidi: D S = S [(µ(y X i ) µ(y )) 2 ] i0 = ( ) 2 40+( ) 2 60 = D tot = Duque, T [(Ȳj µ(y )) 2 ] 0j = [( ) 2 ] 20 + [( ) 2 ] 35 j=1 + [( ) 2 ] 30 + [( ) 2 ] 15 = η 2 Y X = =

19 Dip. fuzioale: valuta la forma fuzioale della dipedeza ello studio dell'associazioe tra caratteri quatitativi (preseza di dipedeza, itesità della dipedeza, sego della dipedeza). Ci cocetriamo sulla dipedeza lieare, i.e., rappresetata attraverso fuzioi che soo equazioi di rette. si cosideri la distribuzioe di peso e altezza di 10 atleti: atleta peso (kg) altezza (cm) M P L G S F A O B E Le compoeti della variabile doppia (X, Y ) soo i geerale caratterizzate da diversa posizioe e variabilità, ifatti M(X) M(Y ) e V ar(x) V ar(y ). Per poter cofrotare le modalità dei due caratteri, occorre che i valori siao riferiti a delle quatità che abbiao stessa scala di misurazioe, 19

20 el seso che si possao escludere gli eetti delle diverse medie e variaze. L'operazioe che si eettua i questi casi va sotto il ome di stadardizzazioe: Z X := X µ X σ X, Z Y := Y µ Y σ Y. Le uove gradezze Z X e Z Y soo dette stadardizzate, i cui valori soo i segueti: µ X = µ Y = σx 2 = σy 2 = 10 x i y i x2 i y2 i 10 = 66.2 = µ 2 X = σ X = 3.88 µ 2 y = σ X = 4.38 Z X Z Y L'idice che misura la dipedeza lieare di Y da X si chiama coeciete di correlazioe ed è deito come la media aritmetica del prodotto delle stadardizzate: ρ XY := 1 z X,i z Y,i 20

21 Proposizioe 2.1. Il coeciete di correlazioe ammette la seguete formula operativa: ρ XY = σ XY σ X σ Y, dove il umeratore rappreseta la covariaza di X e Y. Proof. Sfruttado la deizioe di stadardizzata, avremo ρ = 1 = z X,i z Y,i = 1 Guardiamo al umeratore: 1 ( xi µ X 1 (x i µ X )(y i µ Y ) σ X σ Y (x i µ X )(y i µ Y ) = 1 = 1 = 1 = 1 σ X yi µ Y σ Y ) (x i y i x i µ Y µ X y i + µ X µ Y ) x i y i 1 x i µ Y 1 µ X y i + 1 x i y i µ X µ Y µ X µ Y + µ X µ Y x i y i µ X µ Y = σ XY. Sostituedo ella formula iiziale, si ottiee la tesi. µ X µ Y Proprietà della correlazioe 1. 1 ρ XY 1 e si ha perfetta correlazioe quado ρ = ±1. 2. se X e Y soo idipedeti, allora ρ XY = la correlazioe è ivariate per trasformazioi lieari, ossia: ρ(ax + B) = ρ(x) 4. si ha massima relazioe lieare possibile i caso di correlazioe di ua variabile co se stessa: ρ XX = σ XX σ 2 X = σ2 X σ 2 X = 1. 21

22 3 La regressioe lieare Per studiare la dipedeza lieare di ua variabile Y rispetto ad u'altra X, si utilizza il modello di regressioe: tale modello stabilisce, a meo di variazioi casuali, ua relazioe lieare tra risposta e predittore e permette di prevedere i valori della variabile di risposta (deita variabile dipedete) a partire da quelli di ua variabile idipedete (chiamata regressore o predittore). Da u puto di vista matematico, il modello ha la seguete forma: y)f(x) + ɛ, dove f è ua fuzioe ell'icogita x e può assumere varie forme, metre ɛ rappreseta il cotributo di fattori che potrebbero iuezare la varibile di risposta e che o vegoo cosiderati (residui o scarti). Il caso più facile che si può presetare è quello della regressioe lieare semplice. lieare: la fuzioe che prediamo i cosiderazioe è l'equazioe di ua retta (f(x) = mx + q). I alterativa, si può avere regressioe quadratica, espoeziale, logaritmica, etc etc. semplice: suppoiamo ci sia ua sola modalità idipedete, i cotrapposizioe co la regressioe multipla. L'equazioe del modello è dove: y = b 0 + b 1 x + ɛ, b 0 è l'itercetta, ossia l'ordiata all'origie (da u puto di vista geometrico) e rappreseta il valore medio di y quado x vale zero (da u puto di vista statistico) b 1 è il coeciete agolare della retta (da u puto di vista geometrico) e ci dice come varia y i corrispodeza di ua variazioe uitaria di x. Il sego di b 1 ci iforma circa la relazioe tra la variabile risposta ed il predittore ɛ è la compoete o osservabile del modello e suppoiamo abbia media ulla Duque, la retta di regressioe forisce ua approssimazioe della dipedeza dei valori della variabile dipedete da quelli della variabile idipedete. Questo implica che la dipedeza o è esattamete descritta dalla retta di regressioe. Quidi, dovremo cofrotare i valori teorici, dati da 22

23 ŷ i = b 0 + b i x i, co quelli osservati, che idichiamo co y i, per ogi i. Le diereze tra i valori teorici e quelli osservati soo i residui: ɛ i = y i ŷ i = y i b 0 b 1 x i. Cerchiamo i valori dei parametri della retta di regressioe che redao miima la diereza tra valori teorici e valori osservati, o, equivaletemete, che redao miimi i residui. Il metodo utilizzato per risolvere questo problema va sotto il ome di metodo dei miimi quadrati. Tale metodo cosiste el determiare b 0, b 1 i modo tale che la somma dei quadrati dei residui sia miima. Ma perché proprio la somma dei quadrati? No sarebbe stato più semplice predere semplicemete la somma dei residui? Suppoiamo di scegliere di miimizzare ɛ i; poiché gli scarti ci dicoo di quato ci siamo spostati dal valore eettivo, tali residui potrao assumere valori positiv e/o egativi. I casi particolari, quidi, potremmo otteere somme dei residui molto piccole, corrispodeti a rette assolutamete iadatte a descrivere i ostri puti. Ua cadidata alterativa potrebbe essere la somma dei valori assoluti degli scarti, così da elimiare il problema di evetuali valori egativi dei residui. Si sceglie proprio di miimizzare la somma dei quadrati degli scarti, i quato, i questo modo, è soddisfatta la proprietà della media artitmetica di redere miima la somma dei quadrati degli scarti. Come si procede, da u puto di vista matematico? Com'è be oto dall'aalisi, u problema di ottimo si traduce ella risoluzioe di u sistema di equazioi lieari, dove tali equazioi si ottegoo poedo uguali a zero le derivate della fuzioe da ottimizzare: { b 0 ɛ2 i = 0 b 1 ɛ2 i = 0 Proposizioe 3.1. I parametri della retta di regressioe y = b 0 + b 1 x assumoo le segueti espressioi: b 1 = σ xy σ 2 x b 0 = µ y b 1 µ x Proof. Ricordiamo che la somma dei quadrati degli scarti si scrive come segue: ɛ 2 i = (y i ŷ i ) 2 = (y i b 0 b 1 x i ) 2. 23

24 Scriviamo le derivate: { b 0 (y i b 0 b 1 x i ) 2 = 0 b 1 (y i b 0 b 1 x i ) 2 = 0 Per quel che riguarda la prima derivata: (y i b 0 b 1 x i ) 2 = 2 (y i b 0 b 1 x i ) = 0 b 0 y i b 0 b 1 x i = 0 1 y i b 0 1 µ y b 0 b 1 µ x = 0 b 0 = µ y b 1 µ x. b 1 1 x i = 0 Per quel che riguarda la secoda derivata: (y i b 0 b 1 x i ) 2 = 2 (y i b 0 b 1 x i )x i = 0 b 1 x i y i b 0 x i b 1 x 2 i = 0 b 1 b 1 x 2 i = x 2 i = x i y i b 0 x i = x i y i 1 ] [ b 1 = [ ] b x2 i 1 ( x i) 2 = 2 = x iy i y i x i [ ] b 1 µx 2 µ 2 x = x iy i µ x µ y σxb 2 1 = σ xy b 1 = σ xy σ 2 x x 2 i ( x i) 2 y i x i y i ( 1 y i b 1 1 ( ) 2 1 x i + b 1 x i x i y i 1 y i x i x iy i y i x i 2 24 ) x i x i

25 I riferimeto ai dati dell'esempio iiziale, la retta di regressioe è y = 0,9528x + 110,32 R² = 0, Serie Lieare (Serie1) Ua volta otteuta le retta di regressioe, occore stabilire, attraverso strumeti matematici, che essa be si adatta ai valori osservati. I questo seso, esistoo strumeti graci e strumeti aalitici. Per quel che riguarda i primi, si parla di plot dei residui. Nel secodo caso, si calcola il coeciete di determiazioe lieare o idice di determiazioe: R 2 := σ2 xy σ x σ y = ρ 2. Per com'è deito, 0 R 2 1. I particolare, valori piccoli (vicii allo zero) idicao che la retta otteuta o si adatta bee ai dati osservati, metre valori gradi (vicii a uo) idicao che la retta otteuta be si adatta alle osservazioi. 25

Caso studio 9. Distribuzioni doppie. Esempi

Caso studio 9. Distribuzioni doppie. Esempi 7/3/16 Caso studio 9 Si cosideri la seguete tabella che riporta i dati dei Laureati el 4 dei tre pricipali gruppi di corsi di laurea, per codizioe occupazioale a tre ai dalla laurea (Fote: ISTAT, Idagie

Dettagli

Statistica 1 A.A. 2015/2016

Statistica 1 A.A. 2015/2016 Corso di Laurea i Ecoomia e Fiaza Statistica 1 A.A. 2015/2016 (8 CFU, corrispodeti a 48 ore di lezioe frotale e 24 ore di esercitazioe) Prof. Luigi Augugliaro 1 / 21 Misura della dipedeza di u carattere

Dettagli

Lezione 4 Corso di Statistica. Francesco Lagona

Lezione 4 Corso di Statistica. Francesco Lagona Lezioe 4 Corso di Statistica Fracesco Lagoa Uiversità Roma Tre F. Lagoa (fracesco.lagoa@uiroma3.it) 1 / 23 obiettivi della lezioe familiarizzare co il calcolo e le proprietà della media aritmetica familiarizzare

Dettagli

Fonti e strumenti statistici per la comunicazione

Fonti e strumenti statistici per la comunicazione Foti e strumeti statistici per la comuicazioe Prof.ssa Isabella Migo A.A. 018-019 Idici Medi Esercizio:calcolo media soluzioe Numeri addetti xi i xi * i 10 18 180 1 15 180 14 5 350 16 10 160 18 9 5 0 18

Dettagli

Esercitazioni di Statistica Dott. Danilo Alunni Fegatelli

Esercitazioni di Statistica Dott. Danilo Alunni Fegatelli Esercitazioi di Statistica Dott. Dailo Alui Fegatelli dailo.aluifegatelli@uiroma.it Esercizio. Su 0 idividui soo stati rilevati la variabile X (geere) e (umero di auto possedute) X F F M F M F F M F M

Dettagli

Lezione 4 Corso di Statistica. Domenico Cucina

Lezione 4 Corso di Statistica. Domenico Cucina Lezioe 4 Corso di Statistica Domeico Cucia Uiversità Roma Tre D. Cucia (domeico.cucia@uiroma3.it) 1 / 22 obiettivi della lezioe familiarizzare co il calcolo e le proprietà della media aritmetica familiarizzare

Dettagli

STATISTICA 1 ESERCITAZIONE 5

STATISTICA 1 ESERCITAZIONE 5 STATISTICA ESERCITAZIONE 5 Dott. Giuseppe Padolfo 28 Ottobre 203 VARIABILITA IN TERMINI DI DISPERSIONE DA UN CENTRO Cetro Me o μ La dispersioe viee misurata come sitesi delle distaze tra le uità statistiche

Dettagli

Lezione 5. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 5. A. Iodice.

Lezione 5. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 5. A. Iodice. La Statistica Alfoso Iodice D Eza iodicede@uicas.it Uiversità degli studi di Cassio () Statistica 1 / 26 Outlie La 1 2 La 3 4 () Statistica 2 / 26 Trimmed mea - La aritmetica risete della preseza di valori

Dettagli

Elementi di statistica descrittiva. Tabella dei dati :

Elementi di statistica descrittiva. Tabella dei dati : - - Elemeti di statistica descrittiva I dati riportati sotto si riferiscoo a 20 studeti uiversitari che frequetavao u corso di Statistica e soo stati raccolti facedo compilare ad ogi studete il seguete

Dettagli

Alcuni concetti di statistica: medie, varianze, covarianze e regressioni

Alcuni concetti di statistica: medie, varianze, covarianze e regressioni A Alcui cocetti di statistica: medie, variaze, covariaze e regressioi Esistoo svariati modi per presetare gradi quatità di dati. Ua possibilità è presetare la cosiddetta distribuzioe, raggruppare cioè

Dettagli

7. ASSOCIAZIONE TRA CARATTERI

7. ASSOCIAZIONE TRA CARATTERI UNIVERSITA DEGLI STUDI DI PERUGIA DIPARTIMENTO DI FILOSOFIA SCIENZE SOCIALI UMANE E DELLA FORMAZIONE Corso di Laurea i Scieze per l'ivestigazioe e la Sicurezza 7. ASSOCIAZIONE TRA CARATTERI Prof. Maurizio

Dettagli

Lezione 9. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 9. A. Iodice

Lezione 9. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 9. A. Iodice Statistica Alfoso Iodice D Eza iodicede@uicas.it Uiversità degli studi di Cassio () Statistica 1 / 26 Outlie 1 2 3 ρ xy come coefficiete calcolo di ρ xy 4 () Statistica 2 / 26 Misura dell iterdipedeza

Dettagli

Quartili. Esempio Q 3. Me Q 1. Distribuzione unitaria degli affitti settimanali in euro pagati da 19 studenti U.S. A G I F B D L H E M C

Quartili. Esempio Q 3. Me Q 1. Distribuzione unitaria degli affitti settimanali in euro pagati da 19 studenti U.S. A G I F B D L H E M C Quartili Primo quartile Q 1 : modalità che ella graduatoria (crescete o decrescete) bipartisce il 50% delle osservazioi co modalità più piccole o al più uguali alla Me Terzo quartile Q 3 : modalità che

Dettagli

7. ASSOCIAZIONE TRA CARATTERI

7. ASSOCIAZIONE TRA CARATTERI UNIVERSITA DEGLI STUDI DI PERUGIA DIPARTIMENTO DI FILOSOFIA SCIENZE SOCIALI UMANE E DELLA FORMAZIONE Corso di Laurea i Scieze per l'ivestigazioe e la Sicurezza 7. ASSOCIAZIONE TRA CARATTERI Prof. Maurizio

Dettagli

Quartili. Esempio Q 3 Q 1. Distribuzione unitaria degli affitti settimanali in euro pagati da 19 studenti U.S. A G I F B D L H E M C

Quartili. Esempio Q 3 Q 1. Distribuzione unitaria degli affitti settimanali in euro pagati da 19 studenti U.S. A G I F B D L H E M C Quartili Primo quartile Q 1 : modalità che ella graduatoria (crescete o decrescete) bipartisce il 50% delle osservazioi co modalità più piccole o al più uguali alla Me Terzo quartile Q 3 : modalità che

Dettagli

Esercitazioni di Statistica Dott.ssa Cristina Mollica cristina.mollica@uniroma1.it

Esercitazioni di Statistica Dott.ssa Cristina Mollica cristina.mollica@uniroma1.it Esercitazioi di Statistica Dott.ssa Cristia Mollica cristia.mollica@uiroma1.it Cocetrazioe Esercizio 1. Nell'ultima settimaa ua baca ha erogato i segueti importi (i migliaia di euro) per prestiti a imprese:

Dettagli

5. INDICI DI DISUGUAGLIANZA

5. INDICI DI DISUGUAGLIANZA UNIVERSITA DEGLI STUDI DI PERUGIA DIPARTIMENTO DI FILOSOFIA SCIENZE SOCIALI UMANE E DELLA FORMAZIONE Corso di Laurea i Scieze per l'ivestigazioe e la Sicurezza. INDICI DI DISUGUAGLIANZA Prof. Maurizio

Dettagli

Gli Indici di VARIABILITA

Gli Indici di VARIABILITA Elemeti di Statistica descrittiva Gli Idici di VARIABILITA - Campo di variazioe - Scarto dalla media - Variaza - Scarto quadratico medio - Coefficiete di variazioe Idici di Variabilità I valori medi soo

Dettagli

Esempio: distribuzione di frequenze. =, Pagina 90. Esempio: distribuzione di frequenze

Esempio: distribuzione di frequenze. =, Pagina 90. Esempio: distribuzione di frequenze Esempio: distribuzioe di frequeze Distribuzioe degli studeti di SDC frequetati la facoltà ell a.a. 001/00 per Num. Corsi Frequetati 83 K 7 = + + + + + + = = Num. Corsi Freq. i 1 15 43 3 103 4 80 5 3 6

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Migo A.A. Facoltà di Scieze Politiche, Sociologia, Comuicazioe Corso di laurea Magistrale i «Orgaizzazioe e marketig per la comuicazioe d'impresa»

Dettagli

Formulario (versione del 3/10/2015)

Formulario (versione del 3/10/2015) Uiversità degli Studi della Basilicata C.d.L. Ecoomia Aziedale Statistica a.a. 04/05 Docete: E. Di Nardo Frequeze Formulario versioe del 3/0/05 taglia campioe casuale x,..., x campioe casuale ordiato x...

Dettagli

ES 1.3. Data la distribuzione unitaria di una variabile quantitativa X. la media aritmetica di X è data dal rapporto tra il totale n

ES 1.3. Data la distribuzione unitaria di una variabile quantitativa X. la media aritmetica di X è data dal rapporto tra il totale n ES 1.3 1 Media e variaza Data la distribuzioe uitaria di ua variabile quatitativa X x 1... x i... x, la media aritmetica di X è data dal rapporto tra il totale x i e il umero delle uità rilevate: x = 1

Dettagli

Statistica. Lezioni : 11, 12. Statistica Descrittiva Bivariata 2. a.a

Statistica. Lezioni : 11, 12. Statistica Descrittiva Bivariata 2. a.a Corsi di Laurea: Diritto per le Imprese e le istituzioi Scieze dell Ammiistrazioe e Cosuleza del Lavoro sieze Iterazioali dello Sviluppo e della Cooperazioe a.a. 2017-18 Statistica Statistica Descrittiva

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Migo A.A. 019-00 Facoltà di Scieze Politiche, Sociologia, Comuicazioe Corso di laurea Magistrale i «Orgaizzazioe e marketig per la comuicazioe

Dettagli

Relazioni statistiche

Relazioni statistiche Relazioi statistiche Idipedeza: asseza di qualsiasi relazioe tra due caratteri I caso di preseza di u legame, questo può essere di: Coessioe: relazioe reciproca tra due caratteri qualitativi Dipedeza:

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Migo A.A. 017-018 Facoltà di Scieze Politiche, Sociologia, Comuicazioe Corso di laurea Magistrale i «Orgaizzazioe e marketig per la comuicazioe

Dettagli

5. INDICI DI VARIABILITA'

5. INDICI DI VARIABILITA' UNIVERSITA DEGLI STUDI DI PERUGIA DIPARTIMENTO DI FILOSOFIA SCIENZE SOCIALI UMANE E DELLA FORMAZIONE Corso di Laurea i Scieze per l'ivestigazioe e la Sicurezza. INDICI DI VARIABILITA' Prof. Maurizio Pertichetti

Dettagli

La correlazione e la regressione. Antonello Maruotti

La correlazione e la regressione. Antonello Maruotti La correlazioe e la regressioe Atoello Maruotti Outlie 1 Correlazioe 2 Associazioe tra caratteri quatitativi Date due distribuzioi uitarie secodo caratteri quatitativi X e Y x 1 x 2 x y 1 y 2 y associate

Dettagli

Formulario di Statistica (Cucina-Lagona)

Formulario di Statistica (Cucina-Lagona) Formulario di Statistica (Cucia-Lagoa) Corso di Statistica - a.a. 018/19 (Cucia-Lagoa) May 9, 019 1 Statistica descrittiva Media per distribuzioi uitarie o serie dati: x = 1 x i per distribuzioi di frequeze

Dettagli

LA INTERPOLAZIONE Appartamenti venduti nel 2006 da un agenzia immobiliare di Treviso.

LA INTERPOLAZIONE Appartamenti venduti nel 2006 da un agenzia immobiliare di Treviso. LA INTERPOLAZIONE Appartameti veduti el 006 da u agezia immobiliare di Treviso. superficie (mq) prezzo (k ) segue 10 160 45 70 80 95 85 110 64 98 106 140 10 170 50 80 100 150 90 15 115 165 140 165 98 145

Dettagli

REGRESSIONE LINEARE E POLINOMIALE

REGRESSIONE LINEARE E POLINOMIALE REGRESSIONE LINEARE E POLINOMIALE Nota ua tabella di dati relativi alle osservazioi di due gradezze X e Y, è aturale formulare ipotesi su quale possa essere ua ragioevole fuzioe che rappreseti o che approssimi

Dettagli

Elementi di statistica

Elementi di statistica Elemeti di statistica La misura delle gradezze fisiche può essere effettuata direttamete o idirettamete. Se la misura viee effettuata direttamete si parla di misura diretta; se essa viee dedotta attraverso

Dettagli

Daniela Tondini

Daniela Tondini Daiela Todii dtodii@uite.it Facoltà di Bioscieze e Tecologie agro-alimetari e ambietali e Facoltà di Medicia Veteriaria C.L. i Biotecologie Uiversità degli Studi di Teramo 1 La mediaa o valore mediao M

Dettagli

Principio alla base della misura del legame tra X ed Y

Principio alla base della misura del legame tra X ed Y Pricipio alla base della misura del legame tra X ed Y Y o varia Asseza di legame Al variare di X Varia ache Y X ed Y soo coessi Come si misura la risposta di Y al variare di X? Dipede dalla atura di X

Dettagli

Lo studio della relazione lineare tra due variabili

Lo studio della relazione lineare tra due variabili Lo studio della relazioe lieare tra due variabili X e caratteri etrambi quatitativi X variabile idipedete variabile dipedete * f ( ) f(): espressioe fuzioale che descrive la legge di dipedeza di da X 1

Dettagli

Costo manutenzione (euro)

Costo manutenzione (euro) Esercitazioe 05 maggio 016 ESERCIZIO 1 Ua società di servizi possiede u parco auto di diverse età. I dirigeti ritegoo che il costo degli iterveti di mautezioe per le auto più vecchie sia geeralmete più

Dettagli

Variabilità o Dispersione Definizione Attitudine di un fenomeno ad assumere diverse modalità

Variabilità o Dispersione Definizione Attitudine di un fenomeno ad assumere diverse modalità Variabilità o Dispersioe Defiizioe Attitudie di u feomeo ad assumere diverse modalità Le medie o bastao Esempio: caratteri quatitativi Codomiio A u.s. Numero televisori u 8 u 8 u3 8 u4 8 u5 8 Me=M=8 Codomiio

Dettagli

7. RELAZIONE TRA CARATTERI

7. RELAZIONE TRA CARATTERI UNIVERSITA DEGLI STUDI DI PERUGIA DIPARTIMENTO DI FILOSOFIA SCIENZE SOCIALI UMANE E DELLA FORMAZIONE Corso di Laurea i Scieze per l'ivestigazioe e la Sicurezza 7. RELAZIONE TRA CARATTERI CONNESSIONE Prof.

Dettagli

2.2 - La dipendenza assoluta e parametrica

2.2 - La dipendenza assoluta e parametrica . - La dipedeza assoluta e parametrica Tabelle a doppia etrata X\Y Y Y Y j Y c X j c. X j c. X i i i ij X k k k kj...j ic i. kc k..c.. per i assegato: i. c ij j per j assegato:.j k ij i k c ij i j.....

Dettagli

UNIVERSITÀ DEGLI STUDI DI MILANO - BICOCCA FACOLTÀ DI SOCIOLOGIA a. a Esame del STATISTICA

UNIVERSITÀ DEGLI STUDI DI MILANO - BICOCCA FACOLTÀ DI SOCIOLOGIA a. a Esame del STATISTICA FACOLTÀ DI SOCIOLOGIA a. a. 011 01 Esame del 11-01-01 STATISTICA ESERCIZIO 1 U idagie sulle abitudii alimetari dei requetatori di u cetro itess ha moitorato il umero di caè cosumati i u gioro ormale e

Dettagli

Tavole di Contingenza Connessione

Tavole di Contingenza Connessione Tavole di Cotigeza Coessioe Ua tavola di cotigeza per due geerici feomei X e Y è ua rappresetazioe simbolica di ua tabella a doppia etrata y 1 y y j y k x 1 11 1 1j 1k 1 x 1 j k x i i1 i ik i x h h1 h

Dettagli

LE MISURE DI TENDENZA CENTRALE

LE MISURE DI TENDENZA CENTRALE STATISTICA DESCRITTIVA LE MISURE DI TENDENZA CENTRALE http://www.biostatistica.uich.itit OBIETTIVO Esempio: Nella tabella seguete soo riportati i valori del tasso glicemico rilevati su 0 pazieti: Idividuare

Dettagli

Lezione 4 Corso di Statistica. Francesco Lagona

Lezione 4 Corso di Statistica. Francesco Lagona Lezioe 4 Corso di Statistica Fracesco Lagoa Uiversità Roma Tre F. Lagoa (fracesco.lagoa@uiroma3.it) 1 / 17 Outlie 1 Media aritmetica 2 variaza 3 il caso delle variabili dicotomiche 4 trasformazioi lieari

Dettagli

Metodi quantitativi per l analisi dello sviluppo

Metodi quantitativi per l analisi dello sviluppo Metodi quatitativi per l aalisi dello sviluppo Esercizio Si è rilevato il umero di ospedali (X) e la spesa saitaria i milioi di euro (Y), per 7 regioi, otteedo i segueti risultati: Ospedali (X) 5 7 4 6

Dettagli

Statistica bivariata Tabella di contingenza % di riga I tre tipi di percentuale rimandano a significati differenti. Tabella di contingenza

Statistica bivariata Tabella di contingenza % di riga I tre tipi di percentuale rimandano a significati differenti. Tabella di contingenza Tabella di cotigeza % di riga I tre tipi di percetuale rimadao a sigificati differeti Si più ifo o più ifo Totale Sufficiete 46 567 63 Isufficiete 8 49 637 Totale 64 986 5 Si più ifo o più ifo Totale Sufficiete

Dettagli

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel: UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Doatella Siepi doatella.siepi@uipg.it tel: 075 5853525 05 dicembre 2014 6 LEZIONE Statistica descrittiva STATISTICA DESCRITTIVA Rilevazioe dei

Dettagli

Corso di Laurea in Ingegneria Informatica Anno Accademico 2016/2017 Calcolo delle Probabilità e Statistica Matematica

Corso di Laurea in Ingegneria Informatica Anno Accademico 2016/2017 Calcolo delle Probabilità e Statistica Matematica Corso di Laurea i Igegeria Iformatica Ao Accademico 26/27 Calcolo delle Probabilità e Statistica Matematica Nome... N. Matricola... Acoa, geaio 27. (8 puti) Si vuole stimare il parametro p di ua legge

Dettagli

Le principali procedure inferenziali: nozioni, schemi di procedimento ed esempi di applicazione

Le principali procedure inferenziali: nozioni, schemi di procedimento ed esempi di applicazione Complemeti per il corso di Statistica Medica Le pricipali procedure ifereziali: ozioi, schemi di procedimeto ed esempi di applicazioe IC al livello (-α) % per la media µ Ipotesi: ella popolazioe il feomeo

Dettagli

STATISTICA 1 ESERCITAZIONE 4

STATISTICA 1 ESERCITAZIONE 4 STATISTICA 1 ESERCITAZIONE 4 Dott. Giuseppe Padolfo 21 Ottobre 2013 Percetili: i valori che dividoo la distribuzioe i ceto parti di uguale umerosità. Esercizio 1 La seguete tabella riporta la distribuzioe

Dettagli

Esercitazione di riepilogo II

Esercitazione di riepilogo II Esercitazioe di riepilogo II I questa esercitazioe faremi u ripasso geerale: rappresetazioi grafiche, medie e variaze; la correlazioe; la regressioe. 1 Esercizio 1 Gli stipedi degli impiegati di u ufficio

Dettagli

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica Statistica Corso Base (Serale) Dott.ssa Cristia Mollica cristia.mollica@uiroma1.it Idici di posizioe Esercizio 1: Data la seguete distribuzioe uitaria del carattere X 4 2 4 2 6 4 0 4 0 2 4 4 (1) calcolare

Dettagli

Popolazione e Campione

Popolazione e Campione Popolazioe e Campioe POPOLAZIONE: Isieme di tutte le iformazioi sul feomeo oggetto di studio Viee descritta mediate ua variabile casuale X: X ~ f ( x; ϑ) θ = costate icogita Qual è il valore di θ? E verosimile

Dettagli

Soluzione CPS 22/6/04. I parte. (1). Chiamiamo C l evento l individuo scelto ha il colesterolo alto, V, O e NL rispettivamente

Soluzione CPS 22/6/04. I parte. (1). Chiamiamo C l evento l individuo scelto ha il colesterolo alto, V, O e NL rispettivamente Soluzioe CPS 22/6/04 I parte 1. Chiamiamo C l eveto l idividuo scelto ha il colesterolo alto, V, O e NL rispettivamete è vegetariao, è oivoro e o magia latticii. I dati soo: P C = 0.4, P O C = 0.75, P

Dettagli

UNIVERSITÀ DEGLI STUDI DI MILANO - BICOCCA

UNIVERSITÀ DEGLI STUDI DI MILANO - BICOCCA UNIVERSITÀ DEGLI STUDI DI MILANO - BICOCCA FACOLTÀ DI SOCIOLOGIA a. a. 9 Esame del -6- Statistica ESERCIZIO Relazioi tra Variabili (totale puti: ) Ad ua riuioe del circolo Amati dell acquario, i soci preseti

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Migo A.A. 2015-2016 Facoltà di Scieze Politiche, Sociologia, Comuicazioe Corso di laurea Magistrale i «Orgaizzazioe e marketig per la comuicazioe

Dettagli

Esempio. Tabella a doppia entrata. n 2. n 24. n.6

Esempio. Tabella a doppia entrata. n 2. n 24. n.6 Esempio Distribuzioe degli studeti di Scieze della Comuicazioe frequetati la facoltà ell a.a. 001/00 per Corso di Laurea e Numero di Corsi Frequetati Numero Corsi Frequetati CDL 1 3 4 5 6 7 STC 1 19 50

Dettagli

LE MISURE DI SINTESI (misure di tendenza centrale)

LE MISURE DI SINTESI (misure di tendenza centrale) STATISTICA DESCRITTIVA LE MISURE DI SINTESI (misure di tedeza cetrale) http://www.biostatistica.uich.itit OBIETTIVO Altezza degli studeti 004-05 (cm) Tabella dei dati Idividuare u idice che rappreseti

Dettagli

Fonti e strumenti statistici per la comunicazione

Fonti e strumenti statistici per la comunicazione Foti e strumeti statistici per la comuicazioe Prof.ssa Isabella Migo A.A. 019-00 Idici Medi La mediaa Media di posizioe calcolabile solo se il carattere è ordiabile. Valore della distribuzioe che divide

Dettagli

Università degli Studi di Cassino, Anno accademico Corso di Statistica 2, Prof. M. Furno

Università degli Studi di Cassino, Anno accademico Corso di Statistica 2, Prof. M. Furno Uiversità degli Studi di Cassio, Ao accademico 004-005 Corso di Statistica, Prof.. uro Esercitazioe del 01/03/005 dott. Claudio Coversao Esercizio 1 Si cosideri il seguete campioe casuale semplice estratto

Dettagli

Distribuzione normale

Distribuzione normale Distribuzioe ormale Tra le distribuzioi di frequeze, la distribuzioe ormale riveste u importaza cetrale. Essa ha ua forma a campaa ed è simmetrica rispetto all asse verticale che passa per il vertice (moda).

Dettagli

STATISTICA 1 ESERCITAZIONE 3

STATISTICA 1 ESERCITAZIONE 3 Frequeze STATISTICA 1 ESERCITAZIONE 3 Dott. Giuseppe Padolfo 20 Ottobre 2014 Esercizio 1 Costruire u grafico a barre e u diagramma a torta per la variabile Sesso rappresetata ella tabella seguete. Variabile

Dettagli

DISTRIBUZIONE NORMALE MULTIVARIATA

DISTRIBUZIONE NORMALE MULTIVARIATA Distribuzioe ormale uivariata DISTRIBUZIONE NORMALE MULTIVARIATA ANALISI MULTIVARIATA A.A. 00/ CORSO DI LAUREA IN STATISTICA Carla Rampichii Desità Normale μ, σ Normale stadardizzata: μ=0, σ= Distribuzioe

Dettagli

Formulazione del problema - 1

Formulazione del problema - 1 Formulazioe del problema - Date due variabili aleatorie X e Y si tratta di cercare ua relazioe lieare tra esse. Sappiamo già che se il modulo del coefficiete di correlazioe o vale esattamete, le determiazioi

Dettagli

Esperimentazioni di Fisica 1. Prova scritta del 1 febbraio 2016 SOLUZIONI

Esperimentazioni di Fisica 1. Prova scritta del 1 febbraio 2016 SOLUZIONI Esperimetazioi di Fisica 1 Prova scritta del 1 febbraio 2016 SOLUZIONI Esp-1 Prova di Esame Primo appello - Page 2 of 7 10/09/2015 1. (12 Puti) Quesito. La variabile casuale cotiua x ha ua distribuzioe

Dettagli

Corso di Statistica - Esercitazione 2

Corso di Statistica - Esercitazione 2 Corso di Statistica - Esercitazioe 2 Dott. Davide Buttarazzi d.buttarazzi@uicas.it Esercizio 1 La seguete tabella riporta dati relativi al giudizio espresso da alcui clieti sulla qualità dell ultimo modello

Dettagli

Intervalli di Fiducia

Intervalli di Fiducia di Fiducia Itroduzioe per la media Caso variaza ota per la media Caso variaza o ota per i coefficieti di regressioe per la risposta media i per i coefficieti i di regressioe multilieare - Media aritmetica

Dettagli

TEORIA DELLE MATRICI. dove aij K. = di ordine n, gli elementi aij con i = j (cioè gli elementi a 11

TEORIA DELLE MATRICI. dove aij K. = di ordine n, gli elementi aij con i = j (cioè gli elementi a 11 1 TEORIA DELLE MATRICI Dato u campo K, defiiamo matrice ad elemeti i K di tipo (m, ) u isieme di umeri ordiati secodo m righe ed coloe i ua tabella rettagolare del tipo a11 a12... a1 a21 a22... a2 A =.........

Dettagli

Lezione III: Variabilità. Misure di dispersione o di variabilità. Prof. Enzo Ballone. Lezione 3a- Misure di dispersione o di variabilità

Lezione III: Variabilità. Misure di dispersione o di variabilità. Prof. Enzo Ballone. Lezione 3a- Misure di dispersione o di variabilità Lezioe III: Variabilità Cattedra di Biostatistica Dipartimeto di Scieze Biomediche, Uiversità degli Studi G. d Auzio di Chieti Pescara Prof. Ezo Balloe Lezioe a- Misure di dispersioe o di variabilità Misure

Dettagli

Esercizi di Probabilità e Statistica

Esercizi di Probabilità e Statistica Esercizi di Probabilità e Statistica Samuel Rota Bulò 24 maggio 26 Desità e distribuzioi cogiute e codizioate. Covergeza e approssimazioe Esercizio Uo studio dice che l ivestimeto i titoli di stato, rappresetato

Dettagli

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Fodameti di Iformatica Ester Zumpao Programmazioe co Foglio di Calcolo Cei di Statistica Descrittiva Lezioe 3 Formule e Fuzioi Fuzioi Formule predefiite per il calcolo di espressioi matematiche complesse

Dettagli

Daniela Tondini

Daniela Tondini Daiela Todii dtodii@uite.it Facoltà di Medicia Veteriaria C.L. i Tutela e Beessere Aimale Uiversità degli Studi di Teramo Nella ricerca scietifica e tecologica è importate misurare la reale efficacia di

Dettagli

Esercitazione due: soluzioni

Esercitazione due: soluzioni Esercitazioe due: soluzioi. Sia il ricavo r i pk i ti, p, k, t i > applicado la defiizioe di media di Chisii il tempo medio t che lascia ivariato il ricavo totale é quel valore tale che pk i ti pk i t

Dettagli

Statistica Inferenziale Soluzioni 1. Stima puntuale

Statistica Inferenziale Soluzioni 1. Stima puntuale ISTITUZIONI DI STATISTICA A. A. 007/008 Marco Miozzo e Aamaria Guolo Laurea i Ecoomia del Commercio Iterazioale Laurea i Ecoomia e Ammiistrazioe delle Imprese Uiversità degli Studi di Veroa sede di Viceza

Dettagli

LA MISURA IN PSICOLOGIA

LA MISURA IN PSICOLOGIA Prof. Giulio Vidotto (Uiversità di Padova) Lez. 3 - Distribuzioe ormale e stadardizzazioe delle misure Argometi della lezioe Stadardizzazioe Distribuzioe Normale Distribuzioe Normale Stadard Stadardizzazioe

Dettagli

Corso di Statistica. Test per differenza tra medie e proporzioni. Prof.ssa T. Laureti a.a

Corso di Statistica. Test per differenza tra medie e proporzioni. Prof.ssa T. Laureti a.a Corso di Statistica Test per differeza tra medie e proporzioi Prof.ssa T. Laureti a.a. -3 Corso di Statistica a.a. -3 DEIM, Uiv.TUSCIA - Prof.ssa Laureti Test basati su campioi idipedeti proveieti da due

Dettagli

1. a n = n 1 a 1 = 0, a 2 = 1, a 3 = 2, a 4 = 3,... Questa successione cresce sempre piú al crescere di n e vedremo che {a n } diverge.

1. a n = n 1 a 1 = 0, a 2 = 1, a 3 = 2, a 4 = 3,... Questa successione cresce sempre piú al crescere di n e vedremo che {a n } diverge. Le successioi A parole ua successioe é u isieme ifiito di umeri disposti i u particolare ordie. Piú rigorosamete, ua successioe é ua legge che associa ad ogi umero aturale u altro umero (ache o aturale):

Dettagli

PRIMA PROVA INTERMEDIA DI STATISTICA (COD /6045/5047/4038/371/377) 21 ottobre 2015 COMPITO B

PRIMA PROVA INTERMEDIA DI STATISTICA (COD /6045/5047/4038/371/377) 21 ottobre 2015 COMPITO B FIRMA DELLO STUDENTE Cogome PRIMA PROVA INTERMEDIA DI STATISTICA (COD. 30001/6045/5047/4038/371/377) 21 ottobre 2015 Nome Numero di matricola Corso di Laurea Cod. corso COMPITO B Ai fii della valutazioe

Dettagli

Distribuzione normale o gaussiana

Distribuzione normale o gaussiana Distribuzioe ormale o gaussiaa Ua variabile radom si dice distribuita ormalmete (o secodo ua curva gaussiaa) se la sua fuzioe di desità di probabilità è del tipo: f () ( ) ep co - rappreseta il valore

Dettagli

1.5 - Variabilità, concentrazione e asimmetria

1.5 - Variabilità, concentrazione e asimmetria .5 - Variabilità, cocetrazioe e asimmetria G. Alleva - Statistica - Parte.5 Obiettivo: Misura della variabilità di ua distribuzioe statistica Mutabilità, Dispersioe, Variabilità, Eterogeeità E l attitudie

Dettagli

Nella seguente tabella sono riportati i dati relativi ai profitti delle società italiane del settore industriale dal 1971 al 1980:

Nella seguente tabella sono riportati i dati relativi ai profitti delle società italiane del settore industriale dal 1971 al 1980: Simulazioe prova d esame Esercizio 1 Nella seguete tabella soo riportati i dati relativi ai profitti delle società italiae del settore idustriale dal 1971 al 190: 1971 197 1973 1974 1975 1976 1977 197

Dettagli

Seconda Prova Intermedia 28 Maggio 2019 Elementi di Probabilità e Statistica, Laurea Triennale in Matematica, M. Romito, M.

Seconda Prova Intermedia 28 Maggio 2019 Elementi di Probabilità e Statistica, Laurea Triennale in Matematica, M. Romito, M. Secoda rova Itermedia 8 Maggio 09 Elemeti di robabilità e Statistica, Laurea Trieale i Matematica, 08-9 M. omito, M. ossi roblema 0. Sia X, Y ) ua v.a. a valori i co desità dove N è u parametro fissato.

Dettagli

Corso di Statistica - Esercitazione 1

Corso di Statistica - Esercitazione 1 Corso di Statistica - Esercitazioe 1 Dott. Davide Buttarazzi d.buttarazzi@uicas.it Esercizio 1 La seguete tabella riporta dati riguardati la produzioe di tastiere per computer risultate difettose. Causa

Dettagli

Popolazione e Campione

Popolazione e Campione Popolazioe e Campioe POPOLAZIONE: Isieme di tutte le iformazioi sul feomeo oggetto di studio Viee descritta mediate ua variabile casuale X: X ~ f x; = costate icogita Qual è il valore di? E verosimile

Dettagli

ALCUNI ESERCIZI SUI TEST DI IPOTESI PARAMETRICHE PARTE 1

ALCUNI ESERCIZI SUI TEST DI IPOTESI PARAMETRICHE PARTE 1 ALCUNI ESERCIZI SUI TEST DI IPOTESI PARAMETRICHE PARTE ESERCIZIO. Si vuole verificare l ipotesi, a livello di sigificatività α, che la media μ di ua variabile aleatoria X abbia u valore fissato μ. Si effettuao

Dettagli

Esercitazioni del Corso di Probabilitá e Statistica Lezione 6: Stime di parametri puntuali e per intervalli

Esercitazioni del Corso di Probabilitá e Statistica Lezione 6: Stime di parametri puntuali e per intervalli Esercitazioi del Corso di Probabilitá e Statistica Lezioe 6: Stime di parametri putuali e per itervalli Stefao Patti 1 19 geaio 005 Defiizioe 1 Ua famiglia di desitá f(, θ) ad u parametro (uidimesioale)

Dettagli

Campionamento casuale da popolazione finita (caso senza reinserimento )

Campionamento casuale da popolazione finita (caso senza reinserimento ) Campioameto casuale da popolazioe fiita (caso seza reiserimeto ) Suppoiamo di avere ua popolazioe di idividui e di estrarre u campioe di uità (co < ) Suppoiamo di studiare il carattere X che assume i valori

Dettagli

Esame di Statistica A-Di Prof. M. Romanazzi

Esame di Statistica A-Di Prof. M. Romanazzi 1 Uiversità di Veezia Esame di Statistica A-Di Prof. M. Romaazzi 12 Maggio 2014 Cogome e Nome..................................... N. Matricola.......... Valutazioe Il puteggio massimo teorico di questa

Dettagli

Programma della parte introduttiva: Lezione 4

Programma della parte introduttiva: Lezione 4 Programma della parte itroduttiva: Lezioe 4 Cap. 3 Presetazioe e cofroto tra misure Cap. 4 Propagazioe delle icertezze Cap 5 Misure ripetute e stimatori 1 Stimatori statistici Suppoiamo di aver sei misure,

Dettagli

COME CALCOLARE L INTERVALLO DI CONFIDENZA QUANDO E NECESSARIO STIMARE LA DEVIAZIONE STANDARD? (è quasi sempre così!)

COME CALCOLARE L INTERVALLO DI CONFIDENZA QUANDO E NECESSARIO STIMARE LA DEVIAZIONE STANDARD? (è quasi sempre così!) COME CALCOLARE L INTERVALLO DI CONFIDENZA QUANDO E NECESSARIO STIMARE LA DEVIAZIONE STANDARD? (è quasi sempre così!) Per fortua le cose o cambiao poi di molto visto che la uova variabile x µ s x co s x

Dettagli

Precorso di Matematica, aa , (IV)

Precorso di Matematica, aa , (IV) Precorso di Matematica, aa 01-01, (IV) Poteze, Espoeziali e Logaritmi 1. Nel campo R dei umeri reali, il umero 1 e caratterizzato dalla proprieta che 1a = a, per ogi a R; per ogi umero a 0, l equazioe

Dettagli

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento. N.B. Per la risoluzioe dei segueti esercizi, si fa riferimeto alle Tabelle riportate alla fie del documeto. Esercizio 1 I u villaggio turistico gli aimatori orgaizzao ua sfida. Vice u prazo i u ristorate

Dettagli

PROVA SCRITTA DI STATISTICA CLEA-CLEFIN-CLELI (COD e 4038) 15 gennaio 2003

PROVA SCRITTA DI STATISTICA CLEA-CLEFIN-CLELI (COD e 4038) 15 gennaio 2003 PROVA SCRITTA DI STATISTICA CLEA-CLEFIN-CLELI (COD. 5047 e 408) 5 geaio 00 SOLUZIONI Il uovo direttore di ua Baca di Credito Cooperativo si trova ad affrotare ua verteza di tipo sidacale che riguarda la

Dettagli

Le successioni: intro

Le successioni: intro Le successioi: itro Si cosideri la seguete sequeza di umeri:,, 2, 3, 5, 8, 3, 2, 34, 55, 89, 44, 233, detti di Fiboacci. Essa rappreseta il umero di coppie di coigli preseti ei primi 2 mesi i u allevameto!

Dettagli

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2013

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2013 PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 3 Prova scritta del 6//3 Esercizio Suppoiamo che ua variabile aleatoria Y abbia la seguete desita : { hx e 3/x, x > f Y (y) =, x, co h opportua costate positiva.

Dettagli

Quarto Compito di Analisi Matematica Corso di laurea in Informatica, corso B 5 Luglio Soluzioni. z 2 = 3 4 i. a 2 b 2 = 3 4

Quarto Compito di Analisi Matematica Corso di laurea in Informatica, corso B 5 Luglio Soluzioni. z 2 = 3 4 i. a 2 b 2 = 3 4 Quarto Compito di Aalisi Matematica Corso di laurea i Iformatica, corso B 5 Luglio 016 Soluzioi Esercizio 1 Determiare tutti i umeri complessi z tali che z = 3 4 i. Soluzioe. Scrivedo z = a + bi, si ottiee

Dettagli

Scrivere su ogni foglio NOME e COGNOME. Le risposte devono essere giustificate sui fogli protocollo e riportate nel foglio RISPOSTE.

Scrivere su ogni foglio NOME e COGNOME. Le risposte devono essere giustificate sui fogli protocollo e riportate nel foglio RISPOSTE. CORSO DI CALCOLO DELLE PROBABILITÀ (o modulo) - PROVA d esame del 6/06/200 - Laurea Quadrieale i Matematica - (Prof. Nappo) Scrivere su ogi foglio NOME e COGNOME. Le risposte devoo essere giustificate

Dettagli

Il Metodo dei Minimi Quadrati: Alcuni Esempi Svolti. Alessandro Zaccagnini

Il Metodo dei Minimi Quadrati: Alcuni Esempi Svolti. Alessandro Zaccagnini Il Metodo dei Miimi Quadrati: Alcui Esempi Svolti Alessadro Zaccagii alessadro.zaccagii@uipr.it 14 ottobre 5 Capitolo 1 Modelli lieari 1.1 Defiizioi Ricordiamo le defiizioi: soo date coppie di umeri reali

Dettagli

Lezioni del Corso di Fondamenti di Metrologia Meccanica

Lezioni del Corso di Fondamenti di Metrologia Meccanica Facoltà di Igegeria Lezioi del Corso di Fodameti di Metrologia Meccaica A.A. 005-006 Prof. Paolo Vigo Idice. Frequeza e Probabilità. 3. Curva di Gauss 4. Altre Distribuzioi Frequeza e Probabilità Me spiego:

Dettagli

Indipendenza tra due caratteri

Indipendenza tra due caratteri Idipedeza tra due caratteri Defiizioi: 1) due caratteri soo idipedeti se tra essi o esiste ua relazioe di causa ed effetto; 2) due caratteri soo idipedeti se la coosceza di ua modalità di uo dei due caratteri

Dettagli