ESERCITAZIONI DI STATISTICA BIOMEDICA

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "ESERCITAZIONI DI STATISTICA BIOMEDICA"

Transcript

1 ESERCITAZIONI DI STATISTICA BIOMEDICA ALCUNE NOTE SU R Matte Dell Omdarme agst 2012

2 Cpyright c 2012 Matte Dell Omdarme versin Permissin is granted t cpy, distribute and/r mdify this dcument under the terms f the GNU Free Dcumentatin License, Versin 1.3 r any later versin published by the Free Sftware Fundatin. A cpy f the license is available at:

3 Indice Intrduzine e ntazine 1 1 Statistica descrittiva e funzini di distribuzine Funzini statistiche Visualizzazini grafiche dei dati Istgrammi Esempi Rappresentazini bidimensinali Funzini di distribuzine Distribuzine binmiale Distribuzine di Pissn Distribuzine binmiale negativa Distribuzine nrmale Distribuzine χ Distribuzine t Distribuzine F Distribuzine nrmale multivariata Statistica classica: test t, test χ 2 e crrelazine Test t Test t a un sl campine Esempi Test t per dati appaiati Esempi Test t assumend eguale varianza Test t a varianza diversa Esempi Test χ Gdness-f-fit Esempi Tabelle di cntingenza Cnfrnt di una frequenza terica cn una sperimentale Esempi Test di McNemar Esempi Test di crrelazine Differenza fra cefficienti di crrelazine Esempi Crrelazine fra più variabili Esempi

4 3 Regressine lineare e nn lineare Regressine lineare semplice Analisi dei residui Intervall di cnfidenza della regressine Regressine multipla Esempi Test per l eliminazine di un predittre Trasfrmazine dei dati Trasfrmazini della variabile dipendente Esempi Minimi quadrati generalizzati Minimi quadrati pesati Esempi Esempi Autcrrelazine e serie temprali Varie frme di autcrrelazine Determinare l esistenza di autcrrelazine Esempi Regressine nn parametrica Kernel smthing Esempi Algritm di lisciament LOWESS Mdelli additivi generali Esempi Prjectin pursuit regressin (PPR) Esempi Regressine resistente e rbusta Regressine rbusta Esempi Regressine resistente Analisi della varianza ANOVA ANOVA a una via Esempi Test per l mgeneità delle varianze Cntrasti Cntrasti fra due gruppi: test di Tukey Cntrasti fra due gruppi: test di Dunnet Esempi Cntrasti multipli Esempi Esempi ANOVA a due vie senza repliche Esempi Efficienza del disegn a blcchi randmizzati Esempi ANOVA a due vie cn repliche Esempi Quadrati latini Disegni split-plt Prve ripetute Esempi ANCOVA

5 Esempi Mdelli randm e mdelli misti Esempi Mdell a effetti randm: due fattri Esempi Mdell a effetti misti Esempi Esempi Simulazine Mnte Carl per il calcl dei valri p Cnfrnti multipli: test di Tukey e mdelli mixed-effect MANOVA Analisi mediante MANOVA: il prcediment Esempi Metdi nn parametrici e ptenza dei test statistici Test di Klmgrv-Smirnv Test di Klmgrv-Smirnv a un sl campine Esempi Test di Klmgrv-Smirnv per due campini Esempi Metdi nn parametrici Test di Wilcxn Esempi Test di Kruskal-Wallis Test di Friedman Esempi Crrelazine nn parametrica Esempi Ptenza dei test statistici Ptenza di un test t Esempi Ptenza di un test χ Esempi Ptenza dell ANOVA Esempi Mdelli lineari generalizzati (GLM) Regressine lgistica Esempi Interpretazine dei cefficienti Esempi Intervall di cnfidenza della regressine lgistica Gdness-f-fit Analisi dei residui Regressine lgistica multipla Tabelle di classificazine Tecniche di valutazine della bntà di un mdell lgistic Calcl dei residui Plinmi frazinari e predittri cntinui Esempi Regressine lgistica multinmiale Regressine lgistica rdinale Esempi Regressine lgistica rdinale multipla

6 6.5 Regressine di Pissn e mdelli lg-lineari Mdelli lg-lineari e tabelle di cntingenza Esempi Analisi della spravvivenza Funzini di spravvivenza e di rischi Stime campinarie Cntrll delle variabili di cnfndiment Indipendenza del censring Numer limitat di dati censred Campine di dimensine sufficientemente grande Esempi Mdell di Cx di rischi prprzinale Calcl dei residui Esempi Test di rischi prprzinale Analisi multivariata: tecniche esplrative Analisi in cmpnenti principali (PCA) Esempi Cluster Analysis Algritmi gerarchici: distanze e dissimilarità Esempi Algritmi gerarchici: dendrgrammi Esempi Esempi Silhuette plt Esempi Cnfrnt di matrici di dissimilarità Esempi Algritmi di partizinament Esempi Scaling multidimensinale Analisi in crdinate principali Scaling multidimensinale Esempi Analisi della crrispndenza (CA) Esempi Detrending Esempi Interpretazine degli rdinamenti Esempi Analisi multivariata: metdi di classificazine Analisi discriminante lineare (LDA) Esempi Allcazine dei sggetti nelle classi Leave-ne-ut crss-validatin Alberi di classificazine Esempi Randm Frests Imprtanza delle variabili Esempi Reti neurali

7 Esempi Supprt vectr machines Cas di classi nn separabili Esempi Estensini della tecnica SVM Shrunken centrid Esempi Metdi di selezine di variabili Selezine di variabili: tecnica RFE Esempi Selezine di variabili: Randm Frests Esempi Stabilità del prcess di selezine delle variabili Significance Analysis f Micrarrays (SAM) Il prblema della mlteplicità Esempi Esempi Selezine delle variabili per mdelli lineari e GLM Prcedure di selezine Backward eliminatin Frward selectin Stepwise regressin Prcedure basate su criteri Esempi Alcuni prblemi degli algritmi di selezine autmatica Gestatistica Semivarigramma Esempi Validazine Mnte Carl di un varigramma Kriging Tipi di interplazine Kriging Kriging semplice Esempi Kriging rdinari Esempi Kriging universale Esempi Rivalidazine btstrap Gestatistica basata su mdell Funzini di crrelazine Stima dei parametri del mdell Esempi Mappe predittive basate su mdell Esempi Mdelli gestatistici lineari generalizzati Stime dei parametri per mdelli gestatistici lineari generalizzati Tecniche Bayesiane applicate a prblemi di Gestatistica Stima Bayesiana per i parametri di un mdell gaussian Esempi Stima Bayesiana per mdelli lineari generalizzati Esempi

8 11 Analisi genmica Bicnductr Frequenze dei nucletidi Esempi Trascrizine e traduzine di sequenze di DNA Mappe di restrizine Esempi Allineament di sequenze Evluzine di sequenze genetiche e allineament Scre di un allineament Esempi Esempi Tecniche btstrap e metdi Mnte Carl Applicazine: media campine Intervall di cnfidenza di un parametr Esempi Applicazine: regressine resistente Gibbs sampling Esempi Gibbs sampling e Statistica bayesiana Esempi A Una breve intrduzine ai cmandi di R 259 A.1 Perché usare R A.2... e perché nn usarl A.3 Le basi di R: l help A.4 Le basi di R: l assegnament A.5 Le basi di R: peratri e funzini A.6 Le basi di R: i vettri A.7 Le basi di R: le matrici A.8 Le basi di R: le liste A.9 Le basi di R: imprtare dati da un file A.10 Imprtare e mdificare una tabella di dati A.11 Le sequenze numeriche A.12 I fattri A.13 Estrarre e selezinare dati B GNU Free Dcumentatin License VERBATIM COPYING COPYING IN QUANTITY C Histry 271 Indice analitic 274 Bibligrafia 279

9 Intrduzine e ntazine Queste nte, sviluppate per le esercitazini del crs di Statistica Bimedica press la Scula Nrmale Superire di Pisa, intendn illustrare alcune delle ptenzialità di R, utilizzat cme strument di indagine statistica. L biettiv è quell di presentare varie tecniche e imparare ad adperarle nella pratica. Nel presentare il materiale si assume una cnscenza di base di R. Per una panramica generale sul linguaggi infrmazini specifiche sulla sintassi dei cmandi di base si rimanda al sit ufficiale della R Fundatin [44] accessibile all indirizz web: che mette a dispsizine, ltre al cdice srgente del prgramma, mlta dcumentazine. Nel crs del test, se nn diversamente specificat, si fa us della seguente ntazine: m: indica la media di un campine, csì m A è la media del campine A. s 2 : indica la varianza di un campine, csì s 2 A è la varianza del campine A. Il carattere indica la stima sul campine di un parametr teric, csì ˆβ è la stima campinaria del parametr β. Il simbl > è utilizzat cme prim carattere nelle linee che identifican un input frnit a R. Se il cmand è trpp lung per essere cntenut in una sla riga le righe di cntinuazine inizian cn il simbl +. [...]: indica una serie di istruzini di test che nn viene mstrata. 1

10 2

11 Capitl 1 Statistica descrittiva e funzini di distribuzine In quest capitl vengn intrdtte le funzini statistiche che permettn di estrarre da un set di dati infrmazini di riepilg quali la media, la varianza i quartili. Vengn pi presentati alcuni metdi grafici (mn e bidimensinali) cn cui è pssibile ispezinare le caratteristiche del campine in esame. Il capitl si chiude cn una breve panramica sulle funzini di distribuzine implementate in R di più cmune utilizz. 1.1 Funzini statistiche Dat un campine A, per calclarne la media, la varianza, la deviazine standard e la mediana si usan le seguenti funzini: > mean(a) > var(a) > sd(a) > median(a) La taglia di A, il valre massim e il minim si ttengn cn le chiamate: > length(a) > max(a) > min(a) La funzine summary genera un riepilg di sei statistiche calclate sul campine, ssia il minim, il prim quartile, la media, la mediana il terz quartile e il massim. Ad esempi, sul campine dei primi 20 numeri interi si ttiene il seguente utput: > A <- 1:20 # vettre cntenente i primi 20 numeri interi > summary(a) Min. 1st Qu. Median Mean 3rd Qu. Max Dati due campini A e B, la lr cvarianza e il cefficiente di crrelazine si ttengn cn le funzini: > cv(a, B) > cr(a, B) Se si hann dai dati classificati in base a un più fattri, la funzine table cnsente di cstruire una tabella di classificazine dei cnteggi per gni cmbinazine dei fattri in gic. Ad esempi, si cnsideri il fattre A a 4 livelli (da 0 a 3): 3

12 4 STATISTICA DESCRITTIVA E FUNZIONI DI DISTRIBUZIONE > A <- factr( c(0,0,0,0,1,1,2,2,2,2,2,2,2,3,3,3) ) Per cntare le ccrrenze di gnun dei livelli si usa la chiamata: > table(a) che frnisce in utput: A Se si hann due fattri, si cstruisce la tabella di cntingenza dei cnteggi cme nel cas seguente: > A <- factr( c(0,0,0,0,1,1,2,2,2,2,2,2,2,3,3,3) ) > B <- factr( c(0,1,0,0,1,1,1,1,0,0,1,1,1,1,0,1) ) > table(b, A) A B in cui i livelli del prim fattre vengn dispsti per riga e quelli del secnd per clnna. La funzine summary è mlt utile anche per riepilgare le infrmazini cntenute in un data frame cn più variabili. Cme esempi si cnsideri un set di dati della libreria standard MASS, relativ ai dati sulle eruzini del gayser Old Faithful del parc nazinale di Yellwstne (Wyming). I dati prvengn da un lavr di Azzalini e Bwman (Applied Statistics 39, , 1990). > library(mass) # carica la libreria MASS > data(geyser) # carica il dataset di nme geyser > geyser # visualizza i dati waiting duratin [...] Si tratta di 299 sservazini di due variabili: duratin che rappresenta la durata dell eruzine (in min) e waiting il temp di attesa fin alla successiva eruzine. Un riepilg rapid dei dati si può avere cn la chiamata: > summary(geyser) waiting duratin Min. : Min. : st Qu.: st Qu.: Median : Median : Mean : Mean : rd Qu.: rd Qu.: Max. : Max. : Visualizzazini grafiche dei dati Si cnsideri un campine di 200 numeri casuali estratti da una distribuzine χ 2 a 2 gradi di libertà: > A <- rchisq(200, 2)

13 1.2 Visualizzazini grafiche dei dati A Index Figura 1.1: Plt X Y e bx-and-whisker plt di 200 numeri a distribuzine χ 2 (2). Una prima analisi grafica può essere cndtta mediante un semplice plt X Y: > plt(a) che prduce l utput a sinistra in Fig Ulteriri infrmazini sulla distribuzine dei dati, sulla sua simmetria e sulla presenza di eventuali dati particlarmente distanti dalla media (utliers) pssn essere desunte sservand il diagramma a scatla cn baffi (bx-and-whisker plt): > bxplt(a) Il risultat, a destra in Fig. 1.1, mette in luce l asimmetria della distribuzine cn la presenza della lunga cda destra. Riprendend i dati relativi al geyser Old Faithful del parc nazinale di Yellwstne, presentati in Sec. 1.1, è pssibile evidenziare tendenze nelle distribuzini della durata e dei tempi di attesa fra due eruzini esaminand i bxplts delle due variabili. Per far ciò, e per disprre i due grafici fianc a fianc, si può dividere la finestra di utput grafic in 2 clnne per 1 riga cn la chiamata: > par(mfrw=c(1,2)) # divide la finestra grafica in 1 riga e 2 clnne I due grafici si prducn nel md seguente: > bxplt(geyser$waiting, xlab="waiting") > bxplt(geyser$duratin, xlab="duratin") L utput di Fig. 1.2 evidenzia che la distribuzine del temp di attesa è maggirmente simmetrica di quella della durata dell eruzine Istgrammi I metdi grafici finra presentati permettn di avere un rapid riepilg dei dati, ma nn di avere un idea della lr funzine di densità, la quale cnsente di mettere in luce eventuali cmprtamenti cme bimdalità simili. Per affrntare prblemi di quest genere si può ricrrere alla generazine di istgrammi di stime di kernel density. Sia A un campine di 120 numeri casuali di distribuzine nrmale standard: > A <- rnrm(120) # 120 num. casuali ~ N(0,1)

14 6 STATISTICA DESCRITTIVA E FUNZIONI DI DISTRIBUZIONE waiting duratin Figura 1.2: Bx-and-whisker plt dei tempi di attesa fra due eruzini del geyser Old Faithful del parc nazinale di Yellwstne e delle lr durate (in min). Per riepilgare i dati in istgramma è necessari calclare il numer di classi ( bin) statisticamente apprpriat. Dett numer si ttiene arrtndand all inter più vicin la radice quadrata del numer dei dati: > nclassi <- rund(sqrt(length(a))) Si cstruisce quindi il vettre delle classi in cui suddividere il range di A: > classi <- seq(min(a), max(a), length=nclassi+1) Si è fatt us della funzine seq, che accetta in quest specific esempi tre argmenti: gli estremi dell intervall e il numer di punti cn cui campinare reglarmente tale intervall. Il cmand per ttenere l istgramma è infine: > hist(a, breaks=classi) Oltre a riprtare i dati in istgramma presentand le frequenze asslute è pssibile presentare l istgramma delle frequenze relative: [...] > hist(a, breaks=classi, prb=true) Per variabili cntinue, una rappresentazine più sfisticata si può ttenere graficand la kernel density. Se si suppne di avere n sservazini x 1,...,x n l stmatre di kernel density è definit cme: ˆf h (x) = 1 nh K(h 1 (x x i ))) dve K è una funzine detta kernel e h un parametr dett bandwidth. La funzine K deve essere una funzine di densità simmetrica e centrata in 0; una scelta classica è la funzine gaussiana. La stima della densità ˆf h (x) in un punt x è dunque la media di n funzini di densità centrate nei punti sservati x i ; il parametr h regla la dispersine di queste densità. Per valri piccli di h avrann imprtanza sl i punti vicini a x i, mentre per h grande sarann rilevanti anche sservazini lntane. Un valre intermedi del parametr cnsente di mettere in luce l andament essenziale della funzine di densità da stimare. In R è pssibile far us della funzine density: > lines(density(a))

15 1.2 Visualizzazini grafiche dei dati 7 Histgram f A Histgram f A Density Density A A Figura 1.3: Istgramma ttenut dalla generazine 120 numeri casuali N(0, 1) cn svrappsta la kernel density (a destra). La chiamata alla funzine lines svrappne il grafic di kernel density all istgramma realizzat in precedenza. Se nn si specifica altrimenti, usand l pzine bw, la funzine density utilizza un algritm di ttimizzazine per determinare la larghezza di banda miglire (per ulteriri dettagli si veda la pagina di manuale relativa alla funzine density). Per rappresentare slamente la kernel density si usa il cmand plt al pst di lines. I risultati sn presentati in Fig Esempi I metdi presentati pssn essere applicati ai dati del geyser Old Faithful. Cme in precedenza si divide la finestra grafica in due parti: > par(mfrw=c(1,2)) quindi si generan l istgramma per i tempi d attesa fra due eruzini e la sua kernel density: > hist(geyser$waiting, prb=true, xlab="waiting") > lines(density(geyser$waiting), cl="red") a cui si affianca l equivalente grafic per la durata delle eruzini: > hist(geyser$duratin, prb=true, xlab="duratin") > lines(density(geyser$duratin), cl="red") L utput, in Fig. 1.4, evidenzia che le distribuzini di entrambe le variabili sn bimdali, risultat che nn si pteva evincere dall sservazine di Fig Rappresentazini bidimensinali La generalizzazine al cas di stime kernel density in due dimensini può essere ttenuta cn la funzine kde2d della libreria M ASS cme nell esempi seguente. Nel cas delle eruzini del geyser Old Faithful la stima kernel density cngiunta delle variabili durata e attesa si ttiene cn la chiamata: > f1 <- kde2d(duratin, waiting, n=50) La funzine accetta, ltre alle variabili da utilizzare, l pzine n che specifica il numer di punti da usare in gni direzine per arrivare alla stima della funzine di densità. La rappresentazine grafica dei punti e della kernel density, date in Fig. 1.5, pssn essere ttenute cn le chiamate:

16 8 STATISTICA DESCRITTIVA E FUNZIONI DI DISTRIBUZIONE Histgram f geyser$waiting Histgram f geyser$duratin Density Density waiting duratin Figura 1.4: Istgrammi e stime kernel density dei tempi di attesa fra due eruzini del geyser Old Faithful del parc nazinale di Yellwstne e delle lr durate (in min). > par(mfrw=c(1,2)) > plt(geyser$duratin, geyser$waiting, xlab = "duratin", ylab="waiting") > cntur(f1, xlab = "duratin", ylab="waiting") La funzine cntur realizza un grafic dett cntur plt. Tale funzine accetta mlte pzini, tra cui levels che permette di specificare un vettre cn i livelli in crrispndenza dei quali devn essere tracciati i cntrni. 1.3 Funzini di distribuzine R mette a dispsizine numerse funzini di distribuzine, sia discrete che cntinue. Tra le principali si ricrdan le seguenti Distribuzine binmiale È pssibile calclare la densità di prbabilità, la funzine di distribuzine e i quantili di una distribuzine binmiale tramite le tre funzini: dbinm(x, size, prb, lg = FALSE) pbinm(q, size, prb, lwer.tail = TRUE, lg.p = FALSE) qbinm(p, size, prb, lwer.tail = TRUE, lg.p = FALSE) L standard che R segue per le varie distribuzini è quell di identificare cn un nme la distribuzine (in quest casbinm) e farlprecedere dalle lettere d, p e q per identificare la densità, la distribuzine e i quantili. I primi tre argmenti delle funzini devn essere bbligatriamente specificati, mentre gli altri sn pzinali; se essi nn vengn inseriti R assume un valre preimpstat. Ad esempi l argment lg della funzine dbinm (che permette di ttenere il lgaritm delle prbabilità in lug delle prbabilità stesse) ha di default il valre FALSE. All stess scp serve l pzine lg.p (di default FALSE). Infine l pzine lwer.tail permette di scegliere fra i valri di prbabilità P(X <= x) (valre TRUE, impstat di default) e P(X > x) (valre FALSE). È pssibile fare un plt della densità della binmiale B(x,10,0.65) e della sua funzine di distribuzine nel md seguente:

17 1.3 Funzini di distribuzine 9 waiting waiting duratin duratin Figura 1.5: Grafic e stima kernel density cngiunta dei tempi di attesa fra due eruzini del geyser Old Faithful del parc nazinale di Yellwstne e delle lr durate (in min) p(x) x Figura 1.6: Istgramma della densità della distribuzine binmiale B(x, 10, 0.65) e della sua funzine di distribuzine. > barplt(dbinm(0:10,10,0.65), cl="grey", names.arg=0:10) > plt(0:10, pbinm(0:10, 10, 0.65), type="s", xlab="x", ylab="p(x)") La funzine barplt accetta vari argmenti fra cui il clre cn cui riempire le barre e le etichette (names.arg) da prre stt gni barra. Per la funzine plt l unic argment usat nell esempi è type che impsta un grafic a scala. I due plt sn mstrati in Fig Distribuzine di Pissn La prbabilità che un event casuale si verifichi x vlte quand in media si verifica lambda vlte è dat dalla distribuzine di Pissn. In R vi si accede cn: dpis(x, lambda, lg = FALSE) ppis(q, lambda, lwer.tail = TRUE, lg.p = FALSE) qpis(p, lambda, lwer.tail = TRUE, lg.p = FALSE) dve lambda identifica la media della distribuzine. Ad esempi il diagramma della distribuzine di Pissn cn media 2 si ttiene cn:

18 10 STATISTICA DESCRITTIVA E FUNZIONI DI DISTRIBUZIONE x Figura 1.7: Istgramma della densità della distribuzine di Pissn di media 2. > barplt(dpis(0:6,2), cl="lightgrey", names.arg=0:6, xlab="x") ed è presentat in Fig Distribuzine binmiale negativa Questa distribuzine permette di calclare la prbabilità che un numer di fallimenti x avvenga prima del success size in una sequenza di prve bernulliane per la quali la prbabilità del singl success è prb. dnbinm(x, size, prb, mu, lg = FALSE) pnbinm(q, size, prb, mu, lwer.tail = TRUE, lg.p = FALSE) qnbinm(p, size, prb, mu, lwer.tail = TRUE, lg.p = FALSE) Ad esempi la prbabilità che lanciand una mneta si ttenga la quinta testa prima della secnda crce è data da: > dnbinm(5, 2, 0.5) [1] dat che la prbabilità di ttenere crce sul singl lanci è Distribuzine nrmale Fra le distribuzini cntinue particlare imprtanza ha la distribuzine nrmale. dnrm(x, mean=0, sd=1, lg = FALSE) pnrm(q, mean=0, sd=1, lwer.tail = TRUE, lg.p = FALSE) qnrm(p, mean=0, sd=1, lwer.tail = TRUE, lg.p = FALSE) Cn vvia ntazine mean è la media della distribuzine e sd la sua deviazine standard. La distribuzine nrmale di media 0 e varianza 1 si dice standard e si indica cn la ntazine N(0,1) Distribuzine χ 2 La smma dei quadrati di n variabili casuali indipendenti N(0,1) è distribuita secnd una distribuzine χ 2 a n gradi di libertà.

19 1.3 Funzini di distribuzine 11 dchisq(x, df, ncp=0, lg = FALSE) pchisq(q, df, ncp=0, lwer.tail = TRUE, lg.p = FALSE) qchisq(p, df, ncp=0, lwer.tail = TRUE, lg.p = FALSE) df è il numer di gradi di libertà. È anche pssibile calclare la distribuzine di χ 2 nn centrale, specificand un valre psitiv per il parametr di nn centralità ncp. Per un esempi del su utilizz si veda la sezine Distribuzine t Il rapprt fra una variabile casuale nrmale standard e la radice di una variabile casuale χ 2 (n) divisa per n segue una distribuzine di t di Student a n gradi di libertà. dt(x, df, ncp=0, lg = FALSE) pt(q, df, ncp=0, lwer.tail = TRUE, lg.p = FALSE) qt(p, df, lwer.tail = TRUE, lg.p = FALSE) df rappresenta il numer di gradi di libertà. Specificand un valre psitiv per ncp si può calclare la distribuzine di t nn centrale Distribuzine F Il rapprt di due variabili casuali indipendenti distribuite rispettivamente χ 2 (df1) e χ 2 (df2), gnuna divisa per i rispettivi gradi di libertà, è distribuit secnd la distribuzine F a (df1, df2) gradi di libertà. df(x, df1, df2, lg = FALSE) pf(q, df1, df2, ncp=0, lwer.tail = TRUE, lg.p = FALSE) qf(p, df1, df2, lwer.tail = TRUE, lg.p = FALSE) df1 e df2 sn i gradi di libertà di numeratre e denminatre Distribuzine nrmale multivariata Per l studi di campini su cui sn misurate più variabili è spess necessari ricrrere alla funzine di distribuzine nrmale multivariata, generalizzazine della distribuzine nrmale in più dimensini. Si suppnga di misurare su un campine p variabili, tutte di distribuzine nrmale e fra lr indipendenti. Sia µ il vettre che cntiene le medie di dette variabili e Σ la lr matrice di cvarianza. La densità: g(x) = 1 (2π) p/2 Σ 1/2 exp[ 1 2 (x µ)t Σ 1 (x µ)], Σ = det(σ) (1.1) è detta densità nrmale multivariata. L iptesi di indipendenza tra le variabili è fndamentale in quant, se esse risultan tra lr dipendenti, è pssibile che una ad una sian nrmalmente distribuite, ma che nell insieme nn sddisfin l iptesi di nrmalità multivariata. Un classic esempi cinvlge le variabili X N(0,1) e Y csì definita: { X se X 1 Y = X se X < 1 in quest cas sia X che Y hann distribuzine nrmale, ma la lr distribuzine cngiunta nn è nrmale multivariata. La funzine di distribuzine nrmale multivariata è accessibile in R dp l installazine della libreria aggiuntiva mvtnrm, scaricabile dal sit della distribuzine [44]. Tale libreria implementa la funzine dmvnrm, che ritrna la densità di prbabilità nrmale multivariata e la funzine rmvnrm che permette di generare dati da una distibuzine specificata.

20 12 STATISTICA DESCRITTIVA E FUNZIONI DI DISTRIBUZIONE Ad esempi per valutare la densità nrmale multivariata nel punt x = (0,0) nel cas di due variabili di media µ = (1,1) cn matrice di cvarianza: ( ) Σ = si usa la chiamata: > library(mvtnrm) > Sigma <- matrix(c(1,0.5,0.5,1), nrw=2) # matrice di cvarianza > Sigma [,1] [,2] [1,] [2,] > dmvnrm(x=c(0,0), mean=c(1,1), sigma=sigma) [1] la funzine accetta tre argmenti: il punt in cui valutare la densità, il vettre delle medie delle variabili, la matrice di cvarianza delle variabili. Se si vlesse invece simulare un campine di 5 sservazini prvenienti dalla distribuzine cn i parametri dati in precedenza si ptrebbe usare la chiamata: > rmvnrm(n=5, mean=c(1,1), sigma=sigma) [,1] [,2] [1,] [2,] [3,] [4,] [5,] in quest cas il prim argment specifica la dimensine del campine da generare.

1. Lessicologia vs terminologia... 4 2. Lessico comune e lessico specialistico... 4 3. I linguaggi speciali... 6 4. Cenni storici... 6 5.

1. Lessicologia vs terminologia... 4 2. Lessico comune e lessico specialistico... 4 3. I linguaggi speciali... 6 4. Cenni storici... 6 5. 1. Lessiclgia vs terminlgia... 4 2. Lessic cmune e lessic specialistic... 4 3. I linguaggi speciali... 6 4. Cenni strici... 6 5. La nrmazine terminlgica... 7 6. Dalla lessicgrafia alla termingrafia, dai

Dettagli

(Fonte: Vademecum Nextville 2013, Efficienza energetica, gli incentivi per il risparmio energetico, le rinnovabili termiche e la cogenerazione )

(Fonte: Vademecum Nextville 2013, Efficienza energetica, gli incentivi per il risparmio energetico, le rinnovabili termiche e la cogenerazione ) CERTIFICATI BIANCHI (TITOLI DI EFFICIENZA ENERGETICA TEE) (Fnte: Vademecum Nextville 2013, Efficienza energetica, gli incentivi per il risparmi energetic, le rinnvabili termiche e la cgenerazine ) 1) MECCANISMO

Dettagli

GLI AMMORTIZZATORI SOCIALI

GLI AMMORTIZZATORI SOCIALI GLI AMMORTIZZATORI SOCIALI Ringraziamenti Diverse persne hann cntribuit a quest lavr. Tra queste ringrazi l Avv. Rsari Salnia, che nel nstr ambiente, è cnsiderat il miglir giuslavrista di Rma ed il su

Dettagli

La nuova Strategia Energetica Nazionale per un energia più competitiva e sostenibile DOCUMENTO PER CONSULTAZIONE PUBBLICA

La nuova Strategia Energetica Nazionale per un energia più competitiva e sostenibile DOCUMENTO PER CONSULTAZIONE PUBBLICA La nuva Strategia Energetica Nazinale per un energia più cmpetitiva e sstenibile DOCUMENTO PER CONSULTAZIONE PUBBLICA Settembre 2012 La Nuva Strategia Energetica Nazinale Premessa Il cntest nazinale e

Dettagli

Strategia Energetica Nazionale: per un energia più competitiva e sostenibile

Strategia Energetica Nazionale: per un energia più competitiva e sostenibile Strategia Energetica Nazinale: per un energia più cmpetitiva e sstenibile Marz 2013 Premessa Il cntest nazinale e internazinale di questi anni è difficile ed incert. La crisi ecnmica ha investit tutte

Dettagli

Materiale didattico per i laboratori di Modelli Statistici I 1

Materiale didattico per i laboratori di Modelli Statistici I 1 Materiale didattico per i laboratori di Modelli Statistici I 1 M. Chiogna, A. Salvan e N. Sartori Anno Accademico 2006-2007 1 Documento preparato con LATEX, Sweave e R 2.4.1 su i386-apple-darwin8.8.1 in

Dettagli

Chi è il soggetto che procede ad erogare il servizio di scambio sul posto? Quali sono i vantaggi di aderire al regime di scambio sul posto?

Chi è il soggetto che procede ad erogare il servizio di scambio sul posto? Quali sono i vantaggi di aderire al regime di scambio sul posto? Mdalità di access alla cnvenzine (13) Csa si intende per servizi di scambi sul pst? L scambi sul pst [Deliberazine ARG/elt 74/08, Allegat A Test integrat dell scambi sul pst (TISP)], è un meccanism che

Dettagli

PREMESSA PREMESSA PREMESSA PRE

PREMESSA PREMESSA PREMESSA PRE PREMESSA PREMESSA I Servizi via internet, cellulare e telefn le permettn di perare in md semplice e dirett cn la Banca, dvunque lei sia, a qualsiasi ra del girn, scegliend di vlta in vlta il canale che

Dettagli

Introduzione all analisi statistica con R

Introduzione all analisi statistica con R Introduzione all analisi statistica con R Riccardo Massari riccardo.massari@uniroma1.it 1 Introduzione 1.1 Generalità 1.1.1 Che cos è R R è un ambiente basato sul linguaggio S, per la gestione e l analisi

Dettagli

Introduzione alla statistica descrittiva con R

Introduzione alla statistica descrittiva con R Introduzione alla statistica descrittiva con R Dispensa per il corso Tecniche di Analisi di Dati I, Corso di Laurea Specialistica in Psicobiologia e Neuroscienze Cognitive, Università di Parma, 2013-2014.

Dettagli

Note sul linguaggio ed ambiente statistico

Note sul linguaggio ed ambiente statistico Note sul linguaggio ed ambiente statistico Dr. Luca Scrucca Dipartimento di Economia, Finanza e Statistica Sezione di Statistica Università degli Studi di Perugia luca@stat.unipg.it Questo documento fornisce

Dettagli

ANALISI DEI DATI CON SPSS

ANALISI DEI DATI CON SPSS STRUMENTI E METODI PER LE SCIENZE SOCIALI Claudio Barbaranelli ANALISI DEI DATI CON SPSS II. LE ANALISI MULTIVARIATE ISBN 978-88-7916-315-9 Copyright 2006 Via Cervignano 4-20137 Milano Catalogo: www.lededizioni.com

Dettagli

Carta dei Servizi CARTA DEI SERVIZI

Carta dei Servizi CARTA DEI SERVIZI CARTA DEI SERVIZI SERVIZIO RELATIVA AL TRASPORTO PUBBLICO LOCALE INDICE 1. Elenc mduli richiamati... 4 2. Riferimenti... 4 3. Scp e generalità... 5 4. Camp di applicazine... 5 5. Standard specifici...

Dettagli

Il primo documento internazionale per la definizione della sensibilitá al glutine

Il primo documento internazionale per la definizione della sensibilitá al glutine Il prim dcument internazinale per la definizine della sensibilitá al glutine Cnsensus Cnference n Gluten Sensitivity, Lndn 11/12 Februar 2011 Prfessr Alessi Fasan, M.D., Prfessr f Pediatrics, Medicine

Dettagli

1. Microsoft Power Point: costruire una presentazione

1. Microsoft Power Point: costruire una presentazione Dtt. Pal Mnella Labratri di Infrmatica Specialistica per Lettere Mderne 2 semestre, A.A. 2009-2010 Dispensa n. 3: Presentazini Indice Dispensa n. 3: Presentazini...1 1. Micrsft Pwer Pint: cstruire una

Dettagli

ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE

ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE Per gli studenti del 1 Anno della Facoltà di Agraria APPUNTI DALLE LEZIONI (A.A. 00/003) Andrea Onofri Dipartimento di Scienze Agroambientali e della

Dettagli

FUNZIONE CARATTERISTICA DI UN FENOMENO ALEATORIO

FUNZIONE CARATTERISTICA DI UN FENOMENO ALEATORIO B. DE FINETTI (Rma - ItaKa) FUNZIONE CARATTERISTICA DI UN FENOMENO ALEATORIO 1. - Scp di questa cmunicazine è di mstrare cme il metd deka funzine caratteristica ( l ), già csì vantaggisamente intrdtt neka

Dettagli

STATA. e la BIOSTATISTICA di Norman - Streiner. Prof. Pierpaolo Vittorini pierpaolo.vittorini@univaq.it

STATA. e la BIOSTATISTICA di Norman - Streiner. Prof. Pierpaolo Vittorini pierpaolo.vittorini@univaq.it e la BIOSTATISTICA di Norman - Streiner pierpaolo.vittorini@univaq.it Università degli Studi dell Aquila Facoltà di Medicina e Chirurgia 14 febbraio 2013 Contenuti e obiettivi Breve riassunto applicativo

Dettagli

REGOLAMENTO del CONCORSO A PREMI denominato Scopri l'azerbaijan e vinci un biglietto per Expo2015.

REGOLAMENTO del CONCORSO A PREMI denominato Scopri l'azerbaijan e vinci un biglietto per Expo2015. REGOLAMENTO del CONCORSO A PREMI denminat Scpri l'azerbaijan e vinci un bigliett per Exp2015. 1. SOCIETA PROMOTRICE Simmetric SRL Via V. Frcella 13, 20144 Milan P.IVA 05682780969 (di seguit la Prmtrice

Dettagli

Protocollo Operativo per la determinazione dei valori di fondo di metalli/metalloidi nei suoli dei siti d interesse nazionale

Protocollo Operativo per la determinazione dei valori di fondo di metalli/metalloidi nei suoli dei siti d interesse nazionale Agenzia per la Protezione dell Ambiente e per i Servizi Tecnici Istituto Superiore di Sanità Giugno 006 (Revisione 0) SOMMARIO 1 PREMESSA... 1 DEFINIZIONI... 1 3 INTRODUZIONE... 4 CRITERI GENERALI... 5

Dettagli

Il linguaggio R: concetti introduttivi ed esempi II edizione

Il linguaggio R: concetti introduttivi ed esempi II edizione Il linguaggio R: concetti introduttivi ed esempi II edizione settembre 2005 Vito M. R. Muggeo vmuggeo@dssm.unipa.it Giancarlo Ferrara ferrara@dssm.unipa.it v.mg e g.fr - R: concetti introduttivi ed esempi

Dettagli

STUDIO DEL MODELLO DI ISING SU GRAFI FRATTALI

STUDIO DEL MODELLO DI ISING SU GRAFI FRATTALI UNIVERSITÀ DEGLI STUDI DI PARMA FACOLTÀ DI SCIENZE MATEMATICHE, FISICHE E NATURALI CORSO DI LAUREA IN FISICA STUDIO DEL MODELLO DI ISING SU GRAFI FRATTALI Relatore: Correlatore: Dott. DAVIDE CASSI Dott.ssa

Dettagli

Laboratorio di Statistica con Excel

Laboratorio di Statistica con Excel Università di Torino QUADERNI DIDATTICI del Dipartimento di Matematica G. Peano MARIA GARETTO Laboratorio di Statistica con Excel Soluzioni Corso di Laurea in Biotecnologie A.A. 2009/2010 Quaderno # 46

Dettagli

Analisi di mercato II STATA TUTORIAL. Primi passi con STATA -Gestione dati, grafici e semplici modelli- Dott.ssa ELISA IEZZI elisa.iezzi@unibo.

Analisi di mercato II STATA TUTORIAL. Primi passi con STATA -Gestione dati, grafici e semplici modelli- Dott.ssa ELISA IEZZI elisa.iezzi@unibo. STATA TUTORIAL Primi passi con STATA -Gestione dati, grafici e semplici modelli- Dott.ssa ELISA IEZZI elisa.iezzi@unibo.it 1 Sommario ISTRUZIONI GENERALI...4 INTRODUZIONE... 4 Dove trovare STATA e i dati

Dettagli

Filomena Maggino, L analisi dei dati nell indagine statistica. Volume 1: la realizzazione dell indagine e l analisi preliminare dei dati, ISBN:

Filomena Maggino, L analisi dei dati nell indagine statistica. Volume 1: la realizzazione dell indagine e l analisi preliminare dei dati, ISBN: Filomena Maggino, L analisi dei dati nell indagine statistica. Volume 1: la realizzazione dell indagine e l analisi preliminare dei dati, ISBN: 88-8453-208-6 (print) ISBN: 88-8453-207-8 (online), Firenze

Dettagli

Documento approvato dalla Commissione di studio per le norme relative ai materiali stradali e progettazione, costruzione e manutenzione strade del CNR

Documento approvato dalla Commissione di studio per le norme relative ai materiali stradali e progettazione, costruzione e manutenzione strade del CNR MINISTERO DELLE INFRASTRUTTURE E DEI TRASPORTI SISTEMI DI REGOLAZIONE DEL TRAFFICO LINEE GUIDA Documento approvato dalla Commissione di studio per le norme relative ai materiali stradali e progettazione,

Dettagli

Q-DAS S.R.L. D - 69469 Weinheim Via San Martino, 31

Q-DAS S.R.L. D - 69469 Weinheim Via San Martino, 31 Esempi Copyright 2003 Q-DAS GmbH Q-DAS S.R.L. Eisleber Str. 2 25025 Manerbio (BS) D - 69469 Weinheim Via San Martino, 31 Germany Italia Tel.: ++49/6201/3941-0 Tel.: ++39/030 9382176 Fax: ++49/6201/3941-24

Dettagli

3. TEORIA DELL INFORMAZIONE

3. TEORIA DELL INFORMAZIONE 3. TEORIA DELL INFORMAZIONE INTRODUZIONE MISURA DI INFORMAZIONE SORGENTE DISCRETA SENZA MEMORIA ENTROPIA DI UNA SORGENTE NUMERICA CODIFICA DI SORGENTE 1 TEOREMA DI SHANNON CODICI UNIVOCAMENTE DECIFRABILI

Dettagli

Da una a più variabili: derivate

Da una a più variabili: derivate Da una a più variabili: derivate ( ) 5 gennaio 2011 Scopo di questo articolo è di evidenziare le analogie e le differenze, relativamente al calcolo differenziale, fra le funzioni di una variabile reale

Dettagli

Matematica B - a.a 2006/07 p. 1

Matematica B - a.a 2006/07 p. 1 Matematica B - a.a 2006/07 p. 1 Definizione 1. Un sistema lineare di m equazioni in n incognite, in forma normale, è del tipo a 11 x 1 + + a 1n x n = b 1 a 21 x 1 + + a 2n x n = b 2 (1) = a m1 x 1 + +

Dettagli