R - seconda lezione. 1 Simulazione e rappresentazioni grafiche in R
|
|
|
- Beniamino Battista Scognamiglio
- 9 anni fa
- Visualizzazioni
Transcript
1 R - seconda lezione 1 Simulazione e rappresentazioni grafiche in R R contiene funzioni interne che fanno riferimento a distribuzioni note. Relativamente a una fissata distribuzione, possiamo valutarne la distribuzione cumulata o la densità, o uno o più quantili, oppure generare k realizzazioni indipendenti da tale distribuzione. Vedremo come disegnare funzioni di ripartizione e di densità, tramite curve o grafici a bastoncino e come rappresentare le distribuzioni empiriche di vettori di dati simulati tramite istogrammi e grafici a bastoncino. 1.1 Generazione di campioni i.i.d. da distribuzioni note Per ognuna delle distribuzioni viste a lezione (e per tante altre), R puo generare un valore casuale dalla distribuzione prescelta, o calcolare la densita (o la massa di probabilita ) in un punto, la funzione di ripartizione, i quantili di livello q in [0,1]. Ogni distribuzione e contraddistinta da un nome mnemonico, e ciascuna delle funzioni sopra indicate viene individuata tramite un prefisso che va ad aggiungersi al nome della distribuzione, come di seguito elencato: d - densita p - funzione di ripartizione q - quantile r - numero casuale dalla distribuzione prescritta Esempi: dbinom(),rexp(),qnorm(). Ad esempio, per la distribuzione normale standardizzata abbiamo le seguenti funzioni: dnorm(x) calcola il valore della densita N(0,1) in x Oss: dnorm(x)=dnorm(x,mean=0,sd=1) 1
2 pnorm(x) calcola il valore della funzione di ripartizione in x. qnorm(a) calcola il quantile di livello a rnorm(n) genera un campione di dimensione n da una normale standard. Naturalmente rnorm(100,10,1) genera 100 realizzazioni indipendenti da una distribuzione N(10,1). Distribuzioni disponibili: Distrib. Nome R Parametri Defaults beta beta shape1, shape2,ncp binomial binom size, prob Cauchy cauchy location, scale 0,1 chi-squared chisq df, ncp exponential exp rate 1 F f df1, df1, ncp gamma gamma shape, scale scale=1 geometric geom prob hypergeometric hyper m, n, k log-normal lnorm meanlog, sdlog 0,1 logistic logis location, scale 0,1 neg. binomial nbinom size, prob normal norm mean, sd 0,1 Poisson pois lambda Student t t df, ncp uniform unif min, max 0,1 Weibull weibull shape, scale scale= Per vedere l andamento della funzione di ripartizione di una normale: a) standard > x <- seq(-5,5,length=100) > ripx <- pnorm(x) > plot(x, ripx, type="l") b) di media 2 e varianza > ripx1 <- pnorm(x, 2, 0.5) > lines(x, ripx1, col=2) #questo comando AGGIUNGE un grafico al precedente 2
3 il comando > points(x, ripx1, type="l",col=2) ha lo stesso effetto del precedente. La probabilita di ottenere valori fra 1 e 3 per una normale standard e : > pnorm(3) - pnorm(1) La stessa probabilita per una normale di media 2 e varianza (0.5) 2 e invece: > pnorm(3,2,0.5) - pnorm(1,2,0.5) Per disegnare un diagramma a bastoncini per la distribuzione binomiale di parametri n=15 e p=0.8, e, successivamente, n=50, p=0.8. Sovrappone a questo grafico la curva di una densità normale con media e varianza adeguate (meanbin,sdbin ). > x <- 0:15 > y <- dbinom(x,15,0.8) > plot(x,y,type= h ) > points(x,y,pch=20) > title( Distribuzione Binomiale-n=15,p=0.8 ) aggiungiamo la curva della densita normale: > x1 <- seq(0,15,0.1) > lines(x1,dnorm(x1,meanbin,sdbin),col=2) facciamo aumentare n: > x <- 0:50 > y <- dbinom(x,50,0.8) > plot(x,y,type= h ) > points(x,y,pch=20) > title( Distribuzione Binomiale-n=50,p=0.8 ) aggiungiamo la curva della densita normale: > x1 <- seq(0, 50, 0.1) > lines(x1,dnorm(x1,meanbin,sdbin),col=2) La probabilita sotto la binomiale con n=15 e p=0.8 di ottenere un numero di successi minore o uguale a 2 e 3
4 > pbinom(2,15,0.8) ovvero > dbinom(0,15,0.8) + dbinom(1,15,0.8) + dbinom(2,15,0.8) Se fossimo interessati a 7 realizzazioni indipendenti di una variabile con distribuzione di Poisson di parametro λ = 2: > rpois(7,2) eccetera Campionamento da urne o popolazioni finite Il comando sample() permette di estrarre (con o senza reinserimento) un certo numero di valori da un insieme prefissato. Per generare i possibili risultati di 10 lanci di un dado equilibrato, possiamo fare cosi : > sample(1:6,10,replace=t) Possiamo anche creare un urna con 4 palline bianche e 3 nere: > urn <- c( b1, b2, b3, b4, n1, n2, n3 ) Estraiamo due palline senza reinserimento: > sample(urn,2) con reinserimento: a> sample(urn,2,replace=t) Confronto fra distribuzioni empiriche e teoriche Per vedere l accostamento di variabili discrete a modelli teorici di riferimento, usiamo un metodo grafico. Esempio 1: generiamo 100 dati da una Poisson di parametro λ = 2. > x <- rpois(100,2) Il comando table() ci da la distribuzione delle frequenze assolute; quindi otteniamo le frequenze relative con il comando: 4
5 > x <- rpois(100,2) > relfreq <- table(x)/100 > relfreq x attr(,"class") [1] "table" > names(relfreq) [1] "0" "1" "2" "3" "4" "5" "6" "8" > as.numeric(names(relfreq)) [1] > as.numeric(relfreq) [1] Per il grafico della distribuzione di frequenze relative (diagramma a bastoncini): > plot(as.numeric(relfreq),type="h") Dal momento che alcuni valori potrebbero avere frequenza nulla (nel caso del nostro esempio, 8), è senz altro meglio operare diversamente, come indicato di seguito: > plot(as.numeric(names(relfreq)),relfreq, type="h") > points(as.numeric(names(relfreq)),relfreq, pch=20) Nota: as.numeric(x) fornisce la versione numerica di x. Nel caso esaminato, ad esempio, names(relfreq) è una variabile alfanumerica, e as.numeric(names(relfreq) la rende numerica, il che ci consente di utilizzarla per rappresentare le ascisse del grafico. Per confrontare la distribuzione empirica con quella teorica di una Poisson di parametro lambda=2, salviamo la probabilita di ottere 0,1,2,3,4,...,8 sotto una Poisson(2) > prob <- dpois(0:8,2) Quindi confrontiamo le frequenze relative empiriche con le probabilita teoriche. Per effettuare il confronto grafico: > lines((0:8)+0.1, prob,lty=4,type="h",col=2) > points((0:8)+0.1, prob,pch=3,col=2) Esempio 2: Ripetiamo ora lo stesso procedimento per una variabile esponenziale negativa di parametro lambda=2 5
6 > x <- rexp(1000,2) > mean(x) [1] Dato che si tratta di una variabile continua, possiamo rappresentare le frequenze osservate attraverso un istogramma, con il comando hist(x). Per ottenere l istogramma delle frequenze relative aggiungiamo l opzione prob=t : > hist(x,prob=t,nclass=15) Sovrapponiamo la densita esponenziale di parametro 2: > xexp <- seq(0,30,0.1) > yexp <- dexp(xexp,2) > lines(xexp,yexp) Per un confronto grafico tra le distribuzioni possiamo anche utilizzare i comandi qqplot() e qqpoints() come si vedrà nel seguito. 6
distribuzioni teoriche di probabilità
distribuzioni teoriche di probabilità cosa sono distribuzione teorica di probabilità un modello del processo che genera i dati specifica la densità di probabilità associata ad ogni possibile valore assunto
STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione2: 04-03-2005
esercitazione 2 p. 1/12 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione2: 04-03-2005 Luca Monno Università degli studi di Pavia [email protected] http://www.lucamonno.it
INTRODUZIONE A R Lezione 3
INTRODUZIONE A R Lezione 3 Silvia Bacci e Silvia Pandolfi 1 Creare grafici in R R consente di realizzare, con semplicità, grafici di qualità professionale. Questi sono poi esportabili come file in numerosi
Distribuzioni univariate in MINITAB
Distribuzioni univariate in MINITAB 97 Distribuzioni univariate in MINITAB 6.1 Uso delle distribuzioni univariate in MINITAB MINITAB può essere usato come calcolatore di tavole. MINITAB può, infatti, calcolare
Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza
XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6
1.1 Obiettivi della statistica Struttura del testo 2
Prefazione XV 1 Introduzione 1.1 Obiettivi della statistica 1 1.2 Struttura del testo 2 2 Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati 5 2.2 Distribuzioni di frequenza
Laboratorio di Statistica 1 con R Esercizi per la Relazione. I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati
Laboratorio di Statistica 1 con R Esercizi per la Relazione I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati nel corso. Esercizio 1. 1. Facendo uso dei comandi
PROBABILITÀ - SCHEDA N. 3 VARIABILI ALEATORIE CONTINUE E SIMULAZIONE
PROBABILITÀ - SCHEDA N. 3 VARIABILI ALEATORIE CONTINUE E SIMULAZIONE (da un idea di M. Impedovo Variabili aleatorie continue e simulazione Progetto Alice n. 15, ) 1. La simulazione Nelle schede precedenti
LABORATORIO DI PROBABILITA E STATISTICA
UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi Corso di laurea in Informatica e Bioinformatica 6 VARIABILI ALEATORIE CONTINUE z LA VARIABILE NORMALE Esempio
Funzioni di probabilità con Matlab
Funzioni densità di probabilità e distribuzioni cumulative - Introduzione: Riepilogo Concetti Teoria - Distribuzioni densità di probabilità con - Distribuzioni cumulative - Inverse distribuzioni cumulative
Tenendo conto che la funzione di probabilità per una v.c. binomiale X è definita dalla seguente notazione
APPENDICE I. TAVOLE STATISTICHE Si ribadisce al lettore che in questa Appendice si riportano le procedure di Excel e di R.2.12.1 che gli permettono di trovare qualsiasi valore di probabilità cercato e
Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)
Prova scritta di STATISTICA CDL Biotecnologie (Programma di Massimo Cristallo - A) 1. Un associazione di consumatori, allo scopo di esaminare la qualità di tre diverse marche di batterie per automobili,
Variabili aleatorie. continue. Discreto continuo
Variabili aleatorie continue Discreto continuo.18 Uniforme discreta, n=11 n=21 n=11 n=6 n=51 n=51 Uniforme.16.14.12.1.8.6?.4.2 1 1 2 2 3 3 4 4 5 5 6 6 7 7 Per passare dal modello discreto al modello continuo
Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano
Corso di STATISTICA EGA - Classe 1 aa 2017-2018 Docenti: Luca Frigau, Claudio Conversano Il corso è organizzato in 36 incontri, per un totale di 72 ore di lezione. Sono previste 18 ore di esercitazione
Generazione di Numeri Casuali- Parte 2
Esercitazione con generatori di numeri casuali Seconda parte Sommario Trasformazioni di Variabili Aleatorie Trasformazione non lineare: numeri casuali di tipo Lognormale Trasformazioni affini Numeri casuali
LEZIONE 2.5. corso di statistica. Francesco Lagona Università Roma Tre. LEZIONE 2.5 p. 1/12
LEZIONE 2.5 p. 1/12 LEZIONE 2.5 corso di statistica Francesco Lagona Università Roma Tre LEZIONE 2.5 p. 2/12 distribuzione doppia di due variabili aleatorie consideriamo la distribuzione doppia di due
CALCOLO DELLE PROBABILITÀ - 9 giugno 1998 Scrivere le risposte negli appositi spazi Motivare dettagliatamente le risposte su fogli allegati
CALCOLO DELLE PROBABILITÀ - 9 giugno 1998 1. Dati gli eventi A,B,C, ognuno dei quali implica il successivo, e tali che P (A) è metà della probabilità di B, che a sua volta ha probabilità metà di quella
Lezione 12. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 12. A. Iodice.
discrete uniforme Bernoulli Poisson Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 56 Outline discrete uniforme Bernoulli Poisson 1 2 discrete 3
PROBABILITÀ ELEMENTARE
Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti
Statistica. Esercitazione 10. Alfonso Iodice D Enza [email protected]. Università degli studi di Cassino. Statistica. A. Iodice. V.C.
uniforme Bernoulli binomiale di Esercitazione 10 Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () 1 / 55 Outline uniforme Bernoulli binomiale di 1 uniforme 2 Bernoulli 3 4
DISTRIBUZIONI DI PROBABILITA
DISTRIBUZIONI DI PROBABILITA Nell associare ai risultati di un esperimento un valore numerico si costruisce una variabile casuale (o aleatoria, o stocastica). Ogni variabile casuale ha una corrispondente
DALLA POPOLAZIONE AL CAMPIONE: IL CALCOLO DI PROBABILITÁ
DALLA POPOLAZIONE AL CAMPIONE: IL CALCOLO DI PROBABILITÁ Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia Versione on-line: http://www.unipg.it/ onofri/rtutorial/index.html
Prova di recupero di Probabilità e Statistica - A * 21/04/2006
Prova di recupero di Probabilità e Statistica - A * /04/006 (NB: saranno prese in considerazione solo le risposte adeguatamente motivate) tempo di lavoro: Due ore. Per conseguire la patente di guida, un
Variabili casuali. - di Massimo Cristallo -
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 16 e 27 maggio 2013 - di Massimo Cristallo - Variabili casuali
Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva
Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.
Variabili casuali ad una dimensione Testi degli esercizi. Variabili casuali ad una dimensione a.a. 2012/2013 1
Variabili casuali ad una dimensione Testi degli esercizi 1 Costruzione di variabile casuale discreta Esercizio 1. Sia data un urna contenente 3 biglie rosse, 2 biglie bianche ed una biglia nera. Ad ogni
PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE
PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE 1. Distribuzione congiunta Ci sono situazioni in cui un esperimento casuale non si può modellare con una sola variabile casuale,
Indice. L Editore ringrazia. Ringraziamenti. Autori. Prefazione. Obiettivi formativi XIII XVII
Indice XI XI XIII XV XVII L Editore ringrazia Ringraziamenti Autori Prefazione Obiettivi formativi XIX Istruzioni per gli studenti XIX Un po di storia XX Cosa è la Statistica XXI Come usare questo libro
LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi
UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 5 VARIABILI CASUALI DISCRETE LA VARIABILE BINOMIALE Sia n N e sia k n. La probabilità di osservare k successi
Teorema del limite centrale TCL
Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazione lineare di N variabili aleatorie le cui funzioni
Calcolo delle Probabilità e Statistica, Ingegneria Civile e A&T e Informatica I prova finale a.a. 2016/17
Calcolo delle Probabilità e Statistica, Ingegneria Civile e A&T e Informatica I prova finale aa 6/ Punteggi: : 3 + 6; : + + + ; 3: + Una scatola contiene monete; 8 di queste sono equilibrate, mentre le
PROBABILITA. Distribuzione di probabilità
DISTRIBUZIONI di PROBABILITA Distribuzione di probabilità Si definisce distribuzione di probabilità il valore delle probabilità associate a tutti gli eventi possibili connessi ad un certo numero di prove
Distribuzioni di Probabilità
Distribuzioni di Probabilità Distribuzioni discrete Distribuzione uniforme discreta Distribuzione di Poisson Distribuzioni continue Distribuzione Uniforme Distribuzione Gamma Distribuzione Esponenziale
