Esercizi vari sulle schede di statistica

Documenti analoghi
Esercizio 1. Trovare un intervallo della distribuzione di COR che contenga il 95% dell'area.

Variabili aleatorie discrete. Giovanni M. Marchetti Statistica Capitolo 5 Corso di Laurea in Economia

Scheda n. 13: modelli lineari

Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza

Dispensa di Statistica

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

REGRESSIONE E CORRELAZIONE

Esercitazioni di Statistica

Calcolo delle Probabilità 2

Probablità, Statistica e Processi Stocastici

PROBABILITÀ SCHEDA N. 7 LA VARIABILE ALEATORIA NORMALE

MMMPG 2008/09 Registro delle lezioni

Statistica Corso di laurea in Biotecnologie I esonero - 19 aprile 2010

Laboratorio di Probabilità e Statistica

Soluzione di alcuni esercizi di statistica con R

Generazione di Numeri Casuali- Parte 2

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3

Università degli studi di Udine - Sede di Pordenone

Laboratorio di Statistica 1 con R Esercizi per la Relazione. I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati

Test delle Ipotesi Parte I

Brevi richiami su variabili aleatorie e processi stocastici

Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazion

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Variabile aleatoria vettoriale

STATISTICA. Esercitazione 5

Elaborazione statistica di dati

Cognome e Nome:... Corso di laurea:...

Computazione per l interazione naturale: fondamenti probabilistici (2)

docente: J. Mortera/P. Vicard Nome

Calcolo delle probabilità (3/7/2001) (Ing. Elettronica, Informatica, Telecomunicazioni - Latina)

Compiti tematici capp. 5,6

Esame di AM2 & EAP (270/04) a.a. 2009/10

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

Argomenti della lezione:

Metodi e Modelli Matematici di Probabilità per la Gestione Prova scritta 12/01/2009

Probabilità e Statistica Prova del 17/02/2017 Traccia A TEORIA Università degli Studi di Verona Laurea in Informatica e Bioinformatica A.A.

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

ZIBALDONE DEL CORSO DI STATISTICA A Di

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.

Matematica e Statistica per Scienze Ambientali

Variabili casuali multidimensionali

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Facoltà di ECONOMIA Università di Pavia 20 Aprile 2004 Prova scritta di Analisi dei dati MODALITÀ A

PROBABILITÀ SCHEDA N. 3 VARIABILI ALEATORIE BINOMIALE E NORMALE. 1. La variabile aleatoria di Bernoulli e la variabile aleatoria binomiale

Scritto del

Probabilità e Statistica Prova del 29/07/2016 Traccia E TEORIA Università degli Studi di Verona Laurea in Informatica e Bioinformatica A.A.

Statistica II Laurea magistrale in Ing. Gestionale a.a. 2012/13 Esempi di domande brevi. 1. Definizione di quantile gaussiano standard

STATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I

Esercizi su Regressione e Connessione

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:

Esercizi di statistica

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.

Statistica ARGOMENTI. Calcolo combinatorio

esperimento casuale: è un esperimento condotto sotto l effetto del caso; evento elementare: ciascuno dei possibili esiti di un esperimento casuale;

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:

COGNOME.NOME...MATR..

STATISTICA A K (60 ore)

Metodi di Monte Carlo: un'applicazione

Metodi e Modelli Matematici di Probabilità per la Gestione Prova scritta 12/6/2010

Distribuzioni e inferenza statistica

Probabilità e Statistica

Variabile Casuale Normale

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica

Regressione lineare semplice

Ulteriori Conoscenze di Informatica e Statistica

Esercitazione del

L analisi dei dati. Primi elementi. EEE- Cosmic Box proff.: M.Cottino, P.Porta

Variabili casuali multidimensionali

1! 4! = 5. Quindi la probabilità di ottenere 1 successo su 5 lanci sarà 5 2 = 5! 2! 3! = 10

Risultati X P(X) TTT 0 1/8 TTC 1 1/8 TCT 1 1/8 CTT 1 1/8 TCC 2 1/8 CTC 2 1/8 CCT 2 1/8 CCC 3 1/8 X P(X) F(X) 0 1/8 1/8 1 3/8 4/8 2 3/8 7/8 3 1/8 1

Statistica I, Laurea triennale in Ingegneria Gestionale, a.a. 2017/18

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

Costruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini. Lezione 7: Basi di statistica

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010

Metodi e Modelli Matematici di Probabilità per la Gestione Prova scritta 15/12/2008 Compito B

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo

Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica (269AA) A.A. 2017/18 - Prova scritta

Elaborazione statistica di dati

Probablità, Statistica e Processi Stocastici

ELEMENTI DI STATISTICA

Statistica. Capitolo 6. Variabili Aleatorie Continue e Distribuzioni di Probabilità. Cap. 6-1

Distribuzioni di probabilità

Esame di Statistica del 1 settembre 2004 (Corso di Laurea in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola

RICHIAMI DI STATISTISTICA E CALCOLO DELLE PROBABILITA

La distribuzione delle frequenze. T 10 (s)

LE VARIABILI CASUALI A 1, A 2.,..., A k., p 2.,..., p k. generati da una specifica prova sono necessari ed incompatibili:

1. Siano A, E eventi incompatibili, e sia B E, con P (A) = 1 5, P (B) = 3 10, P (E) = 1 2.

Statistica descrittiva in due variabili

Approssimazione numerica

STATISTICA. Esercitazione 6

La legge di Gauss degli errori come limite di una binomiale

V.a. continue. Statistica e biometria. D. Bertacchi. Le v.a. continue. Uniforme. Normale. Indipendenza di v.a. continue

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

Scheda n. 7: primi elementi sui legami tra più variabili

Probabilità e Statistica

Statistica. Alfonso Iodice D Enza

Transcript:

Esercizi vari sulle schede di statistica December 4, 2008 1 Introduzione Nelle prove scritte ci sarà un esercizio relativo alla parte di statistica e la sua implementazione con R. Tale parte dello scritto sarà ispirata agli esercizi dati nelle schede: si tratterà di saper svolgere esercizi dello stesso tipo. Per avere altri esempi del tutto simili, si possono vedere gli esercizi enunciati qui di seguito. Le schede 5, 6, 7 erano però prive di esercizi, che sono qui formulati per la prima volta e costituiscono materia per le varie prove scritte (inclusi i compitini). Per le schede 8, 9, 10, oltre che gli esercizi presentati in esse, valgono le domande poste come homework su PCA (secondo homework). 2 Prime schede I seguenti esercizi sono riferiti all uso del programma R e sono relativi alle prime 4 schede. Exercise 1 Come si traccia il grafico di una gaussiana di media 5 e varianza 9? E della sua funzione di distribuzione cumulativa? Come si calcola il quantile di ordine 0.05? Exercise 2 Come si traccia il grafico di una Beta di parametri 9 e 15? E della sua funzione di distribuzione cumulativa? Come si calcola il quantile di ordine 0.95? Exercise 3 Data una v.a. X discreta, che assume solo i valori k = 0,..., 10 con probabilità p 0,..., p 10, come si calcolano i numeri P (X k) 1

al variare di k = 0,..., 10? Exercise 4 Data la serie storica 15, 21, 19, 25, 26, 29, 34, 32, 36, 35, 36 come se ne può raffigurare il grafico? Come si può trovare una retta che passa più vicino possibile a questi punti e tracciarla sullo stesso grafico? (questa seconda domanda richiede le cose spiegate nel prossimo paragrafo.) Exercise 5 Generare 1000 numeri casuali gaussiani di media 0 e varianza 1. Data una v.a. X N (0, 1), generare 1000 numeri casuali associati alla v.a. Y = X 2 e rappresentarli graficamente. Exercise 6 Come si traccia il grafico della funzione se X è una v.a. X N (5, 7)? f (t) = P (X > t) Exercise 7 Dato un generico numero reale µ, sia X una v.a. X N (µ, 1) e sia q (µ) il suo quantile di ordine 0.95, cioè il numero tale che P (X q (µ)) = 0.95. Tracciare il grafico della funzione µ q (µ). Trovare il numero µ tale che q (µ) = 21 (o meglio, il più vicino possibile). Exercise 8 Considerare le densità Beta simmetriche. Trovare i parametri per cui valga F (0.3) = 0.05. 3 Valori medi, regressione Valor medio, varianza e deviazione standard di una v.a. X teorica (es. una N (5, 7)) non sono numeri da calcolare con R, ma con le formule apposite, se disponibili per quella classe di variabili. L uso di R si riferisce a media, varianza e deviazione standard di stringhe di numeri, intese come campioni sperimentali provenienti da gandezze aleatorie. Sono definite dalle tre formule x = 1 n x i, S 2 = 1 n 1 (x i x) 2, S = S 2. 2

Data una stringa x di n numeri, i comandi mean(x), var(x), sd(x) calcolano queste grandezze. Date poi due stringhe x,y di n numeri, i comandi cov(x,y), cor(x,y) calcolano covarianza e correlazione. Sono definiti da cov(x, y) = 1 n 1 cor(x, y) = (x i x) (y i y), cov(x, y) sd(x) sd(y). Di nuovo, si tratta di operazioni tra campioni sperimentali che corrispondono alle analoghe operazioni tra variabili aleatorie. Exercise 9 Costruire due stringhe di 10 numeri aventi cor(x,y) pari a 0.9 (circa). Exercise 10 Generare due gruppi di 1000 numeri gaussiani di media 5 e varianza 9. Calcolarne la covarianza e la correlazione. Prima di fare il calcolo, che valori vi aspettereste? La regressione lineare tra due stringhe x,y di n numeri si esegue tramite il comando lm(y~x). Caricandolo nella variabile LM: LM <- lm(y~x) poi si possono leggere varie informazioni su tale regressione. I coefficienti a, b del modello Y = ax + b si leggono digitando LM dove compaiono col nome di intercept e x. Il comando summary(lm) fornisce inoltre varie indicazioni sulla bontà della regressione, che richiedono però una spiegazione più lunga di quello che stiamo dando qui. Altre ancora si ottengono da plot(lm) Si vedano gli esercizi per capire sperimentalmente il valore di certe informazioni offerte da questi comandi. Infine, date due stringhe x,y di n numeri vorremmo fare un grafico in cui siano rappresentati i punti di coordinate (x[i],y[i]) e la retta di regressione. I punti si ottengono semplicemente con plot(x,y). Poi, aggiungendo le istruzioni 3

x0 <- min(x) x1 <- max(x) a <- LM$coefficient[2] b <- LM$coefficient[1] lines(c(x0,x1),c(a*x0+b,a*x1+b)) si ottiene la retta di regressione sovrapposta al grafico precedente. Exercise 11 Usando l help, capire questi comandi. Exercise 12 Data la serie storica 15, 21, 19, 25, 26, 29, 34, 32, 36, 35, 36 effettuare la regressione lineare rispetto ai valori x = 1, 2, 3,... e tracciare la retta di regressione sopra il grafico dei punti. Exercise 13 Generare 10 numeri casuali N (0, 1), detti z 1,..., z 10 ; porre x = (1, 2, 3, 4, 5, 6, 7, 8, 9, 10) y = x + εz dove z = (z 1,..., z 10 ) ed ε verrà scelto tra poco. Eseguire la regressione lineare tra x ed y nei due casi: ε = 0.1, ε = 1. Riconoscere visivamente le diversità e soprattutto riscontrare le diversità nei risultati forniti dai comandi summary(lm) e plot(lm). Exercise 14 Calcolare la varianza spiegata dal modello e cercarne il valore nei risultati offerti da R. 4 Analisi statistica multivariata Exercise 15 Caricare da Excel una matrice avente 10 righe e 2 colonne. Chiamarla Q. Col comando cov(q) calcolarne la matrice di covarianza. Come avreste potuto calcolare le 4 componenti, singolarmente? Exercise 16 Ripetere l esercizio con una matrice avente 5 colonne. Exercise 17 Cosa esce dal comando eigen(q)? (questo evidentemente non è un esercizio d esame, ma di allenamento). 4

Exercise 18 Generare un campione di mille punti estratto da una gaussiana bi-dimensionale della forma X = AZ + µ, in cui ( ) ( ) 3 7 1 A =, µ =. 2 9 2 Rappresentarlo graficamente. Exercise 19 Sia X la gaussiana dell esercizio precedente. Calcolare la sua matrice di covarianza in due modi diversi (uno esatto, l altro approssimato). Confrontarli. 5