Matematica e Statistica per Scienze Ambientali
|
|
- Isabella Negro
- 6 anni fa
- Visualizzazioni
Transcript
1 per Scienze Ambientali LABORATORIO R - Appunti 1 1 Dipartimento di Matematica Sapienza, Università di Roma Roma, Gennaio 2014
2 Argomenti La distribuzione normale e applicazioni La distribuzione binomiale e il suo legame con la distribuzione di Poisson e con la distribuzione normale Diversi tipi di distribuzione Analisi dei residui e decomposizione della varianza. Soluzione degli esercizi. Implementazione del modello lineare y i = α + βx i + e i. Test statistici
3 Variabili alatorie Se lanciamo una moneta, otteniamo testa o croce. Se indichiamo con x il risultato osservato del lancio della moneta, possiamo avere x = T oppure x = C, ed uno solo dei due casi si presenta. Se invece indichiamo con X il risultato possibile del lancio di una moneta, siamo in presenza di un oggetto, detto variabile aleatoria, di cui abbiamo una conoscenza parziale e incerta. Di esso conosciamo i possibili valori T e C e la distribuzione di probabilità, cioè la probabilità con cui assume ogni possibile valore. Indichiamo p(x = T ) la probabilità che X assuma il valore testa e con p(x = C) la probabilità che X assuma il valore croce. In assenza di ulteriori informazioni e supposizioni, possiamo solo assumere che esista un numero 0 p 1 tale che p(x = T ) = p e p(x = C) = 1 p. Se abbiamo l informazione, o possiamo supporre che la moneta non sia truccata, assumeremo che, p(x = T ) = 1/2 p(x = C) = 1/2. Qual è il legame tra la variabile aleatoria X e la variabile statistica x = (x 1,..., x n) che contiene l esito osservato di n lanci di una moneta? Il legame passa attraversi il valore aspettato E(X) = p 1 + (1 p) 0 = p della variabile aleatoria X. La variabile statistica x = (x 1,..., x n) è ottenuta realizzando n variabili aleatorie indipendenti X 1,..., X n, distribuite come X. Sia N la variabile aleatoria che conta il numero dei successi in n realizzazioni di X. Allora (legge dei grandi numeri) «lim P N n n p > ɛ 0.
4 Distribuzione normale Una funzione reale di variabile reale f : R R non negativa tale che + f = 1 determina una densità di probabilità. Una variabile statistica x si dice distribuita approssimativamente come f quando la frequenza relativa delle osservazioni che appartengano ad un qualsiasi intervallo (a, b) R è circa uguale a b f. L esempio più a comune è quello di una variabile che si distribuisce in maniera approssimativamente normale, o gaussiana. Le distribuzione gaussiana di media µ e deviazione standard σ è 1 σ (x µ) 2 2π e 2σ 2.
5 Esempio Per esempio, se l altezza di una certa popolazione si distribuisce in maniera approssimativamente gaussiana di media µ = 173cm e deviazione standard σ = 2cm, allora la percentuale approssimativa di individui la cui altezza è compresa tra 172cm e 175cm è (x 173) 2 2π e ovvero, l area evidenziata in figura, che si calcola con R con il comando pnorm(175,mu,sigma)-pnorm(172,mu,sigma). Distribuzione normale di parametri mu=173 e sigma=
6 Quattro problemi sulle distribuzioni Per una variabile aleatoria X di data distribuzione, continua o discreta, ci possiamo porre i seguenti problemi: Disegnare la distribuzione di X. Calcolare la probabilità di osservare: a X b, a, b R per una distribuzione continua; a i X a j, dove a i e a j sono due valori possibili della distribuzione. Dato 0 q 1, determinare a tale che P(X < a) = q. Simulare n osservazioni estratte da n copie identiche di X.
7 Teorema del Limite Centrale Sia Y n (p) una variabile aleatoria distribuita in maniera binomiale di parametri p ed n e sia g(x) la gaussiana standard di media 0 e deviazione standard 1. Allora lim P n + ( Y n (p) p n n p (1 p) [a, b] ) = b a g(x) Teorema del limite centrale f(x) x
8 Legami tra due variabili statistiche Uno degli scopi della statistica elementare è lo studio dei legami (associazioni) tra due variabili statistiche. Ci limitiamo al caso in cui entrambe le variabili siano numeriche. Il coefficiente di correlazione Se x e y sono due variabili statistiche numeriche il coefficiente di correlazione è (x x)(y y) r = (x x) 2 (y y) = σ xy. 2 σ x σ y Il coefficiente di correlazione è compreso tra 1 e 1. Se i due caratteri sono estratti da una distribuzione congiunta approssimativamente normale, di densità 1 z(x, y) = p 2πσ exp 1 (x µx) 2 xσ y 1 ρ 2 2(1 ρ 2 ) σx 2 allora r è lo stimatore di ρ. 2ρ(x µx)(y µy) + σ xσ y ««(y µy)2 σy 2
9 Osservazioni sulla correlazione Supponiamo che x e y abbiano distribuzione congiunta approssimativamente gaussiana. Allora r = 0 indica mancanza di correlazione tra le variabili x e y r = 1 indica perfetta correlazione positiva, ovvero y = ax + b con a > 0 r = 1 indica perfetta correlazione negativa, ovvero y = ax + b con a < 0 Un valore di r vicino a 1 indica un elevato grado di associazione, ovvero una buona interpolazione del diagramma di dispersione di x e y con una retta. L interpretazione del coefficiente di correlazione è dubbia quando la distribuzione congiunta non è approssimativamente gaussiana.
10 Modello lineare Date due variabili statistiche x x 1,..., x n e y = y 1,..., y n il modello lineare standard è y i = α + βx i + e i. dove le x i si assumono come fisse e le e i sono variabili aleatorie indipendenti con E(e i ) = 0 e Var(e i ) = σ 2.
11 Modelli probabilistici Un modello probabilistico per un insieme di dati empirici consiste in un sistema di equazioni tra un insieme di variabili aleatorie per ognuna delle quali è specificato un insieme di possibili distribuzioni di probabilità. Il modello si dice parametrico quando le distribuzioni di ognuno degli insiemi associati alle variabili aleatorie del modello dipendono da un insieme di parametri. Un modello probabilistico serve per simulare la produzione di dati aventi distribuzione delle frequenze il più possibile simile a quella dei dati empirici. Un modello probabilistico permette anche di calcolare, almeno in linea di principio, la distribuzione teorica dei dati. Nella modellistica probabilistica abbiamo quindi tre oggetti fondamentali: dati empirci e relative frequenze empiriche dati simulati e relative frequenze empiriche variabili aleatorie o distribuzioni di probabilità o frequenze teoriche La modellizzazione probabilistica consiste nell adattamento ai dati di un insieme di distribuzioni di probabilità, solitamente attraverso la scelta di parametri ottimali e nella valutazione della bontà dell adattamento del modello ai dati.
12 Concretamente, è possibile simulare la realizzazione di variabili aleatorie con diverse distribuzioni di probabilità attraverso l uso del calcolatore, per esempio: normale, beta, gamma, del chi quadro, di Poisson, geometrica, binomiale, ecc. Se una variabile aleatoria ha una distribuzione dist implementata in R, di parametri a,b,..., allora n sue realizzazioni indipendenti si ottengono con il comando rdist(n,a,b,...) per esempio la simulazione di 30 realizzazioni di una variabile aleatoria normale di parametri µ = 0 e σ = 3 si ottiene con il comando rnorm(30,0,3).
13 Modello probabilistico per un insieme di dati: Esempio Si consideri la seguente tabella di dati empirici Nella prima riga della tabella sono riportate le osservazioni ralative ad una certa variabile statistica e nella seconda riga sono riportate le frequenze assolute di tali osservazioni. Si tratta del conteggio del numero di crash di un certo sistema operativo, osservati durante 1000 ore di funzionamento di una certa marca di computer. Quindi, su 10 computer non si è osservato alcun crash, su 27 computer si è osservato un crash,... su 9 computer si sono osservati 4 o più crash. Un modello probabilistico per questi dati consiste in una distribuzioni di probabilità, estratta da una determinata famiglia parametrica, per cui si possa ragionevolmente ipotizzare che i dati siano stati prodotti dalla realizzazione di n variabili aleatorie indipendenti (n uguale al numero totale delle osservazioni, in questo caso 100) aventi quella distribuzione.
14 Scelta del modello: distribuzione binomiale Per scegliere la classe di modelli parametrici e fissare i parametri, guardiamo all istogramma dei dati. Frequenze Osservazioni La forma ricorda quella di una variabile aleatoria che conta il numero di teste nel lancio ripetuto 4 volte di una moneta, che ha distribuzione binomiale di parametro p uguale alla probabilità che venga testa in un lancio. La forma asimmetrica, che favorisce valori più bassi, suggerisce p < 1/2.
15 Scelta dei parametri del modello parametrico Una volta ipotizzata la distribuzione parametrica, bisogna scegliere i parametri in modo da adeguarsi ai dati. Sono possibili diversi approcci, tra cui: Calcolare, in funzione di p una opportuna distanza tra la distribuzione empirica dei dati e la distribuzione teorica e determinare p minimizzando tale distanza. Calcolare, in funzione di p la verosimiglianza dei dati e determinare p massimizzando tale verosimiglianza. Calcolare un indice statistico/empirico (per esempio la media aritmetica) dei dati e il corrispondente indice teorico della distribuzione in funzione di p e determinare il parametro imponendo l uguaglianza tra l indice teorico e quello empirico In questo caso scegliamo la terza strada in quanto è ben noto che la media teorica di una variabile aleatoria X avente distribuzione binomiale di parametri n e p vale: E(X) = p p p n n = np. dove, naturalmente n p k = p k k (1 p) n k Nell esempio, n = 4, e la media dei dati empirici vale 1.9, e quindi la stima di p risulta essere p =
16 Frequenze empiriche dalle frequenze aspettate La distribuzione scelta, cioè la distribuzione binomiale di parametri n = 4 e p = prevede per ogni possibile risultato, la probabilità di osservarlo. In generale la probabilità prevista per l osservazione i secondo una distribuzione dist implementata in R si calcola con il comando ddist(i,a,b,...) dove a, b,... sono i parametri della distribuzione. Abbiamo quindi, nel nostro caso la tabella seguente che indica, per ogni possibile valore, la probabilità di osservazione, calcolate con il comando dbinom(0:4,4,0.475), approssimando il risultato alla seconda cifra decimale Naturalmente queste probabilità non sono immediatamente confrontabili con le frequenze empiriche, in quanto la somma delle diverse probabilità è uguale a 1 mentre la somma delle frequenze empiriche è uguale al totale delle osservazioni, in questo caso 100. Dobbiamo quindi moltiplicare le probabilità per il numero totale delle osservazione prima di procedere al confronto.
17 Confronto grafico tra le frequenze empiriche e le frequenze aspettate Le frequenze empiriche e le frequenze aspettate da confrontare sono quindi Confronto grafico freq.empiriche freq.aspettate
18 Confronto numerico tra le frequenze empiriche e le frequenze aspettate A occhio si vede che un certo accordo tra le frequenze empiriche e le frequenze aspettate, ma come misurare numericamente la qualità dell accordo. Una indice utile per misurare l accordo tra frequenze empiriche e frequenze aspettate è la distanza del chi quadro. Se O = (o 1,..., 0 n ) e E = (e 1,..., e n ) sono le frequenze osservate o empiriche e le frequenze aspettate (expected), allora n i=1 χ 2 (O, E) = (o i e i ) 2 Nel nostro esempio il valore del chi quadro è pari a Abbiamo ora una distanza numerica determinata tra le frequenze empiriche e le frequenze aspettate. Non è chiaro ancora, però, se questa distanza è grande o no. e i
19 Strategia per misurare la bontà dell adattamento La startegia che possiamo seguire per renderci conto della significatività di questa distanza è la seguente. 1 Simuliamo un grande numero di volte i dati empirici 2 Misuriamo ogni volta la distanza tra le frequenze dei dati simulati e le frequenze teoriche 3 Contiamo la frazione dei dati simulati per i quali la distanza dalle frequenze teoriche è maggiore della distanza tra frequenze empiriche e frequenze teoriche. 4 Se la frazione è minore di una certa soglia (comunemente si sceglie come valore di soglia 0.05 o 0.01) giudichiamo scarso o molto scarso l adattamento dei dati empirici alla distribuzione, altrimenti lo riteniamo soddisfaciente.
20 Simulazione dei dati empirici La simulazione di una variabile aleatoria con distribuzione binomiale si ottiene con la funzione rbinom. Per simulare un set di dati da confrontare con quelli empirici dobbiamo valutare 100 variabili aleatorie indipendenti con distribuzione binomiale di parametri n e p: dati.simulati=rbinom(100,n,p) la tabella delle frequenze dei dati simulati è freq.simulate=table(dati.simulati) la distanza del chi quadro tra le frequenze dei dati simulati e quelle teoriche è freq.simulate=table(dati.simulati)
21 Simulazione della distribuzione campionaria del chi quadro dist.campionaria=c() for(i in 1:10000){ freq.simulate=table( rbinom(sum(freq.osservate),n,p) ) if(length(freq.simulate)==n+1){ chi2.simul=sum( (freq.simulate-freq.aspettate)ˆ2/freq.aspettate ) dist.campionaria=c(chi2.simul,dist.campionaria) } }
22 Confronto del valore empirico del chi quadro con la distribuzione campionaria del chi quadro Nella figura è riportato un istogramma della distribuzione campionaria del chi quadro relativo a campioni. In rosso il valore del chi quadro per la distribuzione empirica. Tale valore non è nella norma dei valori campionari. Si avrebbe uno scostamento statisticamente significativo del valore empirico se la frazione dei campioni simulati con valore del chi quadro maggiore di quelli empirici fosse molto piccola, (se minore di 0.05 il discostamento sarebbe statisticamente significativo, se minore di 0.01 sarebbe molto significativo). Nell esempio, tale frazione è pari 0.343, quindi il discostamento è non significativo e l ipotesi che i dati empirici provengano dalla realizzazione di variabili aleatorie con distribuzione binomiale è statisticamente sostenibile. Histogram of dist.campionaria Density ENRICO 5ROGORA 10 Matematica 15 20e Statistica 25 0
23 Approssimazione della distribuzione campionaria del chi quadro In generale, la distribuzione campionaria delle distanze del chi quadro tra frequenze aspettate e frequenze osservate in n classi di conteggio è, sotto opportune ipotesi non troppo restrittive ben approssimata da una densità di probabilità continua χ 2 n 1, detta distribuzione del chi quadro con n 1 gradi di libertà, rappresentata in blu nella figura. Histogram of dist.campionaria Density dist.campionaria
24 Calcolo teorico della significatività dello scostamento La percentuale dei campioni con valore del chi quadro maggiore di quello empirico chi2 si può quindi calcolare come + chi2 χ 2 n 1 ovvero, utilizzando i comandi per l integrazione di una distribuzione di probabilità in R, 1-pchisq(chi2,n) che fornisce, approssimato alla terza cifra decimale, il valore
Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva
Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.
DettagliModelli probabilistici variabili casuali
Modelli probabilistici variabili casuali Le variabili casuali costituiscono il legame tra il calcolo della probabilità e gli strumenti di statistica descrittiva visti fino ad ora. Idea: pensiamo al ripetersi
DettagliDispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
DettagliUNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.
Lezione 4 DISTRIBUZIONE DI FREQUENZA 1 DISTRIBUZIONE DI PROBABILITA Una variabile i cui differenti valori seguono una distribuzione di probabilità si chiama variabile aleatoria. Es:il numero di figli maschi
DettagliUNIVERSITÀ di ROMA TOR VERGATA
UNIVERSITÀ di ROMA TOR VERGATA Corso di Statistica, anno 2010-11 P.Baldi Lista di esercizi 3. Corso di Laurea in Biotecnologie Esercizio 1 Una v.a. X segue una legge N(2, ). Calcolare a1) P(X 1) a2) P(2
DettagliVariabili aleatorie discrete. Giovanni M. Marchetti Statistica Capitolo 5 Corso di Laurea in Economia
Variabili aleatorie discrete Giovanni M. Marchetti Statistica Capitolo 5 Corso di Laurea in Economia 2015-16 1 / 45 Variabili aleatorie Una variabile aleatoria è simile a una variabile statistica Una variabile
DettagliVedi: Probabilità e cenni di statistica
Vedi: http://www.df.unipi.it/~andreozz/labcia.html Probabilità e cenni di statistica Funzione di distribuzione discreta Istogrammi e normalizzazione Distribuzioni continue Nel caso continuo la probabilità
DettagliVariabili aleatorie continue
Variabili aleatorie continue Per descrivere la distribuzione di una variabile aleatoria continua, non si può più assegnare una probabilità positiva ad ogni valore possibile. Si assume allora di poter specificare
DettagliR - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre
R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria
DettagliCapitolo 6 La distribuzione normale
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 6 La distribuzione normale Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
DettagliPROBABILITÀ - SCHEDA N. 3 VARIABILI ALEATORIE CONTINUE E SIMULAZIONE
PROBABILITÀ - SCHEDA N. 3 VARIABILI ALEATORIE CONTINUE E SIMULAZIONE (da un idea di M. Impedovo Variabili aleatorie continue e simulazione Progetto Alice n. 15, ) 1. La simulazione Nelle schede precedenti
DettagliCapitolo 6. La distribuzione normale
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 6 La distribuzione normale Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
DettagliI appello di calcolo delle probabilità e statistica
I appello di calcolo delle probabilità e statistica A.Barchielli, L. Ladelli, G. Posta 8 Febbraio 13 Nome: Cognome: Matricola: Docente: I diritti d autore sono riservati. Ogni sfruttamento commerciale
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
DettagliPresentazione dell edizione italiana
1 Indice generale Presentazione dell edizione italiana Prefazione xi xiii Capitolo 1 Una introduzione alla statistica 1 1.1 Raccolta dei dati e statistica descrittiva... 1 1.2 Inferenza statistica e modelli
DettagliCAPITOLO QUINTO DISTRIBUZIONE NORMALE
CAPITOLO QUINTO DISTRIBUZIONE NORMALE 1. Probabilità nel continuo Fino ad ora abbiamo considerato casi in cui l insieme degli eventi elementari è finito. Vediamo, mediante due semplici esempi, come si
DettagliDistribuzioni e inferenza statistica
Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione
DettagliApprofondimento 3.3. Approssimazione della distribuzione binomiale alla normale
Approfondimento 3.3 Approssimazione della distribuzione binomiale alla normale Come aveva notato de Moivre, se il numero di prove è sufficientemente ampio e la probabilità del successo π sufficientemente
DettagliDue variabili aleatorie X ed Y si dicono indipendenti se comunque dati due numeri reali a e b si ha. P {X = a, Y = b} = P {X = a}p {Y = b}
Due variabili aleatorie X ed Y si dicono indipendenti se comunque dati due numeri reali a e b si ha P {X = a, Y = b} = P {X = a}p {Y = b} Una variabile aleatoria χ che assume i soli valori 1, 2,..., n
DettagliIl Corso di Fisica per Scienze Biologiche
Il Corso di Fisica per Scienze Biologiche Ø Prof. Attilio Santocchia Ø Ufficio presso il Dipartimento di Fisica (Quinto Piano) Tel. 75-585 278 Ø E-mail: attilio.santocchia@pg.infn.it Ø Web: http://www.fisica.unipg.it/~attilio.santocchia/
DettagliSommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51
Sommario 1 I dati...15 1.1 Classificazione delle rilevazioni...17 1.1.1 Esperimenti ripetibili (controllabili)...17 1.1.2 Rilevazioni su fenomeni non ripetibili...18 1.1.3 Censimenti...19 1.1.4 Campioni...19
DettagliPROBABILITÀ ELEMENTARE
Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti
DettagliEsame di AM2 & EAP (270/04) a.a. 2009/10
Quarto appello del 16 Luglio 2010 1. Un urna contiene delle palline numerate e distribuite in seguente maniera: Vengono estratte due palline senza rimpiazzo e siano X e Y rispettivamente il numero della
DettagliCalcolo delle Probabilità e Statistica, Ingegneria Civile e A&T e Informatica I prova finale a.a. 2016/17
Calcolo delle Probabilità e Statistica, Ingegneria Civile e A&T e Informatica I prova finale aa 6/ Punteggi: : 3 + 6; : + + + ; 3: + Una scatola contiene monete; 8 di queste sono equilibrate, mentre le
DettagliIl campionamento e l inferenza. Il campionamento e l inferenza
Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento
DettagliFENOMENI CASUALI. fenomeni casuali
PROBABILITÀ 94 FENOMENI CASUALI La probabilità si occupa di fenomeni casuali fenomeni di cui, a priori, non si sa quale esito si verificherà. Esempio Lancio di una moneta Testa o Croce? 95 DEFINIZIONI
DettagliPROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07
PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 006/07 Esercizio 1 Prova scritta del 16/1/006 In un ufficio postale lavorano due impiegati che svolgono lo stesso compito in maniera indipendente, sbrigando
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
DettagliVariabili aleatorie. Variabili aleatorie e variabili statistiche
Variabili aleatorie Variabili aleatorie e variabili statistiche Nelle prime lezioni, abbiamo visto il concetto di variabile statistica : Un oggetto o evento del mondo reale veniva associato a una certa
DettagliAnalisi degli Errori di Misura. 08/04/2009 G.Sirri
Analisi degli Errori di Misura 08/04/2009 G.Sirri 1 Misure di grandezze fisiche La misura di una grandezza fisica è descrivibile tramite tre elementi: valore più probabile; incertezza (o errore ) ossia
DettagliVariabili aleatorie gaussiane
Variabili aleatorie gaussiane La distribuzione normale (riconoscibile dalla curva a forma di campana) è la più usata tra tutte le distribuzioni, perché molte distribuzioni che ricorrono naturalmente sono
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DettagliStatistica. Lezione 4
Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 4 a.a 2011-2012 Dott.ssa Daniela
DettagliAlcune v.a. discrete notevoli
Alcune v.a. discrete notevoli Variabile aleatoria Bernoulliana Il risultato X di un esperimento aleatorio può essere classificato nel modo che segue: successo oppure insuccesso. Indichiamo: Successo =
DettagliUlteriori Conoscenze di Informatica e Statistica
ndici di forma Ulteriori Conoscenze di nformatica e Statistica Descrivono le asimmetrie della distribuzione Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 ( piano) tel.: 06 55 17 72 17
DettagliESAME. 9 Gennaio 2017 COMPITO B
ESAME 9 Gennaio 2017 COMPITO B Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 27 Outline 1 () Statistica 2 / 27 Outline 1 2 () Statistica 2 / 27 Outline 1 2 3 () Statistica 2 /
DettagliUNIVERSITÀ DEGLI STUDI DI PERUGIA
SIGI, Statistica II, esercitazione n. 3 1 UNIVERSITÀ DEGLI STUDI DI PERUGIA FACOLTÀ DI ECONOMIA CORSO DI LAUREA S.I.G.I. STATISTICA II Esercitazione n. 3 Esercizio 1 Una v.c. X si dice v.c. esponenziale
DettagliDISTRIBUZIONI DI CAMPIONAMENTO
DISTRIBUZIONI DI CAMPIONAMENTO 12 DISTRIBUZIONE DI CAMPIONAMENTO DELLA MEDIA Situazione reale Della popolazione di tutti i laureati in odontoiatria negli ultimi 10 anni, in tutte le Università d Italia,
DettagliMETODO DEI MINIMI QUADRATI
METODO DEI MINIMI QUADRATI Torniamo al problema della crescita della radice di mais in funzione del contenuto di saccarosio nel terreno di coltura. Ripetendo varie volte l esperimento con diverse quantità
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
DettagliUNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE. a.a.
UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE a.a. 2007/2008 1,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,00 CDF empirica
DettagliVIII Indice 2.6 Esperimenti Dicotomici Ripetuti: Binomiale ed Ipergeometrica Processi Stocastici: Bernoul
1 Introduzione alla Teoria della Probabilità... 1 1.1 Introduzione........................................ 1 1.2 Spazio dei Campioni ed Eventi Aleatori................ 2 1.3 Misura di Probabilità... 5
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1
DettagliNote sulla probabilità
Note sulla probabilità Maurizio Loreti Dipartimento di Fisica Università degli Studi di Padova Anno Accademico 2002 03 1 La distribuzione del χ 2 0.6 0.5 N=1 N=2 N=3 N=5 N=10 0.4 0.3 0.2 0.1 0 0 5 10 15
DettagliEsercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo
Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo 1. Gli studi di simulazione possono permetterci di apprezzare alcune delle proprietà di distribuzioni campionarie ricavate
DettagliL analisi dei dati. Primi elementi. EEE- Cosmic Box proff.: M.Cottino, P.Porta
L analisi dei dati Primi elementi Metodo dei minimi quadrati Negli esperimenti spesso si misurano parecchie volte due diverse variabili fisiche per investigare la relazione matematica tra le due variabili.
DettagliEsercizi di Calcolo delle Probabilità
Esercizi di Calcolo delle Probabilità Versione del 1/05/005 Corso di Statistica Anno Accademico 00/05 Antonio Giannitrapani, Simone Paoletti Calcolo delle probabilità Esercizio 1. Un dado viene lanciato
DettagliPROBABILITA. Distribuzione di probabilità
DISTRIBUZIONI di PROBABILITA Distribuzione di probabilità Si definisce distribuzione di probabilità il valore delle probabilità associate a tutti gli eventi possibili connessi ad un certo numero di prove
DettagliLaboratorio di Calcolo B 68
Generazione di numeri casuali Abbiamo già accennato all idea che le tecniche statistiche possano essere utili per risolvere problemi di simulazione di processi fisici e di calcoli numerici. Dobbiamo però
DettagliApprossimazione normale alla distribuzione binomiale
Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N
Dettagli1 4 Esempio 2. Si determini la distribuzione di probabilità della variabile casuale X = punteggio ottenuto lanciando un dado. Si ha immediatamente:
CAPITOLO TERZO VARIABILI CASUALI. Le variabili casuali e la loro distribuzione di probabilità In molte situazioni, dato uno spazio di probabilità S, si è interessati non tanto agli eventi elementari (o
Dettaglitabelle grafici misure di
Statistica Descrittiva descrivere e riassumere un insieme di dati in maniera ordinata tabelle grafici misure di posizione dispersione associazione Misure di posizione Forniscono indicazioni sull ordine
DettagliRegressione lineare semplice
Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro
DettagliL indagine campionaria Lezione 3
Anno accademico 2007/08 L indagine campionaria Lezione 3 Docente: prof. Maurizio Pisati Variabile casuale Una variabile casuale è una quantità discreta o continua il cui valore è determinato dal risultato
DettagliStatistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme
DettagliSTATISTICA: esercizi svolti sulle VARIABILI CASUALI
STATISTICA: esercizi svolti sulle VARIABILI CASUALI VARIABILI CASUALI 2 VARIABILI CASUALI. Variabili casuali generiche. Si supponga che un dado truccato, formato da sei facce contrassegnate dai numeri
DettagliProva di recupero di Probabilità e Statistica - A * 21/04/2006
Prova di recupero di Probabilità e Statistica - A * /04/006 (NB: saranno prese in considerazione solo le risposte adeguatamente motivate) tempo di lavoro: Due ore. Per conseguire la patente di guida, un
DettagliLAUREA SPECIALISTICA IN FARMACIA - Prova scritta di MATEMATICA - 24/01/03 ANNI PRECEDENTI. 1. (Punti 10) Si consideri la funzione
MATEMATICA - 4//3 ANNI PRECEDENTI (Punti ) Si consideri la funzione ( ) f() = ln Si studi f, determinando in particolare dominio, limiti, intervalli di crescenza, decrescenza, concavità, convessità di
DettagliVariabili casuali. - di Massimo Cristallo -
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 16 e 27 maggio 2013 - di Massimo Cristallo - Variabili casuali
DettagliMATEMATICA CORSO A II COMPITINO (Tema 1) 5 Aprile 2013
MATEMATICA CORSO A II COMPITINO (Tema 1) 5 Aprile 2013 Soluzioni 1. Due sperimentatori hanno rilevato rispettivamente 25 e 5 misure di una certa grandezza lineare e calcolato le medie che sono risultate
Dettagli1 Eventi. Operazioni tra eventi. Insiemi ed eventi. Insieme dei casi elementari. Definizione di probabilità.
Quella che segue e la versione compatta delle slides usate a lezioni. NON sono appunti. Come testo di riferimento si può leggere Elementi di calcolo delle probabilità e statistica Rita Giuliano. Ed ETS
DettagliStatistica Inferenziale
Statistica Inferenziale Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Riepilogo lezione 3 Abbiamo visto: Definizione di partizione di Teorema di Bayes Definizione di variabile aleatoria
DettagliProprietà della varianza
Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Intermezzo: ma perché dovremmo darci la pena di studiare come calcolare la varianza nel caso di somme,
DettagliContenuti: Capitolo 14 del libro di testo
Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4
DettagliLe variabili casuali o aleatorie
Le variabili casuali o aleatorie Intuitivamente un numero casuale o aleatorio è un numero sul cui valore non siamo certi per carenza di informazioni - ad esempio la durata di un macchinario, il valore
DettagliMODELLI QUANTITATIVI. f x r = c
MODELLI QUANTITATIVI Qualunque sia il modello di estrazione di regolarità o di conoscenze dai dati empirici, esiste sempre una base statistica da cui occorre partire. Un fenomeno linguistico specifico
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
DettagliCapitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari"
Levine, Krehbiel, Berenson Statistica Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari" Unità Integrata Organizzativa
DettagliDISTRIBUZIONI DI PROBABILITA
DISTRIBUZIONI DI PROBABILITA Nell associare ai risultati di un esperimento un valore numerico si costruisce una variabile casuale (o aleatoria, o stocastica). Ogni variabile casuale ha una corrispondente
DettagliTeoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
DettagliLezione n. 1 (a cura di Irene Tibidò)
Lezione n. 1 (a cura di Irene Tibidò) Richiami di statistica Variabile aleatoria (casuale) Dato uno spazio campionario Ω che contiene tutti i possibili esiti di un esperimento casuale, la variabile aleatoria
DettagliIL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA
Metodi per l Analisi dei Dati Sperimentali AA009/010 IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Sommario Massima Verosimiglianza Introduzione La Massima Verosimiglianza Esempio 1: una sola misura sperimentale
DettagliScheda n.3: densità gaussiana e Beta
Scheda n.3: densità gaussiana e Beta October 10, 2008 1 Definizioni generali Chiamiamo densità di probabilità (pdf ) ogni funzione integrabile f (x) definita per x R tale che i) f (x) 0 per ogni x R ii)
DettagliLaboratorio di Statistica 1 con R Esercizi per la Relazione. I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati
Laboratorio di Statistica 1 con R Esercizi per la Relazione I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati nel corso. Esercizio 1. 1. Facendo uso dei comandi
DettagliREGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
DettagliPROBABILITÀ SCHEDA N. 7 LA VARIABILE ALEATORIA NORMALE
Matematica e statistica: dai dati ai modelli alle scelte wwwdimaunige/pls_statistica Responsabili scientifici MP Rogantin e E Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ SCHEDA
DettagliEsercitazione: La distribuzione NORMALE
Esercitazione: La distribuzione NORMALE Uno dei più importanti esempi di distribuzione di probabilità continua è dato dalla distribuzione Normale (curva normale o distribuzione Gaussiana); è una delle
DettagliCalcolo delle Probabilità 2
Prova d esame di Calcolo delle Probabilità 2 Maggio 2006 Sia X una variabile aleatoria distribuita secondo la densità seguente ke x 1 x < 0 f X (x) = 1/2 0 x 1. 1. Determinare il valore del parametro reale
DettagliUlteriori conoscenze di informatica Elementi di statistica Esercitazione3
Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3 Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows. Immettere Nome utente b## (##
DettagliIntroduzione all inferenza statistica, II lezione
T (X) è sufficiente? (2) Introduzione all inferenza statistica, II lezione Carla Rampichini Dipartimento di Statistica Giuseppe Parenti - Firenze - Italia carla@ds.unifi.it - www.ds.unifi.it/rampi/ TEOREMA
DettagliΣ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica
13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in
DettagliEsercitazione N. 1 (11 ottobre 2016)
Esercitazione N. 1 (11 ottobre 2016) Un'urna contiene elementi. Vengono estratti di seguito elementi, ogni elemento una volta estratto è riposto nell'urna. Calcolare la probabilità dell evento: Problema
DettagliMETODO DEI MINIMI QUADRATI
Vogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione. Sia f(x) = mx + q, la coppia di dati (x i, y i ) appartiene
DettagliLE DISTRIBUZIONI CAMPIONARIE
LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria
DettagliEsame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).
Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si
DettagliBLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i
BLAND-ALTMAN PLOT Il metodo di J. M. Bland e D. G. Altman è finalizzato alla verifica se due tecniche di misura sono comparabili. Resta da comprendere cosa si intenda con il termine metodi comparabili
DettagliUNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. I Esonero - 29 Ottobre Tot.
UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014 I Esonero - 29 Ottobre 2013 1 2 3 4 5 6 7 8 Tot. Avvertenza: Svolgere ogni esercizio nello spazio assegnato,
DettagliStatistica Metodologica Avanzato Test 1: Concetti base di inferenza
Test 1: Concetti base di inferenza 1. Se uno stimatore T n è non distorto per il parametro θ, allora A T n è anche consistente B lim Var[T n] = 0 n C E[T n ] = θ, per ogni θ 2. Se T n è uno stimatore con
DettagliEsercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003
Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/003 e del 14/1/003 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore
DettagliCapitolo 5 Confidenza, significatività, test di Student e del χ 2
Capitolo 5 Confidenza, significatività, test di Student e del χ 5.1 L inferenza Se conosciamo la legge di probabilità di un evento (a priori o a posteriori) possiamo fare delle previsioni su come l evento
DettagliTest delle Ipotesi Parte I
Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test
DettagliStatistica ARGOMENTI. Calcolo combinatorio
Statistica ARGOMENTI Calcolo combinatorio Probabilità Disposizioni semplici Disposizioni con ripetizione Permutazioni semplici Permutazioni con ripetizioni Combinazioni semplici Assiomi di probabilità
DettagliTipi di variabili. Indici di tendenza centrale e di dispersione
Tipi di variabili. Indici di tendenza centrale e di dispersione L. Boni Variabile casuale In teoria della probabilità, una variabile casuale (o variabile aleatoria o variabile stocastica o random variable)
DettagliVersione di Controllo
Università degli Studi di Trento test di ammissione ai corsi di laurea in Fisica - Matematica - Informatica Ingegneria dell Informazione e Organizzazione d Impresa Ingegneria dell Informazione e delle
DettagliDISTRIBUZIONE NORMALE (1)
DISTRIBUZIONE NORMALE (1) Nella popolazione generale molte variabili presentano una distribuzione a forma di campana, bene caratterizzata da un punto di vista matematico, chiamata distribuzione normale
DettagliIntervalli di confidenza
Probabilità e Statistica Esercitazioni a.a. 2006/2007 C.d.L.: Ingegneria per l Ambiente ed il Territorio, Ingegneria Civile, Ingegneria Gestionale, Ingegneria dell Informazione C.d.L.S.: Ingegneria Civile
DettagliCompiti tematici dai capitoli 2,3,4
Compiti tematici dai capitoli 2,3,4 a cura di Giovanni M. Marchetti 2016 ver. 0.8 1. In un indagine recente, i rispondenti sono stati classificati rispetto al sesso, lo stato civile e l area geografica
DettagliMetodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione
Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze
DettagliMatricola: Corso: 1. (4 Punti) Stimare la variazione del reddito quando il prezzo del prodotto finale raddoppia.
Facoltà di Economia Statistica Esame 3-12/04/2010: A Cognome, Nome: Matricola: Corso: Problema 1. Per 5 imprese imprese è stato rilevato il reddito quinquennale medio (in milioni di euro), y, e il corrispondente
Dettagli