Alcune nozioni introduttive alla statistica
|
|
- Albina Rubino
- 7 anni fa
- Visualizzazioni
Transcript
1 Capitolo 1 Alcune nozioni introduttive alla statistica 1.1 Valore atteso e varianza di variabili casuali Definizione 1. Se X è una variabile casuale discreta con distribuzione p(x), ossia P(X = x i ) = p(x i ) := p i per definizione il valore atteso di X, E(X), (spesso detto anche media) è E(X) = i x i p i. Se X è una variabile casuale continua con densità π(x) ossia P(a X b) = E(X) = + b a π(x) dx xπ(x) dx. E possibile dare una definizione unica di E(X), ma ciò richiederebbe l introduzione del concetto dei spazio degli eventi e misure di probabilità. Alcune dimostrazioni diventerebbero molto più semplici in questo contesto, ma preferisco evitarlo qui. Data una qualunque funzione g : R R anche Y = g(x) è una variabile casuale e si potrebbe calcolare E(Y ) = E(g(X)) 1. Vale il seguente fatto, 1 Se g(x) è una variabile casuale che può assumere valori infinitamente grandi, non è detto che E(g(X)) sia ben definito. In particolare, non è detto che tutte le variabili casuali X ammettano valore atteso e varianza. Qua trascuriamo questi aspetti tecnici. 1
2 molto intuitivo, { i E(g(X)) = g(x i)p i se X è discreta + g(x)π(x) dx se X è continua. (1.1) In particolare, definiamo in questo modo la varianza di X, V(X) come V(X) = E((X E(X)) 2 ) = E(X 2 ) (E(X)) 2. (1.2) L ultima identità si dimostra con qualche passaggio algebrico. La varianza è una misura della dispersione dei valori che può assumere X. La disuguaglianza di Chebysev, semplice da dimostrare ma molto importante teoricamente, mostra come la media e la varianza permettano di stimare la probabilità che X prenda valori lontani dalla media. Si ha infatti Teorema 1. Sia g : R R + una funzione nonnegativa, ossia g(x) 0. Si ha P(g(X) k) 1 k E(g(X)). In particolare, vale la disuguaglianza di Chebysev: P( X E(X) c) 1 V(X). (1.3) c2 Dimostrazione. Do una dimostrazione nel caso di X continua, ma è analoga nel caso X discreta. + E(g(X)) = g(x)π(x) dx = g(x)π(x) dx+ g(x)π(x) dx {x: g(x)<k} {x: g(x) k} g(x)π(x) dx k π(x) dx = kp(g(x) k). (1.4) {x: g(x) k} {x: g(x) k} Dividendo il primo e l ultimo termine di (1.4) per k, otteniamo la tesi. Per dimostrare (1.3), basta scegliere g(x) = (x E(X)) 2 e k = c 2 si ottiene P((X E(X)) 2 c 2 ) 1 c 2 V(X). Ma (X E(X)) 2 c 2 X E(X) c e si ha quidni (1.3). Prima di parlare di valore atteso e varianza della somma di due variabili casuali, ricordo la definizione di indipendenza. Definizione 2. Due variabili casuali X e Y si dicono indipendenti se, per ogni coppia di intervalli I e J, si ha P(X I, Y J) = P(X I)P(Y J). (1.5) 2
3 Si ha Teorema 2. Date due variabili casuali X e Y e una costante c R si ha a) E(cX) = ce(x); b) E(X + Y ) = E(X) + E(Y ); c) V(cX) = c 2 V(X); d) se X e Y sono indipendenti V(X + Y ) = V(X) + V(Y ). Le proprietà a)-b)-c) sono molto intuitive, anche se non è immediato dimostrarle usando la definizione usata qui. Per capire che l indipendenza è necessaria per la validità di d), consideriamo un urna con due palline, una con valore 0, l altra con valore 1. Estraiamo una pallina e sia X il numero della pallina estratta e Y quello della pallina rimasta nell urna. Allora X + Y = 1 con certezza e quindi V(X + Y ) = 0; d altra parte V(X) = V(Y ) = 1/4 [controllare!]. 1.2 Media e varianza campionaria Molti problemi della statistica si possono ricondurre al problema di osservare un campione, ma di volere dedurne le caratteristiche di una popolazione da cui il campione è estratto. In alcuni casi la popolazione è letteralmente tale (si pensi al problema di prevedere il risultato di un elezione tramite un sondaggio), più spesso la popolazione è un idealizzazione: si vuole valutare se la presenza di un certo gene protegge da una certa malattia; le popolazioni sono allora tutti gli individui passati, presenti e futuri portatori o non portatori di quel gene, al di là di tutte le altre differenze biologiche, culturali e sociali. Al di là di tutti gli aspetti pratici, per noi l osservazione di un campione è l estrazione di n (la dimensione del campione) variabili casuali X 1,..., X n con una stessa distribuzione (quella della popolazione da cui il campione è estratto). Nel caso in cui (come normalmente in un sondaggio) il campionamento avvenga senza ripetizioni da una popolazione finita di dimensione M, le variabili casuali X 1,..., X n non sono indipendenti. La teoria è però estremamente più semplice se assumiamo che X 1,..., X n siano indipendenti, cosa che avverrebbe se il campionamento fosse con ripetizioni o la popolazione di riferimento fosse infinita 2. Per questo nel seguito assumerò che il campionamento avvenga con ripetizioni; alla fine, scriverò le formule anche per il caso senza ripetizioni. In ogni caso, se n (la dimensione 2 cosa che renderebbe le ripetizioni infinitamente improbabili 3
4 del campione) è molto più piccola di M (la dimensione della popolazione), come avviene quasi sempre in pratica, la differenza fra i due casi è minima. La media campionaria, calcolata secondo la definizione intuitiva di media, è X = 1 n (X X n ) = 1 n X i. (1.6) n Anch essa è una variabile casuale (come X 1,..., X n ) e si può discutere del suo valore atteso e della sua varianza. Posto µ = E(X i ), σ 2 = V(X i ) (ricordare che si è supposto che tutte le variabili X 1,..., X n abbiano la stessa distribuzione, e quindi lo stesso valore atteso e varianza), usando le formule per valore atteso e varianza della somma, si ha e E( X) = 1 n E(X X n ) = 1 (µ + + µ) = µ (1.7) n V( X) = 1 n 2 V(X X n ) = 1 n 2 (σ2 + + σ 2 ) = σ2 n. (1.8) Notare che in (1.8), l ipotesi di indipendenza di X 1,..., X n è essenziale. Per stimare la varianza di X si usa la seguente quantità, la varianza campionaria i=1 S 2 = 1 n 1 [(X 1 X) (X n X) 2 ] = 1 n 1 n (X i X) 2. (1.9) La ragione per dividere per n 1 (e non per n) dipende dal fatto che in questo modo vale E(S 2 ) = V(X i ) = σ 2, (1.10) ossia il valore atteso di S 2 è uguale a σ 2, la quantità che si vuole stimare. Uno stimatore con questa proprietà viene detto non distorto. Se invece avessimo diviso per n, il valore atteso sarebbe stato uguale a n 1 n σ2, quindi avremmo in media sottostimato σ 2 (anche se lievemente per n grande). La dimostrazione di (1.10) non è difficile ma è un po lunga, quindi non la presento. Un ragionamento spesso usato per convincersi del fatto che sia giusto dividere per n 1, è che X è stato ricavato usando X 1,..., X n ; quindi degli n termini di (1.9), solo n 1 sono indipendenti, in quanto conoscendo X 1,..., X n 1 e X, conosco anche X n. Si dirà che l espressione (1.9) ha solo n 1 gradi di libertà, facendo un analogo con i sistemi meccanici. i=1 4
5 1.2.1 Campionamento senza ripetizioni Supponiamo di estrarre senza ripetizioni un campione di n individui da una popolazione di N (ovviamente dovrà essere n N). Possiamo sempre calcolare la media e la varianza campionaria. Con calcoli molto più complessi dei precedenti, è anche possibile calcolare il valore atteso e la varianza di queste statistiche; il valore atteso si riferisce a tutti i possibili campionamenti di grandezza n da quella popolazione. I risultati sono i seguenti, intendendo con µ e σ 2 i veri valori della media e della varianza di X nella popolazione: E( X) = µ; V( X) = (N n) σ 2 ; (N 1) n E(S 2 ) = σ 2 N. N 1 Confrontando questi risultati con (1.7), (1.8) e (1.10), notiamo che il valore atteso della media campionaria è uguale nei due casi. La varianza della media campionaria è un po più piccola senza ripetizioni (in particolare nel caso limite in cui n = N, cioè il campione è uguale alla popolazione, la varianza è 0 perché non c è possibilità di errore). Il valore atteso della varianza campionaria è lievemente più grande senza ripetizioni; questo corrisponde al fatto che non si possono estrarre campioni in cui si misura più volte lo stesso individuo, campioni che avranno una varianza campionaria minore. In ogni caso, le differenze fra i due casi sono minime quando N n, che è il caso tipico Legge dei grandi numeri Le relazioni (1.7) e (1.8) mostrano che il valore atteso della media campionaria è sempre uguale al valor medio della variabile considerata, mentre la varianza decresce all aumentare della dimensione del campione. Utilizzando la disuguaglianza di Cebysev (1.3), queste semplici osservazioni forniscono un risultato notevole. Teorema 3 (Legge dei grandi numeri). Chiamiamo la media campionaria X n = 1 n 2 V(X 1 + +X n ) per mettere in risalto la dipendenza dalla numerosità del campione. Per ogni a > 0 si ha P( X n µ > a) n 0. (1.11) In termini intuitivi, possiamo dire che la media campionaria si avvicina sempre più alla media teorica al crescere della numerosità del campione. 5
6 Dimostrazione. Usando prima (1.3) e poi (1.8), si ha P( X n µ > a) 1 a 2 V( X n ) = σ2 na 2 n 0. I risultati precedenti assicurano che la media campionaria è una buona approssimazione della media teorica (ignota). In termini tecnici, si dice che X è uno stimatore di µ. 1.3 Il teorema centrale La legge dei grandi numeri assicura che la media campionaria si avvicinerà sempre più (nel senso specificato da (1.11)) alla media teorica. C è però un altra proprietà, molto più inaspettata, che in sostanza dice che, per n abbastanza grande, la distribuzione della media campionaria segue la distribuzione normale (o gaussiana) indipendentemente da quale sia la distribuzione delle variabili X i. Sappiamo che vale E( X n ) = µ e V( X n ) = σ 2 /n. Volendo ottenere una distribuzione limite, conviene introdurre la variabile Z n = X n µ σ/ n. Le regole per il calcolo di media e varianza mostrando che per ogni n vale E(Z n ) = 0 V(Z n ) = 1. Il teorema seguente indica che le variabili casuali Z n tendono alla distribuzione normale. Teorema 4 (Teorema centrale del limite). Per ogni a b R 1 P(a Z n b) n 2π b a e x2 2 dx = P(a N(0, 1) b), (1.12) dove N(0, 1) indica una variabile casuale standardizzata. Possiamo scrivere (1.12) come X n µ σ/ n = Z n N(0, 1) 6
7 nel senso che P(a Z n b) P(a N(0, 1) b). Moltiplicando ambo i termini per σ/ n, possiamo anche scrivere che X n µ σ n N(0, 1) = N(0, σ2 n ) implicando (anche se il Teorema centrale dà una relazione un po diversa) che P(a X n µ b) P(a N(0, σ2 n ) b). Sommando infine µ a entrambi i termini si può scrivere che può venire usata nel senso che X n N(µ, σ2 n ) P(a X n b) P(a N(µ, σ2 n ) b). In questo senso possiamo scrivere che la media campionaria può essere approssimata, per n abbastanza grande, da una normale di media µ e varianza σ 2 /n, le cui probabilità si calcolano facilmente con le tavole. Considerando S n = X X n = n X n, possiamo anche scrivere (con qualche improprietà) che Di conseguenza S n nn(µ, σ2 n ) = N(nµ, nσ2 ). P(a S n b) P(a N(nµ, nσ 2 ) b). (1.13) Questa approssimazione si usa in particolare per la distribuzione binomiale. Infatti se X 1,... X n sono variabili casuali bernoulliane, ossia i possibili valori sono 1 (con probabilità p) e 0 (con probabilità 1 p), S n = X 1 + +X n ha distribuzione binomiale di parametri n e p. Da (1.13), abbiamo allora (ricordando che E(X i ) = p e V(X i ) = p(1 p)) P(a B(n.p) b) P(a N(np, np(1 p)) b). (1.14) La relazione (1.14) si usa molto spesso per calcolare le probabilità delle distribuzioni binomiali, appena n non è così piccolo da fare i conti facilmente a mano. 7
8 Densita' chi quadro densità n=1 n=5 n= x Figura 1.1: Densità della distribuzione χ 2 (n) Le distribuzioni chi-quadro e t Alcune distribuzioni collegate alla normale giocano un ruolo importante in statistica, anche grazie al teorema centrale. Precisamente se X 1,..., X n sono variabili normali standard (media = 0, varianza = 1) indipendenti, la somma dei loro quadrati S 2 = X X 2 n segue una distribuzione che è detta chi-quadro con n gradi di libertà. Scriveremo S 2 χ 2 (n). Anche per le distribuzioni chi-quadro esistono tabelle e routine al computer (per esempio in R) per calcolarne i valori. In Figura 1.1 viene mostrata la densità chi-quadro per n = 1, 5 e 10; si vede che, al crescere di n, la densità si sposta verso destra. Ciò è coerente col fatto che se S 2 χ 2 (n) allore E(S 2 ) = n, come si può facilmente calcolare Un risultato molto importante è che la varianza campionaria (1.9) è distribuita come un chi-quadro. Precisamente Teorema 5. Se X 1,..., X n sono variabili normali indipendenti (di media µ e varianza σ 2 ), allora (n 1)S 2 /σ 2 = n i=1 (X i X) 2 σ 2 χ 2 (n 1). (1.15) Inoltre S 2 è indipendente da X µ (che come noto segue una distribuzione normale). 8
9 Il teorema centrale assicura che anche se X 1,..., X n non seguono la distribuzione normale, si ha comunque che (n 1)S 2 /σ 2 tende ad una distribuzione chi-quadro al tendere di n. densità normal t(20) t(5) x Figura 1.2: Densità delle distribuzioni t(n) e N(0, 1). Un altra distribuzione molto usata in statistica è la distribuzione t (di Student) che è il rapporto fra una normale standard e la radice di un chiquadro. Esattamente, se Z N(0, 1) e W χ 2 (n) con Z e W indipendenti, nz/ W t(n), segue la distribuzione t con n gradi di libertà. Anche per la distribuzione t esistono tabelle, ed è fra quelle nell elenco standard di R. In Figura 1.2 viene mostrata la densità t per n = 5 e 20 confrontata con la distribuzione normale standard; si vede che le distribuzioni t sono simmetriche e simili alla normale, ma con la densità più spostata verso le code, ossia, dato a > 0, P( t(n) > a) > P( N(0, 1) > a); al crescere di n, la densità diventa sempre più simile a quella di una normale standard, e anche le tavole non riportano valori per n grande (ad esempio n > 100), nel qual caso si può usare direttamente la distribuzione normale. Segue dal Teorema 5 che, se X 1,..., X n sono variabili normali indipendenti (di media µ e varianza σ 2 ), allora (n 1)S 2 /σ 2 χ 2 (n 1) e ( X µ σ/ n N(0, 1). Allora n 1 n( X µ)/σ (n 1)S2 /σ 2 = n( X µ) S 2 t(n 1). (1.16) Questo fatto è utile in statistica perché la quantità in (1.16) non dipende da σ 2 ma solo da S 2 che si calcola dai dati. Tramite essa sarà possibile calcolare 9
10 intervalli di confidenza per µ tramite la distribuzione t quando (come in genere) σ 2 non è noto a priori. 10
Distribuzioni campionarie. Antonello Maruotti
Distribuzioni campionarie Antonello Maruotti Outline 1 Introduzione 2 Concetti base Si riprendano le considerazioni fatte nella parte di statistica descrittiva. Si vuole studiare una popolazione con riferimento
DettagliSTIMA DELLA VARIANZA CAMPIONARIA
STIMA DELLA VARIANZA CAMPIONARIA Abbiamo visto che una stima puntuale corretta per il valore atteso µ delle variabili aleatorie X i è x n = (x 1 +.. + x n )/n. Una stima puntuale della varianza σ 2 delle
DettagliStatistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali /e S. Borra A. Di Ciaccio - McGraw Hill s. 9. Soluzione degli esercizi del capitolo 9 In base agli arrotondamenti effettuati nei calcoli si
DettagliX = X 1 + X 2 +... + X n. dove. 1 se alla i-esima prova si ha un successo 0 se alla i-esima prova si ha un insuccesso. X i =
PIU DI UNA VARIABILE CASUALE Supponiamo di avere n variabili casuali, X 1, X 2,..., X n. Le n variabili casuali si dicono indipendenti se e solo se P(X 1 x 1 X 2 x 2... X n x n ) = = P(X 1 x 1 ) P(X 2
DettagliSTATISTICA INDUTTIVA: STIMA DI PARAMETRI STIMA PUNTUALE
S.S.I.S TOSCANA F.I.M. -II anno STATISTICA INDUTTIVA: STIMA DI PARAMETRI STIMA PUNTUALE PROBLEMA 1 Vogliamo valutare la percentuale p di donne fumatrici tra le donne in età fertile. Procediamo all estrazione
DettagliStatistica ARGOMENTI. Calcolo combinatorio
Statistica ARGOMENTI Calcolo combinatorio Probabilità Disposizioni semplici Disposizioni con ripetizione Permutazioni semplici Permutazioni con ripetizioni Combinazioni semplici Assiomi di probabilità
DettagliEsercitazione del 29 aprile 2014
Esercitazione del 9 aprile 014 Esercizio 10.13 pg. 94 Complemento: Calcolare la probabilità che un negozio apra tra le sette e venti e le nove e quaranta del mattino. Soluzione: Siccome non è nota la distribuzione
DettagliCapitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari"
Levine, Krehbiel, Berenson Statistica Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari" Unità Integrata Organizzativa
DettagliDistribuzioni e inferenza statistica
Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione
DettagliSTATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA
Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE
DettagliUNIVERSITÀ di ROMA TOR VERGATA
UNIVERSITÀ di ROMA TOR VERGATA Corso di Laurea Magistrale in Scienze della Nutrizione Umana Corso di Statistica Medica, anno 2015-16 P.Baldi Lista di esercizi 4, 11 febbraio 2016. Esercizio 1 Una v.a.
DettagliDistribuzione Gaussiana - Facciamo un riassunto -
Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura
DettagliTeorema del limite centrale TCL
Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazione lineare di N variabili aleatorie le cui funzioni
DettagliDistribuzioni di Probabilità
Distribuzioni di Probabilità Distribuzioni discrete Distribuzione uniforme discreta Distribuzione di Poisson Distribuzioni continue Distribuzione Uniforme Distribuzione Gamma Distribuzione Esponenziale
DettagliEsercitazioni di Statistica
Esercitazioni di Statistica La distribuzione delle statistiche campionarie Teorema del limite centrale Prof. Livia De Giovanni statistica@dis.uniroma.it Esercizio (Scozzafava) Una ferrovia metropolitana
DettagliIl campionamento e l inferenza. Il campionamento e l inferenza
Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento
DettagliTeoremi limite. Enrico Ferrero. 27 febbraio 2007
Teoremi limite Enrico Ferrero 27 febbraio 2007 LA DISEGUAGLIANZA DI CHEBYCHEV Sia X una variabile aleatoria avente valore medio µ e varianza σ 2. Sia poi K un arbitrario numero positivo. È possibile dimostrare
DettagliContenuto del capitolo
Capitolo 8 Stima 1 Contenuto del capitolo Proprietà degli stimatori Correttezza: E(Stimatore) = parametro da stimare Efficienza Consistenza Intervalli di confidenza Per la media - per una proporzione Come
DettagliESERCITAZIONE N. 5 corso di statistica
ESERCITAZIONE N. 5corso di statistica p. 1/27 ESERCITAZIONE N. 5 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONE N. 5corso di statistica p. 2/27 Introduzione Variabili aleatorie discrete
DettagliCampionamento La statistica media campionaria e la sua distribuzione
Campionamento La statistica media campionaria e la sua distribuzione 1 Definisco il problema da studiare: es. tempo di percorrenza tra abitazione e università Carattere: tempo ossia v.s. continua Popolazione:
DettagliMatematica con elementi di Informatica
Statistica descrittiva ed inferenziale Matematica con elementi di Informatica Tiziano Vargiolu Dipartimento di Matematica vargiolu@math.unipd.it Corso di Laurea Magistrale in Chimica e Tecnologie Farmaceutiche
DettagliTecniche di sondaggio
SMID a.a. 2005/2006 Corso di Statistica per la Ricerca Sperimentale Tecniche di sondaggio 24/1/2006 Nomenclatura Indicheremo con P una popolazione, con N la sua numerosità, con k la sua etichetta e con
DettagliLE DISTRIBUZIONI CAMPIONARIE
LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria
DettagliI modelli probabilistici
e I modelli probabilistici Finora abbiamo visto che esistono modelli probabilistici che possiamo utilizzare per prevedere gli esiti di esperimenti aleatori. Naturalmente la previsione è di tipo probabilistico:
DettagliDISTRIBUZIONI DI CAMPIONAMENTO
DISTRIBUZIONI DI CAMPIONAMENTO 12 DISTRIBUZIONE DI CAMPIONAMENTO DELLA MEDIA Situazione reale Della popolazione di tutti i laureati in odontoiatria negli ultimi 10 anni, in tutte le Università d Italia,
DettagliDistribuzione Normale
Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di
DettagliModelli descrittivi, statistica e simulazione
Modelli descrittivi, statistica e simulazione Master per Smart Logistics specialist Roberto Cordone (roberto.cordone@unimi.it) Statistica inferenziale Cernusco S.N., giovedì 25 febbraio 2016 (9.00/13.00)
DettagliModelli matematici di fenomeni aleatori Variabilità e casualità
Modelli matematici di fenomeni aleatori Variabilità e casualità La casualità è alla base della scelta degli individui che compongono un campione ai fini di un indagine statistica. La casualità è alla base
DettagliElementi di Probabilità e Statistica - 052AA - A.A
Elementi di Probabilità e Statistica - 05AA - A.A. 014-015 Prima prova di verifica intermedia - 9 aprile 015 Problema 1. Dati due eventi A, B, su uno spazio probabilizzato (Ω, F, P), diciamo che A è in
DettagliTipi di variabili. Indici di tendenza centrale e di dispersione
Tipi di variabili. Indici di tendenza centrale e di dispersione L. Boni Variabile casuale In teoria della probabilità, una variabile casuale (o variabile aleatoria o variabile stocastica o random variable)
Dettagliassuma valori in un determinato intervallo è data dall integrale della sua densità ( = )=
VARIABILI ALEATORIE CONTINUE Esistono parecchi fenomeni reali per la cui descrizione le variabili aleatorie discrete non sono adatte. Per esempio è necessaria una variabile aleatoria continua ovvero una
DettagliVariabili aleatorie binomiali e di Poisson
Variabili aleatorie binomiali e di Poisson Tiziano Vargiolu Dipartimento di Matematica Pura ed Applicata via Trieste, 63-35121 Padova email: vargiolu@math.unipd.it 9 gennaio 2007 Indice 1 Variabili aleatorie
DettagliUNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. I Esonero - 29 Ottobre Tot.
UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014 I Esonero - 29 Ottobre 2013 1 2 3 4 5 6 7 8 Tot. Avvertenza: Svolgere ogni esercizio nello spazio assegnato,
DettagliVerifica delle ipotesi
Statistica inferenziale Stima dei parametri Verifica delle ipotesi Concetti fondamentali POPOLAZIONE o UNIVERSO Insieme degli elementi cui si rivolge il ricercatore per la sua indagine CAMPIONE Un sottoinsieme
DettagliAPPUNTI DI STATISTICA INFERENZIALE. Avalle Fulvia, maggio 2014, ITSOS MARIE CURIE CLASSI 4A BIO e 4B BIO
APPUNTI DI STATISTICA INFERENZIALE Avalle Fulvia, maggio 2014, ITSOS MARIE CURIE CLASSI 4A BIO e 4B BIO PREREQUISITI VARIABILE ALEATORIA (QUANTITATIVA): è una funzione che associa un numero reale ad ogni
DettagliCP110 Probabilità: Esame 13 settembre Testo e soluzione
Dipartimento di Matematica, Roma Tre Pietro Caputo 2011-12, II semestre 13 settembre, 2012 CP110 Probabilità: Esame 13 settembre 2012 Testo e soluzione 1. (6 pts) Una scatola contiene 10 palline, 8 bianche
DettagliVariabili aleatorie. Variabili aleatorie
Variabili aleatorie Distribuzione binomiale Si supponga che uno studente affronti un esame composto da domande chiuse. Una sola delle 5 alternative di risposta proposta per ciascuna domanda è vera Supponiamo
DettagliEsercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo
Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo 1. Gli studi di simulazione possono permetterci di apprezzare alcune delle proprietà di distribuzioni campionarie ricavate
DettagliCampionamento e stima di parametri
Sia X una variabile aleatoria associata a un dato esperimento. Ripetiamo l esperimento n volte, ottenendo una famiglia di valori sperimentali della v.a. X : X = (X 1, X 2,..., X n ) ogni X i é una v.a.
DettagliLA LUNGHEZZA DEI GENI UMANI (Es4.1)
STATISTICA INFERENZIALE: le caratteristiche della popolazione complessiva sono indotte da quelle osservate su un campione estratto dalla popolazione stessa(esempio exit poll) PROBLEMA: dato un campione
DettagliPROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE
PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE 1. Distribuzione congiunta Ci sono situazioni in cui un esperimento casuale non si può modellare con una sola variabile casuale,
DettagliCapitolo 7. Distribuzioni campionarie. Statistica. Levine, Krehbiel, Berenson
Levine, Krehbiel, Berenson Statistica Capitolo 7 Distribuzioni campionarie Insegnamento: Statistica Applicata Corsi di Laurea in "Scienze e tecnologie Alimentari" Unità Integrata Organizzativa Agraria,
DettagliLa media campionaria. MEDIA CAMPIONARIA Date n v.a. X 1,..., X n indipendenti e identicamente distribuite (in breve i.i.d.), la v.a.
La media MEDIA CAMPIONARIA Date n v.a. X 1,..., X n indipendenti e identicamente distribuite (in breve i.i.d.), la v.a. X n = 1 n è detta media. n X i, i=1 In altre parole, se le X 1,...,X n sono il risultato
DettagliUtilizzando la terminologia generica di prima, la variabile standardizzata X si calcola quindi
La variabile standardizzata Utilizzando la terminologia generica di prima, la variabile standardizzata X si calcola quindi X'= X Media(X ) DS(X ) Visto l ampio uso in statistica di questa procedura, la
DettagliUniversità del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica
Università del Piemonte Orientale Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia Corso di Statistica Medica Le distribuzioni teoriche di probabilità La distribuzione Normale (o di
DettagliEsercitazioni di statistica
Esercitazioni di statistica Intervalli di confidenza Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 10 Dicembre 2014 Stefania Spina Esercitazioni di statistica 1/43 Stefania Spina
DettagliGli intervalli di confidenza. Intervallo di confidenza per la media (σ 2 nota) nel caso di popolazione Gaussiana
Statistica Lez. 1 Gli intervalli di confidenza Intervallo di confidenza per la media (σ nota) nel caso di popolazione Gaussiana Sia X una v.c Gaussiana di media µ e varianza σ. Se X 1, X,..., X n è un
DettagliStatistica Corso Base (Serale) Dott.ssa Cristina Mollica
Statistica Corso Base Serale Dott.ssa Cristina Mollica cristina.mollica@uniroma1.it Campionamento Esercizio 1. Da una ricerca si è osservato che il peso del prodotto A varia tra i e i 530 grammi. 1 Ipotizzando
DettagliRICHIAMI DI CALCOLO DELLE PROBABILITÀ
UNIVERSITA DEL SALENTO INGEGNERIA CIVILE RICHIAMI DI CALCOLO DELLE PROBABILITÀ ing. Marianovella LEONE INTRODUZIONE Per misurare la sicurezza di una struttura, ovvero la sua affidabilità, esistono due
DettagliTutorato di Complementi di Analisi Matematica e Statistica 30 maggio 2016
Tutorato di Complementi di Analisi Matematica e Statistica 30 maggio 2016 Esercizi possibili di probabilità e statistica Notazioni: U(a, b) è la distribuzione di probabilità uniforma nell intervallo (a,
Dettaglilezione 4 AA Paolo Brunori
AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente
DettagliIndici di posizione e dispersione per distribuzioni di variabili aleatorie
Indici di posizione e dispersione per distribuzioni di variabili aleatorie 12 maggio 2017 Consideriamo i principali indici statistici che caratterizzano una distribuzione: indici di posizione, che forniscono
DettagliSTATISTICA (modulo II - Inferenza Statistica) Soluzione Esercitazione I
Soluzione Esercitazione I Esercizio A. Si indichi con A i l evento la banca i decide di aprire uno sportello per il quale Pr(A i = 0.5 (e dunque Pr(A i = 0.5 per i =, 2, 3. Lo spazio degli eventi dato
DettagliTeorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazion
Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazione lineare di N variabili aleatorie le cui funzioni
DettagliCampionamento. Una grandezza fisica e' distribuita secondo una certa PDF
Campionamento Una grandezza fisica e' distribuita secondo una certa PDF La pdf e' caratterizzata da determinati parametri Non abbiamo una conoscenza diretta della pdf Possiamo determinare una distribuzione
DettagliIl Teorema del limite Centrale (TLC)
(TLC) Teorema. Sia X 1,..., X n un campione i.i.d. per una v.a. X, avente E(X ) = µ e Var(X ) = σ 2 entrambi finiti. Allora Z n = X µ σ 2 n n Y N(0, 1) Si noti che nel calcolare Z n ho standardizzato X.
DettagliStatistica Inferenziale
Statistica Inferenziale Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Riepilogo lezione 5 Abbiamo visto: Modelli probabilistici nel continuo Distribuzione uniforme continua Distribuzione
DettagliVARIABILI CASUALI CONTINUE
p. 1/1 VARIABILI CASUALI CONTINUE Una variabile casuale continua può assumere tutti gli infiniti valori appartenenti ad un intervallo di numeri reali. p. 1/1 VARIABILI CASUALI CONTINUE Una variabile casuale
DettagliStatistica Inferenziale
Statistica Inferenziale Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Riepilogo lezione 6 Abbiamo visto: Definizione di popolazione, di campione e di spazio campionario Distribuzione
DettagliProbabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva
Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.
DettagliProbabilità e Statistica
Cognome e Nome............................................................................... C. d. L.: GESL Anno di Corso: 1 2 3 altro Matricola....................................... Firma.......................................
DettagliLaboratorio di Chimica Fisica. Analisi Statistica
Università degli Studi di Bari Dipartimento di Chimica 9 giugno F.Mavelli- Laboratorio Chimica Fisica - a.a. 3-4 F.Mavelli Laboratorio di Chimica Fisica a.a. 3-4 Analisi Statistica dei Dati Analisi Statistica
DettagliCostruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini. Lezione 7: Basi di statistica
Costruzione di macchine Modulo di: Progettazione probabilistica e affidabilità Marco Beghini Lezione 7: Basi di statistica Campione e Popolazione Estrazione da una popolazione (virtualmente infinita) di
DettagliDistribuzioni di probabilità
Distribuzioni di probabilità Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione
DettagliLa distribuzione t. Federico Plazzi. 7 Novembre 2015
La distribuzione t Federico Plazzi 7 Novembre 2015 Popolazione e campioni Popolazione e campioni Definizioni ed assunzioni di partenza Campione: l insieme di individui che abbiamo potuto osservare. Popolazione
DettagliDistribuzione Normale
Distribuzione Normale istogramma delle frequenze di un insieme di misure relative a una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata
DettagliDistribuzione normale
Distribuzione normale istogramma delle frequenze di un insieme di misure relative a una grandezza che varia con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata
DettagliLA MEDIA CAMPIONARIA 14-1
LA MEDIA CAMPIONARIA Prendiamo un urna e inseriamo 10 palline numerate da 0 a 9 (questa è la nostra popolazione ). La media dei 10 valori è 4.5 (questa è la media vera µ). La varianza dei 10 valori è 8.25
DettagliAlcune formule di statistica inferenziale per il corso di Matematica e Statistica II A. A. 2009/10
Alcune formule di statistica inferenziale per il corso di Matematica e Statistica II A. A. 2009/10 Andrea Pugliese 1 Valore atteso e varianza di variabili casuali Definizione 1. Se X è una variabile casuale
Dettaglic) Ancora in corrispondenza allo stesso valore di p e ponendo Y = minorazione, fornita dalla diseguaglianza di Chebichev, per la probabilita
Laurea Triennale in Matematica Corso di Calcolo delle Probabilita I A.A. 00/00 (Docenti: M. Piccioni, F. Spizzichino) a prova di esonero 6 giugno 00 Risolvere almeno tre dei seguenti esercizi.. Indichiamo
DettagliUniversità degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1
Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1 Lezione 1 - Martedì 23 Settembre 2014 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,
DettagliModelli probabilistici variabili casuali
Modelli probabilistici variabili casuali Le variabili casuali costituiscono il legame tra il calcolo della probabilità e gli strumenti di statistica descrittiva visti fino ad ora. Idea: pensiamo al ripetersi
DettagliVariabili aleatorie Parte I
Variabili aleatorie Parte I Variabili aleatorie Scalari - Definizione Funzioni di distribuzione di una VA Funzioni densità di probabilità di una VA Indici di posizione di una distribuzione Indici di dispersione
DettagliUNIVERSITÀ di ROMA TOR VERGATA
UNIVERSITÀ di ROMA TOR VERGATA Corso di Statistica, anno 00- P.Baldi Lista di esercizi. Corso di Laurea in Biotecnologie Esercizio Si sa che in una schedina del totocalcio i tre simboli, X, compaiono con
DettagliCP110 Probabilità: Esame 4 giugno Testo e soluzione
Dipartimento di Matematica, Roma Tre Pietro Caputo 202-3, II semestre 4 giugno, 203 CP0 Probabilità: Esame 4 giugno 203 Testo e soluzione . (6 pts) Un urna contiene inizialmente pallina rossa e 0 palline
DettagliStatistica Inferenziale
Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione
DettagliLA DISTRIBUZIONE NORMALE o DI GAUSS
p. 1/2 LA DISTRIBUZIONE NORMALE o DI GAUSS Osservando gli istogrammi delle misure e degli scarti, nel caso di osservazioni ripetute in identiche condizioni Gli istogrammi sono campanulari e simmetrici,
DettagliUlteriori Conoscenze di Informatica e Statistica
Ulteriori Conoscenze di Informatica e Statistica Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 (I piano) tel.: 06 55 17 72 17 meneghini@fis.uniroma3.it Indici di forma Descrivono le
DettagliStatistica Applicata all edilizia: Stime e stimatori
Statistica Applicata all edilizia E-mail: orietta.nicolis@unibg.it 15 marzo 2011 Statistica Applicata all edilizia: Indice 1 2 Statistica Applicata all edilizia: Uno dei problemi principali della statistica
DettagliVedi: Probabilità e cenni di statistica
Vedi: http://www.df.unipi.it/~andreozz/labcia.html Probabilità e cenni di statistica Funzione di distribuzione discreta Istogrammi e normalizzazione Distribuzioni continue Nel caso continuo la probabilità
DettagliProbabilità 1, laurea triennale in Matematica I prova scritta sessione estiva a.a. 2008/09
Probabilità, laurea triennale in Matematica I prova scritta sessione estiva a.a. 2008/09. Due roulette regolari vengono azionate più volte; sia T il numero di volte che occorre azionare la prima roulette
Dettagli05. Errore campionario e numerosità campionaria
Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,
DettagliElaborazione statistica di dati
Elaborazione statistica di dati 1 CONCETTI DI BASE DI STATISTICA ELEMENTARE 2 Taratura strumenti di misura IPOTESI: grandezza da misurare identica da misura a misura Per la presenza di errori casuali,
DettagliMATEMATICA E STATISTICA CORSO A SCIENZE BIOLOGICHE MOLECOLARI ESERCITAZIONE
MATEMATICA E STATISTICA CORSO A SCIENZE BIOLOGICHE MOLECOLARI ESERCITAZIONE 5-3-09 ES1-Se la probabilità di colpire un bersaglio è 1/5 e rimane tale ad ogni tentativo, calcola la probabilità che, sparando
DettagliRichiami di inferenza statistica Strumenti quantitativi per la gestione
Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Parametri e statistiche Esempi Tecniche di inferenza Stima Precisione delle stime Intervalli
DettagliP (CjB m )P (B m ja) = p:
Esonero di Calcolo delle Probabilità del 7/04/ ESERCIZIO. Nel gioco del domino le tessere (di solito nere) sono divise in due riquadri, su ciascuno dei quali viene riportato, quale punteggio, un certo
DettagliCP210 Introduzione alla Probabilità: Esame 2
Dipartimento di Matematica, Roma Tre Pietro Caputo 2018-19, II semestre 9 luglio, 2019 CP210 Introduzione alla Probabilità: Esame 2 Cognome Nome Matricola Firma Nota: 1. L unica cosa che si può usare durante
DettagliCapitolo 11 Test chi-quadro
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara Docenti: Dott.
DettagliUNIVERSITÀ di ROMA TOR VERGATA
UNIVERSITÀ di ROMA TOR VERGATA Corso di Laurea Magistrale in Scienze della Nutrizione Umana Corso di Statistica Medica, anno 205- P.Baldi Lista di esercizi 5, 8 febbraio 20. Esercizio Si fanno 25 estrazioni
DettagliRichiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer
Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Inferenza statistica: insieme di tecniche che si utilizzano per ottenere informazioni su una
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. La distribuzione Normale (o di Gauss)
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica La distribuzione Normale (o di Gauss) Corso di laurea in medicina e chirurgia - Corso di Statistica
DettagliDispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
DettagliDispensa sulla funzione gaussiana
Sapienza Università di Roma Dipartimento di Scienze di Base e Applicate per l Ingegneria Sezione di Matematica Dispensa sulla funzione gaussiana Paola Loreti e Cristina Pocci A. A. 011-01 1 Introduzione:
DettagliCalcolo delle Probabilità e Statistica Matematica previsioni 2003/04
Calcolo delle Probabilità e Statistica Matematica previsioni 2003/04 LU 1/3 Esempi di vita reale : calcolo delle probabilità, statistica descrittiva e statistica inferenziale. Lancio dado/moneta: definizione
DettagliCP110 Probabilità: Esame 5 giugno Testo e soluzione
Dipartimento di Matematica, Roma Tre Pietro Caputo 21-11, II semestre 5 giugno, 212 CP11 Probabilità: Esame 5 giugno 212 Testo e soluzione 1. (6 pts) Sette biglietti numerati da 1 a 7 vengono distribuiti
DettagliDistribuzione Normale
Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di
Dettagli