oggetti?, coefficiente binomiale. Dimostrazione usando i due esempi precedenti (detti

Documenti analoghi
Statistica I - A.A

Campionamento casuale da popolazione finita (caso senza reinserimento )

Statistica I, Laurea triennale in Ing. Gestionale, a.a /11 Registro delle lezioni

Stime puntuali. Statistica e biometria. D. Bertacchi. Stime puntuali. Intervalli di confidenza. Approfondiamo

ALCUNI ESERCIZI SUI TEST DI IPOTESI PARAMETRICHE PARTE 1

COME CALCOLARE L INTERVALLO DI CONFIDENZA QUANDO E NECESSARIO STIMARE LA DEVIAZIONE STANDARD? (è quasi sempre così!)

Università degli Studi di Cassino, Anno accademico Corso di Statistica 2, Prof. M. Furno

Soluzione CPS 22/6/04. I parte. (1). Chiamiamo C l evento l individuo scelto ha il colesterolo alto, V, O e NL rispettivamente

Popolazione e Campione

Appunti di STATISTICA

Statistica. Esercitazione 12. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice

Popolazione e Campione

Tutorato di Probabilità 1, foglio I a.a. 2007/2008

Intervalli di Fiducia

SUCCESSIONI DI FUNZIONI

Matematica con elementi di Informatica

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità D

Esperimentazioni di Fisica 1. Prova scritta del 1 febbraio 2016 SOLUZIONI

Metodi di valutazione delle prestazioni di rete

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità B - Soluzione

Esercitazione sette: soluzioni. H 1 : θ > 0.48 ( =

Costo manutenzione (euro)

Lezioni del Corso di Fondamenti di Metrologia Meccanica

Lezione 4 Corso di Statistica. Francesco Lagona

Registro di MMS parte di Statistica a.a. 2007/08

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2013

Corso di Laurea Triennale in Matematica Calcolo delle Probabilità I (docenti G. Nappo, F. Spizzichino)

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità C

Probabilità e Statistica (cenni)

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità A - Soluzioni

Alcuni concetti di statistica: medie, varianze, covarianze e regressioni

Corso di Laurea in Ingegneria Informatica Anno Accademico 2016/2017 Calcolo delle Probabilità e Statistica Matematica

Statistica I, Laurea triennale in Ing. Gestionale, a.a. 2011/12 Registro delle lezioni

Argomenti. Stima Puntuale e per Intervallo. Inferenza. Stima. Leonardo Grilli. Università di Firenze Corso di Laurea in Statistica Statistica

Stimatori corretti, stimatori efficaci e disuguaglianza di Cramer Rao

Stimatori, stima puntuale e intervalli di confidenza Statistica L-33 prof. Pellegrini

Tecnica delle misurazioni applicate LM - Esame del 26 febbraio 2013

1 Famiglia delle densità gamma

Scheda n.6: legame tra due variabili; correlazione e regressione

Distribuzione normale o gaussiana

Insiemi numerici. Sono noti l insieme dei numeri naturali: N = {1, 2, 3, }, l insieme dei numeri interi relativi:

Distribuzione normale

Corso di Statistica. Test per differenza tra medie e proporzioni. Prof.ssa T. Laureti a.a

Esercitazioni del Corso di Probabilitá e Statistica Lezione 6: Stime di parametri puntuali e per intervalli

Una funzione delle osservazioni campionarie è una statistica che, nel contesto della stima di un parametro, viene definita stimatore.

Statistica 1 A.A. 2015/2016

1 Sulla dimostrazione del TLC

Teoria dei Fenomeni Aleatori AA 2012/13

Metodi quantitativi per l analisi dello sviluppo

Inferenza Statistica. L inferenza statistica cerca di risalire al modello del fenomeno sulla base delle osservazioni.

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 6

ANalysis. Analisi della Varianza - ANOVA. Aprile, Aprile, Nel linguaggio delle variabili le operazioni fondamentali sono tre

Teoria dei Fenomeni Aleatori AA 2012/13

LEGGE DEI GRANDI NUMERI

Corso di Statistica Canale E Bini, Cutillo A.A. 2017/2018. Esercitazione di riepilogo n.8 Test di ipotesi Soluzioni

Università degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A

Titolo della lezione. Campionamento e Distribuzioni Campionarie

Università degli Studi di Salerno Pietro Coretto. Corso di Statistica FORMULARIO

STUDIO DEL LANCIO DI 3 DADI

Statistica. Lezione 5

Anemia. Anemia - percentuali

ESERCIZI - FASCICOLO 1

Probabilità CENNI DI PROBABILITÀ

1. a n = n 1 a 1 = 0, a 2 = 1, a 3 = 2, a 4 = 3,... Questa successione cresce sempre piú al crescere di n e vedremo che {a n } diverge.

STATISTICA INFERENZIALE

Stima della media di una variabile X definita su una popolazione finita

Esercizi di Calcolo delle Probabilità Foglio 7

Esame di Statistica A-Di Prof. M. Romanazzi

Seconda Prova Intermedia 28 Maggio 2019 Elementi di Probabilità e Statistica, Laurea Triennale in Matematica, M. Romito, M.

( 4) ( ) ( ) ( ) ( ) LE DERIVATE ( ) ( ) (3) D ( x ) = 1 derivata di un monomio con a 0 1. GENERALITÀ

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

Le principali procedure inferenziali: nozioni, schemi di procedimento ed esempi di applicazione

(a 0, a 1, a 2,..., a n,...) (0, a 0 ), (1, a 1 ), (2, a 2 ),... (1, 3, 5, 7,...) Lezione del 26 settembre. 1. Successioni.

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica

Lezione 4 Corso di Statistica. Domenico Cucina

PROVA SCRITTA DI STATISTICA CLEA-CLEFIN-CLELI (COD e 4038) 15 gennaio 2003

APPROSSIMAZIONE NORMALE. 1. Si tirano 300 dadi non truccati. Sia X la somma dei punteggi. Calcolare approssimativamente le probabilità seguenti.

Si estendono, in modo non banale, le operazioni di somma e prodotto da Q ad R; con queste operazioni R e un campo.

SERIE NUMERICHE FAUSTO FERRARI

La stima per intervalli

Appunti complementari per il Corso di Statistica

1.6 Serie di potenze - Esercizi risolti

Scrivere su ogni foglio NOME e COGNOME. Le risposte devono essere giustificate sui fogli protocollo e riportate nel foglio RISPOSTE.

Esercizi di Analisi II

ELEMENTI DI CALCOLO COMBINATORIO

2,3, (allineamenti decimali con segno, quindi chiaramente numeri reali); 4 ( = 1,33)

Esercizi settimana 10

1 Esercizi tutorato 27/5

0.1 Esercitazioni V, del 18/11/2008

Corso Propedeutico di Matematica

4 - Le serie. a k = a k. S = k=1

Il risultato di una prova è un n. aleatorio Funzioni degli esiti: Ω IR X, Y, Z,... funzioni, X(ω), Y (ω), Z(ω)

4. L ipotesi è falsa e la rifiuto bene. H 0 ) p = 0.5. Facciamo dunque n lanci. Otteniamo k teste ed n k croci:

7. Test d ipotesi. 2. L ipotesi è vera ma in base ai dati la rifiuto in questo caso si dice che si commette errore di prima specie

Quesito 1. I seguenti dati si riferiscono ai tempi di reazione motori a uno stimolo luminoso, espressi in decimi di secondo, di un gruppo di piloti:

STATISTICA A K (63 ore) Marco Riani

Statistica inferenziale, Varese, 25 novembre 2008 Prima parte - Modalità A - soluzione

Calcolo Combinatorio

Transcript:

Descrizioe sommaria degli argometi svolti a lezioe, ao accademico 006-07 Lezioe 1 (7/, ore). Itroduzioe al corso (lezioi ed esercitazioi: Fraco Fladoli e David Barbato; testo: S. Ross, Probabilità e Statistica per l Igegeria e le Scieze, Apogeo 00; materiale complemetare e soprattutto compiti d esame risolti: i rete alle pagie di Gubielli e Fladoli). Si comicia dal Capitolo 3: oggetti del calcolo delle probabilità: uiverso o spazio degli eveti elemetari, eveti come sottoisiemi dell uiverso (corrispodeza co le affermazioi o proposizioi) ed operazioi di uioe, itersezioe e complemetare sugli eveti (corrispodeza co le operazioi di o, e e o su proposizioi); probabilità (come fuzioe dagli eveti ai umeri di 0,1 ) e sue regole. Probabilità codizioale (uiverso ridotto a B quado si sa che l eveto B si è verificato e uova valutazioe delle probabilità dei vari eveti); formula di fattorizzazioe. Tutte le ozioi soo state esemplificate tramite l esercizio 1.i del 4/6/0 (homepage Gubielli). Osservazioi sulle probabilità codizioate: si comportao come probabilità, ad esempio el seso che P A c B 1 P A B. Ivece o c è alcua relazioe tra P A B e P A B c. Lezioe (8/, ore). Richiami su quato visto ella lezioe 1. Formula di Bayes: dimostrazioe, iterpretazioe come mezzo per il calcolo della probabilità delle cause quado si osserva u determiato effetto (cooscedo le probabilità codizioate degli effetti sapedo le cause). I igegeria serve ad esempio ella ricostruzie di segali e ella ricerca delle cause di guasti. Esemplificazioe tramite l esercizio 1.ii del 4/6/0. Elemeti facili di calcolo combiatorico. Pricipio di eumerazioe. Esempio 1: permutazioi (riordiameti possibili di oggetti diversi); loro cardialità! (dimostrazioe tramite pricipio di eumerazioe). Esempio : disposizioi di elemeti i posti; loro cardialità 1 1 (dimostrazioe tramite pricipio di eumerazioe). Riformulazioe delle disposizioi: umero di strighe ordiate di elemeti che si possoo formare co oggetti. Esempio 3: umero di isiemi (o ordiati) di elemeti che si possoo formare co oggetti?, coefficiete biomiale. Dimostrazioe usado i due esempi precedeti (detti D, e C, i umeri degli esempi e 3, vale D, C,!). Spazi fiiti ( 1,..., N, probabilità descritta dai umeri p 1,...,p N dati da p i P i ), spazi equiprobabili (p i 1, P A A, dove A idica il umero di N N elemeti i A). Per casa: esercizio del Lotto: vegoo estratti cique umeri diversi dai primi 90 umeri; o si cosidera l ordie; che probabilità c è di effettuare u ambo (cioè di dichiarare, prima dell estrazioe, due umeri che poi risultao estratti)? Lezioe 3 (1/3, 1 ora). Iterpretazioe co albero della formula di fattorizzazioe e del calcolo della causa più probabile (ell uso della formula di Bayes). Esercizi 1.1 del /7/03 e 5 del 17/5/03. Lezioe 4 (6/3, ore). Argometi previsti. Defiizioe di idipedeza tra due eveti A e B, prima a partire dalla probabilità codizioale (P A P A B ), poi ella forma simmetrica P A B P A P B. Esercizio 1.3 del /7/03. Complemeti di calcolo combiatorico. I quati modi si possoo mettere crocette i caselle ordiate?. Se chiamiamo successi le crocette, esperimeti le caselle, è il umero di modi co cui si possoo realizzare successi i esperimeti.

Probabilità di successi i prove (esperimeti) idipedeti, ciascua co probabilità di successo p: p 1 p 0,1,...,. Lo abbiamo dimostrato el seguete modo. Abbiamo preso u uiverso S formato dalle strighe di zeri o ui, dove uo sta per successo e zero per isuccesso. La probabilità di ua striga co successi è p 1 p (gli esperimeti soo idipedeti, quidi la probabilità che simultaeamete succedao certe cose ei vari esperimeti è il prodotto delle probabilità). Posto A l isieme i S di tutte le strighe co successi, dobbiamo calcolare P A. Ma ciascu elemeto di A ha probabilità p 1 p e ci soo elemeti i A. Pertato P A, essedo la somma delle probabilità dei suoi elemeti, vale p 1 p. Iizio dello studio dei capitoli 4 e 5 del Ross. Variabili aleatorie (per ora discrete). Alcui esempi di variabili aleatorie emerse ell esercizio 1.3 del /7/03. Defiizioe di v.a. di Beroulli di parametro p (X che può assumere solo i valori 0 e 1, co P X 1 p, P X 0 1 p). Defiizioe di v.a. biomiale di parametri e p: somma di v.a. di Beroulli idipedeti di parametro p, ovvero umero di successi i prove idipedeti co probabilità di successo p i ciascua prova; vale P X p 1 p, 0,1,...,. Lezioe 5 (7/3, ore). Esercitazioe. 1.3 del 4/6/0 sulla distribuzioe biomiale. 1.a e 1.b del 30/5/06 su probabilità codizioali, fattorizzazioe e distribuzioe biomiale. 1.1 e 1. del 1/6/06 su coefficiete biomiale e probabilità elemetare. 1 del 17/5/06 risolto co l albero. 1.1 del 9//1006 risolto co l albero. Di quest ultimo esercizio si possoo già fare ache i puti due e tre. Lezioe 6 (8/3, 1 ora). Variabili aleatorie discrete: loro descrizioe tramite i valori e la massa (o distribuzioe) di probabilità. Rappresetazioe grafica della massa di probabilità. V.a. di Beroulli, biomiale, verifica della somma pari ad uo, grafico. Defiizioe di v.a. di Poisso, verifica della somma pari ad uo, e teorema degli eveti rari (dimostrato). Lezioe 7 (13/3, ore). Media aritmetica di u campioe; valor medio (o atteso) di ua v.a. discreta; suo legame ituitivo co la media aritmetica; defiizioe di variaza; proprietà del valor medio (liearità; ; esempi di valor medio e variaza per v.a. di Beroulli, biomiali e di Poisso. Lezioe 8 (14/3, ore). Defiizioe dei mometi. Fuzioe geeratrice dei mometi (FGM) di ua v.a. Defiizioe X t E e tx. Proprietà pricipali: le derivate i zero della X t dao il valor medio delle poteze di X: 0 E X, 0 E X ; la FGM della somma di due v.a. idipedeti è uguale al prodotto delle rispettive FGM. Dimostrazioe di queste proprietà.calcolo della geeratrice per le v.a. di Beroulli, biomiale e Poisso e calcolo di media e variaza di queste variabili tramite la geeratrice. Verifica che la geeratrice di ua B,p tede a quella di ua P el regime del teorema degli eveti rari. Lezioe 9 (15/3, 1 ora). Proprietà della variaza; calcolo di valor medio e variaza per v.a. di Beroulli, biomiali e di Poisso, seza la geeratrice. Lezioe 10 (0/3, ore). Esercizi vari su calcoli di valori medi, variaza, geeratrice per alcue variabili discrete. Fuzioe di distribuzioe (ripartizioe) cumulativa: defiizioe e rappresetazioe grafica. Lezioe 11 (1/3, 1 ora). Esercizi sulla cumulativa ed sui valori medi. I particolare, es. del 4/4/03 ed alcui da altri compitii di Aprile. Lezioe 1 (/3, 1 ora). V.a. geometriche, proprietà di macaza di memoria, esempio

del lotto (i umeri ritardatari hao la stessa probabilità degli altri). Nascoo el problema dell istate del primo successo i ua sequeza di esperimeti idipedeti: ua v.a. geometrica rappreseta tale primo istate. Queste cose o soo i programma ma solo facoltative. Ivece, soo i programma le segueti defiizioi e risultati (che si suggerisce di copiare sul formulario): X è geometrica di parametro p 0,1 se assume i valori 1,,... co probabilità Media, variaza e fuzioe geeratirce soo P X pq 1. 1 p, q p, t pe t 1 qe t. Lezioe 13 (7/3, ore). Esercizi sul calcolo di probabilità e valori medi per v.a. discrete, e di loro trasformazioi. V.a. cotiue: esempi a livello ituitivo; desità di probabilità, legame tra suoi itegrali e probabilità associate alla v.a. Esempio delle v.a. uiformi: calcolo della costate di ormalizzazioe e di alcue probabilità. Esempio delle v.a. espoeziali di parametro : calcolo della costate di ormalizzazioe e di alcue probabilità. Calcolo della fuzioe di ripartizioe cumulativa e della fizioe di affidabilità P X t e t. Lezioe 14 (8/3, ore). Esercizi sul calcolo di probabilità e valori medi per v.a. discrete, e di loro trasformazioi. V.a. cotiue: valor medio. Defiizioe, osservazioi sulle possibili divergeze, calcolo per le v.a. uiformi ed espoeziali. Iterpretazioe grafica del risultato 1. Lezioe 15 (9/3, 1 ora). Esercitazioe (compitio). Lezioe 16 (3/4, ore). V.a. cotiue: valore medio di ua trasformazioe, E g X g x f x dx. Formula per la variaza di ua v.a. cotiua. Variaza di ua 1 v.a. espoeziale:. Somigliaza tra v.a. geometriche ed espoeziali. Macaza di memoria dell espoeziale (dimostrazioe). Fuzioe geeratrice dei mometi per v.a. cotiue. Esercizi per casa: verificare che la geeratrice di ua Exp è t, defiita solo per t. Usarla per calcolare media t e variaza. Verificare che la somma di due v.a. espoeziali idipedeti o è espoeziale. Desità gaussiaa stadard. Fuzioe geeratrice della gaussiaa stadard: t e t. Verifica che la media è zero, la variaza uo. Desità gaussiaa geerica, co parametri e. Seza dimostrazioe, viee affermato che la geeratrice è t e t t e che da essa si verifica che e soo media e variaza. Grafico della desità gaussiaa geerica, differeze rispetto alla stadard. Defiizioe della fuzioe x, fuzioe di ripartizioe cumulativa della gaussiaa stadard. Lezioe 17 (4/4, ore). Se X N, allora la sua fuzioe di ripartizioe cumulativa F x si può calcolare come F x x (dimostrazioe). Vale x 1 x, utile per ricodursi alle tavole quado x 0. Esercizi vari di calcolo di probabilità del tipo P X e P X per X N,.

Defiizioe di quatile q e di z ( q 1 ). Primi esercizi sul calcolo di quatili. Euciata la proprietà q q 1, utile per ricodursi alle tavole quado 1/. Teorema: X, Y gaussiae idipedeti,,, umeri reali, implica X Y gaussiaa. Dimostrazioe usado le geeratrici. Media e variaza di X Y si calcolao ache i modo elemetare, solo la gaussiaità o è facile. Lezioe 18 (1/4, 1 ora). Come passare da ua gaussiaa geerica alla gaussiaa stadard. Come calcolare la fuzioe x co x positivo e egativo usado la tabella; come calcolare i quatili usado la tabella, per maggiore di u mezzo e miore di u mezzo. Esercizi: per X~N 5;16 calcolare P X 9 e trovare tale che P X 0.8,Per X~N 1;1 calcolare P X 3. Per X~N 5;4 calcolare P X 5 1. Per casa: data X~N 7;8 trovare tale che P X 0.1. Lezioe 19 (17/4, ore). Statistica: studieremo due problemi pricipali, la costruzioe di u modello e la verifica di u modello. Per modello itediamo la distribuzioe di probabilità di ua gradezza aleatoria. Es.: il prezzo a metro quadro degli alloggi di ua certa zoa. Prima di tutto si deve decidere la classe di distribuzioi che vogliamo usare (gaussiae, Poisso, ecc.). Nella realtà applicativa, questo passo è molto difficile; u aiuto viee dal tracciare u istogramma a partire da alcui dati sperimetali. Se ad esempio abbiamo i valori del prezzo a metro quadro relativi a 50 appartameti, possiamo usare questi dati per tracciare u istogramma. A volte esso suggerisce (etro certi limiti) ua classe da usare. Scelta la classe, resta il problema di stimare i parametri. Idichiamo co X 1,...,X u campioe (i valori che otterremo co esperimeti o osservazioi; scriveremo ivece x 1,...,x per i valori umerici specifici otteuti i esperimeti già eseguiti). Le v.a. X 1,...,X soo (per defiizioe di campioe) idipedeti e co la stessa distribuzioe. Idichiamo co e la media e variaza, comue, di queste variabili. Per stimare la media si usa X X 1... X. Vale E X (veirificato), che si iterpreta dicedo che X è uo stimatore corretto o o distorto di. Vale ioltre Var X, che iterpretata ache graficamete fa capire che, per grade, i valori più probabili di X sarao vicii a. Ioltre, se le X 1,...,X soo gaussiae, allora lo è ache X, cioè X N,. A partire da questo fatto si ottiee subito P X. Chiamado 1 il termie a destra e risolvedo i si trova il risultato fodametale P X q 1 1. Questo viee espresso siteticamete come X q 1 co probabilità 1. L itervallo X q 1 si dice itervallo di cofideza. Lezioe 0 (18/4, ore). Dopo aver riassuto i risultati precedeti e svolto u esercizio, si osserva che la precisioe q 1 dell itervallo di cofideza peggiora, el seso che cresce, se si richiede u rischio iferiore, cioè si richiede u risultato più sicuro (per irsultato itediamo la dichiarazioe dell itervallo). Ioltre, la precisioe aumeta el seso che decresce, se si prede più grade. Però va quadruplicata la umerosità per dimezzare. Viee euciato il teorema limite cetrale, itepretata la stadardizzazioe. Viee poi utilizzato per arrivare all affermazioe: Se X è qualsiasi co media e variaza,,

sappiamo che X q 1 vale co probabilità che tede a 1 per. Quidi la teoria degli itervalli di cofideza fi qui vista si applica, almeo approssimativamete, a tutte le distribuzioi (per umerosità gradi). Lezioe 1 (19/4, 1 ora). Riassuto della situazioe, prima di passare ai test. Il problema della stima asce quado si ha u problema descritto da ua gradezza aleatoria di cui o si coosce la distribuzioe di probabilità. Bisoga scegliere la classe (es. gaussiae, Poisso,...) e ricodursi al problema di stimare i parametri. Sappiamo stimare il valor medio, tramite X; sappiamo che X è uo stimatore o distorto di. Se X è gaussiaa N,, sappiamo che X q 1 co probabilità 1. Se X è qualsiasi co media e variaza,, sappiamo che X q 1 vale co probabilità che tede a 1 per (purtroppo l approssimazioe o è cotrollata). Fatte queste premesse, osserviamo che per molte classi di distribuzioi alcui parametri soo o si ricoducoo al valor medio: per la Beroulli p, p è ; così per le Poisso e aturalmete per le gaussiae. Ma per le geometriche ed espoeziali il parametro è il reciproco della media: 1 per Exp, ad esempio. Quidi stimiamo co 1. Va bee, X ma va osservato che 1 o è uo stimatore o distorto. X Altri parametri richiedoo altri stimatori. La variaza si può stimare co 1 i 1 X i, che è o distorto. Purtroppo è basato su che di solito è icogito quato. E aturale itrodurre la variate 1 i 1 X i X basata solo sul campioe sperimetale, ma si dimostra che E 1 i 1 X i X 1, cioè è distorto (di poco). Per questo si preferisce lo stimatore S : 1 1 X i X i 1 che è stimatore o distorto di. La sua radice viee poi presa come stima di. Ifie, osserviamo che le formule del tipo X q 1 cotegoo u aalogo problema: è icogito (di solito) quato. Allora si può ad esempio dire che, se X N, co probabilità 1 vale approssimativamete X Sq 1. Vale ioltre ua versioe esatta di questo risultato: se X N, co probabilità 1 1 vale X St 1, dove t idica il quatile t di Studet a gradi di libertà (di livello ). Ache i quatili t di Studet soo tabulati. Lezioe (4/4, ore). Teoria dei test (verifica dei modelli). Si parte da u modello ipotizzato A e da u campioe sperimetale x 1,...,x ; si vuole sottoporre a giudizio A sulla base del campioe. Stategia aturale: si crea il modello B associato al campioe e si cofrotao A e B. Se soo sufficietemete diversi, si rifiuta il modello A, altrimeti si dichiara che o c è cotraddizioe tra il campioe ed il modello A. Operativamete, el caso di u modello gaussiao di variaza ota, e media ipotizzata 0, si fissa u livello (umero piccolo i 0,1, es. 0.05), calcolao x e q 1, si cotrolla se x 0 q 1 ; se accade ciò, si rifiuta l ipotesi 0, altrimeti o la si può rifiutare. Caoicamete, si esegue il test precedete cotrollado se z q 1, dove z x 0. Se la variaza o è ota, e si calcola al suo posto S dal campioe, si cotrolla se

t t 1 1, dove t x 0 S e dove t 1 1 è il quatile t di Studet di livello 1 1 gradi di libertà. Viee svolto l esercizio 3, parti i e ii, del 4/6/0. Lezioe 3 (6/4, 1 ora). Complemeti sulla teoria della stima. Suppoiamo di aver trovato il risultato x q 1 a livello di cofideza 1, per la media di ua gaussiaa X di variaza ota. Suppoiamo che vega chiesto di calcolare la probabilità che la gaussiaa X assuma valori, per u certo dato. Se la media fosse, varrebbe P X 1. Siccome o coosciamo ma abbiamo per essa u itervallo di cofideza, possiamo dire che: a livello di cofideza 1, P X è compresa ell itervallo di estremi 1 e 1, dove x q 1, x q 1 co. Viee svolto l es. 3 del 6/1/06. Complemeti sulla teoria dei test. Nella lezioe precedete abbiamo itrodotto la strategia dei testi così: avedo u ipotesi, es. media 0 ed u campioe sperimetale x 1,...,x, dal campioe si costruisce u modello, co l itervallo di cofideza per, e si rifiuta l ipotesi 0 se essa o sta ell itervallo di cofideza. Prediamo ora u altro puto di vista, più legato alla struttura logica A B ob oa. Suppoiamo al solito di avere l ipotesi di media 0 ed u campioe sperimetale x 1,...,x. Se vale l ipotesi (A) allora valgoo certe cosegueze (B), a meo di ua piccola probabilità. Basta allora cotrollare se il campioe soddisfa le cosegueze: se x 1,...,x o soddisfa le cosegueze (ob) allora cocludiamo che o vale l ipotesi di media 0 (oa). Ci soo però tate possibili cosegueze dell ipotesi di media 0. Il modo di valutare quale cosegueza sia più utile è il cocetto di poteza di u test. Lezioe 4 (/5, ore). Come abbiamo detto, si può costruire u test seguedo il ragioameto: se vale l ipotesi di media 0 allora valgoo certe cosegueze, a meo di ua piccola probabilità; basta allora cotrollare se il campioe soddisfa o meo le cosegueze. Ci soo però tate possibili cosegueze dell ipotesi di media 0. Ua è quella già utilizzata, ovvero che X 0 q 1 (salvo che co probabilità ). Ma ad esempio u altra è X 1 0 q 1 (salvo che co probabilità ), cioè ua codizioe solo sul primo elemeto del campioe X 1. Il test basato sulla prima codizioe ora descritta è quello delle lezioi precedeti: se il campioe x 1,...,x soddisfa x 0 q 1 (che caoicamete verifichiamo ella forma z q 1 ), rifiutiamo l ipotesi. Possiamo però costurire u test sulla secoda cosegueza: dato il campioe x 1,...,x, se x 1 0 q 1, allora rifiutiamo l ipotesi. Quale test è migliore? Defiizioe di poteza. Calcolo della poteza per i due test e verifica che il migliore dei due è quello basato su x. Liguaggio della teoria dei test: ipotesi ulla, ipotesi alterativa, livello o sigificatività del test, errore di prima specie, errore di secoda specie, poteza. p-value. Esercizio 3 del 19/9/06 e 4 del 17/5/06. Lezioe 5 (3/5, 1 ora). Abbiamo compeltato le basi di statistica su stime e test. Tra gli argometi che dovremo acora sviluppare ci soo: DOE, regressioe, carte di cotrollo e soglie, altri esempi di stime e test. DOE (Desig Of Experimets, progettazioe di esperimeti) è ua teoria che si occupa di vari aspetti progettuali legati alla statistica. Uo dei più semplici è il seguete, che

illustriamo co u esempio. Le FFSS voglioo esamiare il traffico passeggeri Roma-Milao del veerdì pomeriggio per capire se è strutturalmete superiore al servizio offerto e ricalibrare il servizio. Descriviamo il umero di passeggeri i quella tratta i quel mometo della settimaa co ua v.a. N. Dobbiamo decidere il tipo di distribuzioe. N assume valori iteri positivi; se assumesse valori mediamete bassi, sarebbe coveiete usare Poisso, biomiali, geometriche o altre distribuzioi discrete. Dal mometo che assume valori molto alti, è ache ragioevole, se o addirittura molto migliore, usare distribuzioi cotiue. Scegliamo ora le gaussiae, per semplicità. Decidiamo quidi di descrivere N co ua N,. Come cooscere e? Attraverso osservazioi settimaali del traffico, poi usado la teoria della stima. I questa fase, di progettazioe delle osservazioi ( esperimeti ), che ragioameti ha seso fare? Ad esempio, si può decidere che precisioe si vuole ella stima di e co quale livello 1 di cofideza; scelti questi due valori, es. 100 passeggeri, 0.05, ci chiediamo: quate osservazioi dobbiamo eseguire? Questo è u esempio semplice di DOE. La risposta (teorica) si ottiee ivertedo la formula q 1. Dal puto di vista pratico c è il problema della macata coosceza di. Si può ad esempio procedere ad u primo isieme di osservazioi e stimare (mediate lo stimatore S) co tali campioi; se poi la umerosità richiesta eccede il umero di osservazioi già eseguite, si devoo cotiuare le osservazioi per il ecessario. Oppure si può decidere che u certo umero di altre liee e mometi della settimaa è simile alla tratta sotto studio, raccogliere i dati di quelle liee i ua sola settimaa, ed usarli per stimare. U altro problema pratico è che i geere il valore di che si trova appare piuttosto alto e d altra parte le richieste su e o soo così imperative ma possoo essere parzialmete modificate. Quidi è aturale tabulare i valori di al variare di e (come vedremo meglio i seguito) per operare delle scelte. Si suggerisce di collegarsi al sito www.istat.it, li Tavole di dati (sulla siistra), li La ricerca e lo sviluppo i Italia, aprire i dati (sulla destra i alto) e copiare su u foglio Excel la tavola 1.6. Provare ad affrotare il seguete problema: c è differeza tra le spese per la ricerca uiversitaria egli ai 00 e 004? Lezioe 6 (8/5, ore). Cei sull uso di Excel per aalisi statistiche. Dopo aver copiato su u foglio Excel le due serie di dati descritte ella lezioe precedete, si può calcolare media e deviazioe stazioaria campioarie, x ed S, coi relativi comadi di Excel (scelta ua casella, digitato, si clicca su fuzioe, poi su fuzioi statistiche, poi su media e si iseriscoo i dati). Iteressate è fare u istogramma. No co l opzioe grafica di istogramma, che è ua semplice fuzioe; ma attraverso il pacchetto Aalisi Dati che si trova sotto Strumeti. Se o c è, va caricato: da Strumeti si etra i Compoeti aggiutive e si prede Strumeti di Aalisi. A quel puto è caricato e visibile sotto Strumeti. Co la fuzioe Istogramma di Aalisi Dati si ottiee ua tabella fatta dei puti di suddivisioe e della umerosità di eveti i ciascu itervallo, poi la si visualizza co u grafico Istogramma. Esercizio: realizzare u istogramma cumulativo: la spezzata costate a tratti che sale di 1 (dove è la umerosità del campioe) i corrispodeza di ogi valore della x i cui c è u dato sperimetale). Circa l esempio della lezioe precedete, vegoo esamiati visivamete i valori, si ricoosce ua modesta crescita ad occhio co alcue eccezioi, si calcolao media e deviazioe di ciascu gruppo (x 1 39, x 50, S 1 03, S 09). Vegoo visualizzati gli istogrammi di etrambe. Per capire se c è stato u aumeto ella spesa per R&S uiversitaria si descrivoo due strategie. La prima si basa sull idea che dalla prima serie (00) si ricava u modello, che per semplicità è stato preso come ua gaussiaa di media 0 39 e deviazioe 03. Poi

si cofrota il secodo campioe col modello, eseguedo u test per la media. Si calcola z x 0 e si cofrota col quatile. La scelta della sigificatività è soggettiva; prediamo il valore usuale 0.05. Vale q 0.975 1.96, metre z vale circa 0.3. Quidi il test osserva che o c è cotraddizioe tra il campioe e l ipotesi, cioè o c è motivo di riteere che siao aumetate le spese per R&S uiversitarie. U secodo metodo cosiste ell itrodurre la v.a. Y icremeto di spesa tra il 00 e il 004. I suoi valori sperimetali soo dati dalle differeze tra i valori 004 e quelli 00. La media campioaria ora è x icr 11, che o è altro però che x x 1, quidi ache x 0. L ipotesi ulla da sottoporre a test ora è che l icremeto sia ua v.a. gaussiaa co media icr 0 0. Quidi il test cosiste el cofrotare z icr x icr icr 0 icr col quatile. Il umeratore x icr icr 0 coicide col umeratore della z del metodo precedete: x 0. Ivece icr è u pò cambiata. Ifatti essedo Y X X 1, se ipotizziamo X 1 e X idipedeti, vale Var Y Var X 1 Var X, quidi approssimativamete icr S 1 S S 1. Quidi z icr è circa 1 più grade di z, ma questo o basta a modificare l esito del test. I realtà le cosiderazioi fatte su Var Y soo discutibili (l idipedeza), descritte qui a titolo di esempio di ragioameto. Alterativamete, è meglio calcolare icr dal campioe degli icremeti (e magari usare il quatile t di Studet per essere più precisi). Esercizio per casa: ello stesso sito, predere i dati della spesa per R&S delle imprese 00 e vedere se c è u legame (ua correlazioe ) co la spesa uiversitaria. Lezioe 7 (10/5, 1 ora). Vegoo visualizzati i dati di spesa per R&S di uiversità (X) e imprese (Y) 00, i u grafico. Vegoo discusse alcue impressioi ituitive: 1) i dati soo posizioati u po a coo, o proprio elle viciaze di ua retta ma meglio di più di ua retta; ) forse sembrao posizioati a parabola; 3) c è u certo grado di clusterizzazioe (raggruppameto): due cluster be separati, più due puti isolati; 4) se si elimiassero Piemote e Lombardia, i dati sarebbero molto più vicii ad ua sigola retta, o più parabolici, raggruppati i due cluster. I due dati di Piemote e Lombardia vegoo detti Outliers (puti aomali), o puti iflueti (o che fao leva) i quato modificao radicalmete il risultato. Viee calcolata la retta di regressioe dei dati tutti isieme. Si presuppoe che i dati seguao la legge Y ax b errore, si stima a col comado Excel Pedeza, b col comado Excel Itercetta, otteedo i valori a, b 10. Si visualizza questa retta di regressioe sul grafico, e si immagia quale sarebbe stata seza Piemote e Lombardia. Si discutoo alcui difetti delle aalisi appea fatte, i particolare il fatto che i dati soo fortemete disomogeei a causa delle gradi differeze di ampiezza delle regioi italiae. Ad esempio, il fatto che per certe regioi la spesa sia sesibilmete iferiore alla media azioale (o viceversa) è più che altro dovuto alla piccolezza della regioe, o per lo meo gioca ache tale fattore. Questo ha sicuramete falsato il cofroto 00-004: le deviazioi stadard erao eormi a causa della disomogeeità dei dati e, comparedo a deomiatore di z, lo hao reso così piccolo da essere troppo distate dal quatile. Aalogamete, la clusterizzazioe appea descritta forse è dovuta più alle dimesioi della regioe che all etità della spesa (cioè o è iterpretabile come regioi buoe o cattive i quato a politiche uiversitarie, ma solo regioi gradi o piccole). Si capisce quidi che adrebbero ormalizzati (stadardizzati, uiformati) i dati usado ad esempio la popolazioe regioale. Si decide di usare come uove gradezze la spesa pro capite. Esercizi per casa: 1) calcolare a e b seza Piemote e Lombardia; visualizzare tutto su Excel; ) cercare sul sito ISTAT i dati sulla popolazioe regioale, calcolare la spesa pro capite e ripetere co essa le cose fatte sui dati di spesa uiversitaria 00-004 e spesa uiversità-imprese 00.

Lezioe 8 (15/5, ore). Regressioe lieare: vedi brevi dispese i proposito, su aspetti teorici ed implemetazioe co Excel. Lezioe 9 (16/5, ore). Completameto delle brevi dispese su regressioe lieare, escluso per ora il calcolo degli stimatori per r 1. Richiamo sulla variaza e sue proprietà. Defiizioe di covariaza, sue proprietà (i parte simili a quelle della variaza); liearità ei due argometi, covariaza ulla per v.a. idipedeti, e teorema: se Y ax b co X ed idipedeti, allora Cov X,Y avar X. Ne emerge che la covariaza misura il legame lieare tra variabili aleatorie. Però l etità umerica dipede dall uità di misura. Dato u campioe, calcolata la covariaza empirica Cov X,Y 1 x i x y i y, che o sarà mai esattamete zero, come giudicare se è circa zero oppure o, a causa dell uità di misura? Allora è utile ua modifica della covariaza, ovvero il coefficiete di correlazioe X,Y Cov X,Y X Y. Ach esso è ullo per v.a. idipedeti, varia però tra 1 e 1, o dipede dall uità di misura ( X,Y X,Y per ogi 0), e se vale u legame lieare esatto Y ax b risulta X,Y 1 se la retta è icliata positivamete (a 0), X,Y 1 se la retta è icliata egativamete (a 0). L impressioe grafica è che ua uvola disordiata pressapoco circolare di puti ha correlazioe molto vicia a zero, es. 0.1, ua uvola abbastaza allugata attoro ad ua retta icliata positivamete ha correlazioe ad es. 0.9, ua uvola abbastaza allugata attoro ad ua retta icliata positivamete ha correlazioe ad es. -0.9. La correlazioe può essere usata per tati scopi. Uo è diretto: capire se certe gradezze soo legate oppure o. Ad esempio, le spese per R&S di uiversità e imprese, ormalizzate per umero di abitati, soo correlate o o? A priori o è chiaro. Nota: co Excel è facilissimo calcolare la correlazioe (c è il comado tra le fuzioi). U secodo uso è per capire se, dato u campioe x 1,y 1,..., x,y, è più ragioevole u modello lieare oppure uo olieare. Ifatti si può trasformare la striga delle x tramite ua fuzioe f, otteedo così le coppie f x 1,y 1,..., f x,y ; si può poi calcolare la correlazioe sia delle coppie origiarie sia di quelle trasformate; se ad esempio capita che è maggiore (i valore assoluto) la correlazioe delle coppie trasformate, vuol dire che è più fedele il modello olieare Y af X b. Il preblema pratico di questi ragioameti sulle trasformazioi è trovare ua buoa trasformazioe, cosa per cui o ci soo regole, ma solo tetativi basati sulla visualizzaizoe dei dati. U terzo uso dei covariaza e correlazioe è ella teoria della regressioe, come si vede elle brevi dispese sulla regressioe. Lezioe 30 (17/5, 1 ora). Esercizi su stime e test gaussiai e o gaussiai, test uilaterali, valore p. Lezioe 31 (/5, ore). Vegoo cosolidati i test uilaterali tramite u esercizio: descrizioe delle motivazioi alla base della strategia del test, esecuzioe del test, calcolo del valore p, calcolo della poteza (uilaterale). Lezioe 3 (3/5, ore). Viee cosolidato l uso del TLC allo scopo di eseguire test (e stime) co calcoli gaussiai per variabili qualsiasi, i modo approssimato. Viee applicato al caso della Beroulli e della biomiale. Vegoo cosolidati alcui calcoli co v.a. gaussiae: calcolo di probabilità e di quatili o soglie. Lezioe 33 (4/5, 1 ora). Esercitazioe valida per l esoero dalla prova scritta. Per le regole della prova orale si rimada alla pagia del docete.