UNIVERSITÀ DEGLI STUDI DI MILANO - BICOCCA

Documenti analoghi
UNIVERSITÀ DEGLI STUDI DI MILANO - BICOCCA FACOLTÀ DI SOCIOLOGIA a. a Esame del STATISTICA

Costo manutenzione (euro)

Esercitazioni di Statistica Dott. Danilo Alunni Fegatelli

Metodi quantitativi per l analisi dello sviluppo

Corso di Statistica Canale E Bini, Cutillo A.A. 2017/2018. Esercitazione di riepilogo n.8 Test di ipotesi Soluzioni

Statistica 1 A.A. 2015/2016

Corso di Statistica. Test per differenza tra medie e proporzioni. Prof.ssa T. Laureti a.a

Esercitazioni di Statistica

Esercitazioni del corso: ANALISI MULTIVARIATA

ESERCITAZIONE VII. H 0 : μ = 500. H 1 : μ > /3.16 = = 3.403

Metodi statistici per le ricerche di mercato

Poiché n<30 e la deviazione standard non era nota a priori ma è stata stimata (s=14.4), la statistica test da utilizzare è t:

PROVA SCRITTA DI STATISTICA CLEA-CLEFIN-CLELI (COD e 4038) 15 gennaio 2003

Titolo della lezione. Dal campione alla popolazione: stima puntuale e per intervalli

Formulario (versione del 3/10/2015)

Anemia. Anemia - percentuali

Inferenza Statistica. L inferenza statistica cerca di risalire al modello del fenomeno sulla base delle osservazioni.

Alcuni concetti di statistica: medie, varianze, covarianze e regressioni

Formulario di Statistica (Cucina-Lagona)

Statistica. Lezioni : 11, 12. Statistica Descrittiva Bivariata 2. a.a

Stima della media di una variabile X definita su una popolazione finita

Le principali procedure inferenziali: nozioni, schemi di procedimento ed esempi di applicazione

Correzione Esercitazione 6

Università degli Studi di Cassino, Anno accademico Corso di Statistica 2, Prof. M. Furno

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità A - Soluzioni

Esercitazione sette: soluzioni. H 1 : θ > 0.48 ( =

Campionamento casuale da popolazione finita (caso senza reinserimento )

n=400 X= Km; s cor =9000 Km Livello di confidenza (1-α)=0,95 z(0,05)=1,96

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità C

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità B - Soluzione

ALCUNI ESERCIZI SUI TEST DI IPOTESI PARAMETRICHE PARTE 1

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità D

Esercitazioni di Statistica Dott.ssa Cristina Mollica

ES 1.3. Data la distribuzione unitaria di una variabile quantitativa X. la media aritmetica di X è data dal rapporto tra il totale n

Lezione 15. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 15. A. Iodice

Caso studio 9. Distribuzioni doppie. Esempi

ANalysis. Analisi della Varianza - ANOVA. Aprile, Aprile, Nel linguaggio delle variabili le operazioni fondamentali sono tre

Soluzione CPS 22/6/04. I parte. (1). Chiamiamo C l evento l individuo scelto ha il colesterolo alto, V, O e NL rispettivamente

Quesito 1. I seguenti dati si riferiscono ai tempi di reazione motori a uno stimolo luminoso, espressi in decimi di secondo, di un gruppo di piloti:

Università degli Studi di Salerno Pietro Coretto. Corso di Statistica FORMULARIO

Una funzione delle osservazioni campionarie è una statistica che, nel contesto della stima di un parametro, viene definita stimatore.

Esperimentazioni di Fisica 1. Prova scritta del 1 febbraio 2016 SOLUZIONI

Statistica Inferenziale Soluzioni 1. Stima puntuale

Relazioni statistiche

COME CALCOLARE L INTERVALLO DI CONFIDENZA QUANDO E NECESSARIO STIMARE LA DEVIAZIONE STANDARD? (è quasi sempre così!)

Argomenti. Stima Puntuale e per Intervallo. Inferenza. Stima. Leonardo Grilli. Università di Firenze Corso di Laurea in Statistica Statistica

STATISTICA INFERENZIALE

Principio alla base della misura del legame tra X ed Y

II Esonero - Testo A

L INTERVALLO DI CONFIDENZA

Metodi statistici per lo studio dei fenomeni biologici

Seconda Prova Intermedia 28 Maggio 2019 Elementi di Probabilità e Statistica, Laurea Triennale in Matematica, M. Romito, M.

Popolazione e Campione

4. Proprietà degli stimatori

Statistica bivariata Tabella di contingenza % di riga I tre tipi di percentuale rimandano a significati differenti. Tabella di contingenza

Intervalli di Fiducia

Esercizi di Calcolo delle Probabilità e Statistica Matematica

Corso di Laurea in Ingegneria Informatica Anno Accademico 2016/2017 Calcolo delle Probabilità e Statistica Matematica

Esame di Statistica A-Di Prof. M. Romanazzi

Politecnico di Milano - Anno Accademico Statistica Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo

Stimatori, stima puntuale e intervalli di confidenza Statistica L-33 prof. Pellegrini

Matematica con elementi di Informatica

PRIMA PROVA INTERMEDIA DI STATISTICA (COD /6045/5047/4038/371/377) 21 ottobre 2015 COMPITO B

Risultati esercitazione statistica bivariata

Sommario. Facoltà di Economia. Campionamento e inferenza statistica

Elementi di statistica descrittiva. Tabella dei dati :

ESERCITAZIONE N. 6 corso di statistica

TECNICA DELLE MISURAZIONI APPLICATE 17 OTTOBRE 2012

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica

Popolazione e Campione

Appunti di STATISTICA

Soluzioni. Se l interallo avesse livello di confidenza 99%, al posto di 1,96 avremmo

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

SDE Marco Riani

= ed è: n. 2 2 x. tra ns x

Quartili. Esempio Q 3. Me Q 1. Distribuzione unitaria degli affitti settimanali in euro pagati da 19 studenti U.S. A G I F B D L H E M C

Statistica I - A.A

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2013

STATISTICA A K (63 ore) Marco Riani

Regressione lineare semplice

Esercitazioni del Corso di Probabilitá e Statistica Lezione 6: Stime di parametri puntuali e per intervalli

Distribuzione normale

STATISTICA 1 ESERCITAZIONE 5

Campionamento e distribuzioni campionarie

Università degli Studi di Napoli Parthenope. STATISTICA per il Turismo

La correlazione e la regressione. Antonello Maruotti

L INTERVALLO DI CONFIDENZA

Quartili. Esempio Q 3 Q 1. Distribuzione unitaria degli affitti settimanali in euro pagati da 19 studenti U.S. A G I F B D L H E M C

Statistica. Lezione 5

Test Statistici. In termini statistici, agli eventi appena indicati viene attribuita una probabilità ed una specifica definizione:

Statistica inferenziale, Varese, 25 novembre 2008 Prima parte - Modalità B - soluzione

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Metodi di valutazione delle prestazioni di rete

IL CAMPIONAMENTO. POPOLAZIONE un insieme finito o infinito di unità statistiche

Esercizi di Probabilità e Statistica

Stime puntuali. Statistica e biometria. D. Bertacchi. Stime puntuali. Intervalli di confidenza. Approfondiamo

Argomenti trattati: Stima puntuale e stimatore Proprietà degli stimatori Stima puntuale della media della

Tavole di Contingenza Connessione

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 5 luglio 2012

Statistica inferenziale, Varese, 25 novembre 2008 Prima parte - Modalità A - soluzione

Transcript:

UNIVERSITÀ DEGLI STUDI DI MILANO - BICOCCA FACOLTÀ DI SOCIOLOGIA a. a. 9 Esame del -6- Statistica ESERCIZIO Relazioi tra Variabili (totale puti: ) Ad ua riuioe del circolo Amati dell acquario, i soci preseti discutoo della presuta ocività di ua sostaza chimica comuemete presete el magime per pesci. er valutare la veridicità di questa otizia, vegoo registrati la quatità di questa sostaza presete per razioe di magime utilizzato abitualmete, il umero di pesci morti ell ultimo mese ed il tipo di acquario. I Tabella A soo riportati i dati relativi alle variabili: quatità di sostaza sospetta per razioe di magime [espressa i milligrammi] (X), umero di pesci morti ell ultimo mese (Y), tipo di acquario [TTropicale, N No tropicale] (Q). Tab.A ID 4 5 6 7 8 9 X 4 9 9 7 5 5 6 8 7 4 8 5 Y 6 5 4 5 4 Q T N T N T T T N N T N T a) Orgaizzare i ua tabella a doppia etrata le variabili statistiche X e Y; per X raggruppare i valori osservati elle classi: (4-6), (6-8), (8 -) e per Y raggruppare i valori osservati elle classi: ( -), ( -5), (5-7) (.5 puti). b) Forire la distribuzioe codizioata del umero di pesci morti ell ultimo mese (Y) date le tre classi relative al peso della sostaza chimica presete el magime (X), cofrotarle co la distribuzioe margiale e stabilire se i due feomei soo statisticamete idipedeti (.5 puti) c) I caso di risposta egativa al puto precedete, valutare co u opportuo idice la dipedeza i media del umero di pesci morti dal peso della sostaza chimica per razioe, commetado i risultati otteuti. ( puti). d) Utilizzado i dati classificati ella tabella a doppia etrata, costruire il diagramma a dispersioe, disegare la spezzata di regressioe e commetare la atura matematica della relazioe fra X e Y. Utilizzado sempre i dati classificati determiare quidi la retta di regressioe dei miimi quadrati che iterpreta la dipedeza del umero di pesci morti dal peso della sostaza chimica. Disegare la retta sul diagramma e iterpretare il valore otteuto per i parametri. ( puti) e) Valutare la botà di adattameto del modello costruito al puto d). Su tale base, prevedere il umero di pesci morti al mese el caso i cui vega utilizzato u magime avete milligrammi di sostaza chimica sospetta.( puti) ESERCIZIO Aalisi Multivariata (totale puti: ) a) Si vuole estedere l aalisi precedete all isieme di tutti i possessori di acquari d Italia; i dati i Tabella A si assumoo come u campioe beroulliao di ampiezza da tale popolazioe. Dai dati foriti dai produttori di magimi per pesci risulta che il peso per razioe della sostaza chimica sospetta (X) si distribuisce ella popolazioe come ua Normale di media igota e variaza ota pari a.89, utilizzado i dati i Tab. A:. Stimare il valore µ della media di X. I base al risultato otteuto al puto precedete, calcolare la probabilità che, presa a caso ua razioe di magime, il peso della sostaza sospetta ivi presete sia maggiore di 7milligrammi. ( uti) U più ampio campioe beroulliao di umerosità 5 è stato estratto dalla stessa popolazioe ed ha forito i dati relativi alle variabili Y e Q sitetizzati ella Tabella B: Tab. B Q:"Tipo di acquario" ( -) ( -5) (5-7) f i. T 4 46 4 N 4 45 4 f.j 84 9 75 5 b) Utilizzare i dati campioari i Tab.B per verificare co u opportuo test e co α. se ella popolazioe di iteresse esiste ua sigificativa relazioe statistica tra umero di pesci morti e tipo di acquario. ( uti) c) Stimare l igota proporzioe di acquari di tipo tropicale ella popolazioe di iteresse e costruire u itervallo di cofideza a livello 99%. Iterpretare e commetare il risultato. (.5 uti) d) Testare al livello di sigificatività del 95% l ipotesi che l igota proporzioe di acquari tropicali preseti i Italia sia pari a.5. (.5 uti) e) ESERCIZIO Domade Teoriche (totale puti: ). Forire u esempio co dati a scelta di tabella a doppia etrata i cui esista perfetta correlazioe. Discutere i questo caso i valori degli idici ρ XY, η X, η Y e χ (5 puti).. Dare le defiizioi di: ipotesi statistica, ipotesi ulla, statistica test, livello di sigificatività, valore critico e valore sperimetale e discutere l utilizzo ella coduzioe di u test statistico. (5 puti)

UNIVERSITÀ DEGLI STUDI DI MILANO - BICOCCA FACOLTÀ DI SOCIOLOGIA a. a. 9 Esame del -6- Statistica - Soluzioi ESERCIZIO Relazioi tra Variabili a) Orgaizzare i ua tabella a doppia etrata le variabili statistiche X e Y; per X raggruppare i valori osservati elle classi: (4-6), (6-8), (8 -) e per Y raggruppare i valori osservati elle classi: ( -), ( -5), (5-7) (,5 puti). X:"eso per razioe della sostaza chimica sospetta" ( -) ( -5) (5-7) f i. (4-6) 4 5 (6-8) (8 -) 4 f.j 4 5 b) Forire la distribuzioe codizioata del umero di pesci morti ell ultimo mese (Y) date le tre classi relative al peso della sostaza chimica presete el magime (X), cofrotarle co la distribuzioe margiale e stabilire se i due feomei soo statisticamete idipedeti (.5 puti) ( -) ( -5) (5-7) f i (4-6) f j 4 5.8. X:"eso per razioe della sostaza chimica sospetta" (6-8) (8 -) f j f j 4.5.75 TOT f.j 4 5..4.5 Si osserva ua otevole differeza fra le frequeze delle v.s. codizioate Y X rispetto alle frequeze margiali di Y. Il comportameto di Y codizioato alle diverse modalità di X è differete rispetto al comportameto margiale (idipedetemete da X). Da ciò possiamo cocludere che esiste ua relazioe statistica fra i due feomei el collettivo di acquari osservati, i particolare X codizioa Y. c) I caso di risposta egativa al puto precedete, valutare co u opportuo idice la dipedeza i media del umero di pesci morti dal peso della sostaza chimica per razioe, commetado i risultati otteuti. ( puti). Cosiderado i valori cetrali delle classi, otteiamo rispettivamete la media margiale e quelle codizioate :

Le tre medie codizioate risultao diverse tra loro e diverse dalla media del feomeo sull itera popolazioe Il feomeo X codizioa il feomeo Y, Quidi Y dipede da X. Il grado di dipedeza viee calcolato tramite l idice eta quadro: Il peso medio di sostaza sospetta per razioe di magime spiega il 77% della variabilità del umero di pesci morti. d) Utilizzado i dati classificati ella tabella a doppia etrata, costruire il diagramma a dispersioe, disegare la spezzata di regressioe e commetare la atura matematica della relazioe fra X e Y. Utilizzado sempre i dati classificati determiare quidi la retta di regressioe dei miimi quadrati che iterpreta la dipedeza del umero di pesci morti dal peso della sostaza chimica. Disegare la retta sul diagramma e iterpretare il valore otteuto per i parametri. ( puti) La spezzata di regressioe si disega cosiderado per Y i valori delle medie codizioate calcolate al puto precedete e per X i valori cetrali degli itervalli relativi alle diverse classi: 4 + 6 6 + 8 8 + 5 7 9

La retta di regressioe passate per tali puti (le medie codizioate di Y) è la seguete I puti presetao ua chiara struttura crescete che suggerisce ua correlazioe positiva tra X ed Y. Determiado la retta dei miimi quadrati ŷ a + b si ottiee: * 5 5 + 7 + 9 4 i f i 6.8 y. 8 (dall esercizio precedete) i i ( ) i f Y. (dall esercizio precedete) µ j i y i j f ij ( 5 6.8) 5 + ( 7 6.8) + ( 9 6.8) 4 5.67 i 5 4 + 5 4 +... + 9 6 4 8.5 y 8.5 6.8.8.4 µ b.4.97.79 Icremeto del umero di pesci morti per u aumeto uitario i milligrammi del peso medio della sostaza sospetta per razioe di magime. Ogi a y b.8.79 6.8.57 Numero medio di pesci morti co ua preseza di zero grammi di sostaza sospetta..97 La retta che si ottiee è la seguete : y.57 +. 79 Dal grafico emerge che la spezzata di regressioe otteuta posizioado el grafico le medie codizioate è be approssimata dalla retta. e) Valutare la botà di adattameto del modello costruito al puto d). Su tale base, prevedere il umero di pesci morti al mese el caso i cui vega utilizzato u magime avete milligrammi di sostaza chimica sospetta.( puti) Valutado la botà di adattameto ai dati della retta si ottiee:.4.4.4.89.97. 6.86.6 ρ ρ (.89). 79 y ( ).57 +.79 6. Y ˆ 4

Tramite la retta dei m.q. si prevede che il umero di morti è di 6. per u acquario i cui viee utilizzato u magime co ua preseza media per razioe di milligrammi di sostaza sospetta. La previsioe, a parità di tred, è affidabile al 79% (circa il % della variabilità totale di Y o è spiegata dalla retta). ESERCIZIO Aalisi Multivariata (totale puti: ) a) Si vuole estedere l aalisi precedete all isieme di tutti i possessori di acquari d Italia; i dati i Tabella A si assumoo come u campioe beroulliao di ampiezza da tale popolazioe. Dai dati foriti dai produttori di magimi per pesci risulta che il peso per razioe della compoete chimica sospetta (X) si distribuisce ella popolazioe come ua Normale di media igota e variaza ota pari a.89, utilizzado i dati i Tabella A:.. Stimare il valore µ della media di X. I base al risultato otteuto al puto precedete, calcolare la probabilità che, presa a caso ua razioe di magime, il peso della sostaza pericolosa ivi presete sia maggiore di 7 milligrammi. ( uti). Stimatore o distorto ed efficiete per la media della popolazioe è la media campioaria. Stimiamo dai dati campioari la media campioaria : 4 + 9 +... + 5 i i 6.4 i i. La probabilità che, presa a caso ua razioe di magime, il peso della sostaza pericolosa ivi presete sia maggiore di 7 milligrammi è data da: Y µ 7 6.4.58 ( X 7 ) Z ( Z.4) ( Z.4).6. 7.89.7 b) Utilizzare i dati campioari i Tab.B per verificare co u opportuo test e co α. se ella popolazioe di iteresse esiste ua sigificativa relazioe statistica tra umero di pesci morti e tipo di acquario. ( uti) I dati foriti i tabella B soo i segueti: Q:"Tipo di acquario" ( -) ( -5) (5-7) f i. T 4 46 4 N 4 45 4 f.j 84 9 75 5 La tabella delle frequeze teoriche di idipedeza statistica f fi f j * ij è: N Q:"Tipo di acquario" ( -) ( -5) (5-7) f i. T 4.68 47. 9 N 4. 4.68 6 f.j 84 9 75 5 Si vuole verificare l ipotesi secodo cui Y e Q soo statisticamete idipedeti, H :. χ Essedo 5 sufficietemete elevato per utilizzare la statistica test χ co u test ad ua coda, co la regioe critica sotto la coda destra e co α.. Valore critico: dalle tavole, dati gradi di libertà si ottiee χ 9. Valore sperimetale:,. gradi di libertà. Eseguiamo 5

χ ( fij fij ) ( 4 4.68) ( 46 47.) ( 4 6) + +... + f i j ij Ricordado che si rifiuta l ipotesi ulla H : * * 4.68 47. critica o di rifiuto, ovvero se il valore sperimetale valore critico ossia se 6. χ co probabilità di sbagliare dell % se il valore sperimetale cade ella zoa χ > χ,., poiché.<9., o è possibile rifiutare l ipotesi di idipedeza fra umero di pesci morti e tipologia di acquario ella popolazioe di iteresse a livello di sigificatività del 99%. c) Stimare l igota proporzioe di acquari di tipo tropicale ella popolazioe di iteresse e costruire u itervallo di cofideza a livello 99%. Iterpretare e commetare il risultato. (.5 uti) qi pˆ 5 i Il campioe forisce la seguete stima per p:. 5 Data l elevata umerosità del campioe è possibile, grazie al Teorema Cetrale Limite, approssimare la distribuzioe ad ua Normale di media p pˆ pˆ pˆ e variaza ( ) E possibile quidi impiegare la statistica Z per costruire l itervallo di cofideza: pˆ z pˆ α, + zα Co livello di cofideza al 99%, si ha -α.99, α. α/.5 z( ) z. 58 α + α.995 p pˆ.5 ˆ( ˆ p p).5.48. 5 Ma quidi l itervallo di cofideza cercato è il seguete:.5.5.5.58,.5 +.58 [.44,.6] 5 5 ossiamo cofidare che l itervallo [.44;.6] sia uo dei 99 su che cotegoo la reale proporzioe di acquari tropicali ella popolazioe di iteresse. d) Testare al livello di sigificatività del 95% l ipotesi che l igota proporzioe di acquari tropicali ella popolazioe di iteresse sia pari a.5. (.5 uti) ˆ er la verifica dell ipotesi bilaterale H : p. 5, essedo sufficietemete grade, possiamo impiegare il test Z per gradi campioi a due code. qi pˆ 5 i Il campioe forisce la seguete stima per p:. 5 α.95 α.5 α/.5 Valore critico dalle tavole : z. 96 z α.975 pˆ p Valore sperimetale : z. 6 ˆ p( p).5.5.5(.5) 5 Il test rifiuta H : p. 5 co probabilità di sbagliare del 5% se il valore sperimetale cade ella zoa di rifiuto, ovvero se: Essedo.96 <.6 <. 96..6 pˆ p pˆ p z.96 oppure se z. 96 p( p) p( p) il valore cade ella zoa di o rifiuto e l ipotesi : pˆ. 5 del 95% o può essere rifiutata. H al livello di sigificatività 6

7