obbligatorio - n. iscrizione sulla lista

Documenti analoghi
Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, )

1.4. Siano X B(1, 1/2) e Y B(1, 1/2) variabili aleatorie indipendenti. Quale delle seguenti affermazioni é falsa? E(X + Y ) = 1 V ar(x + Y ) = 1/2

Esercitazione 8 del corso di Statistica 2

Esercitazione del

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Cognome, Nome e Numero di matricola: { 0 t 1. f T (t) = 3 { 0 t 1 t

STATISTICA AZIENDALE Modulo Controllo di Qualità

Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

Approssimazione normale alla distribuzione binomiale

UNIVERSITÀ DEGLI STUDI DI PERUGIA

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Statistica Applicata all edilizia: il modello di regressione

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:

Caratterizzazione dei consumi energetici (parte 3)

Esercizi riassuntivi di Inferenza

Intervalli di confidenza

Test F per la significatività del modello

Statistical Process Control

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Statistica Inferenziale

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Statistica di base per l analisi socio-economica

Intervallo di confidenza

STATISTICA ESERCITAZIONE

Distribuzione Normale

Esercizi di Probabilità e Statistica

Americani Inglesi Firenze Roma Provare l ipotesi che la nazionalità non influisca sulla scelta della meta.

Test d Ipotesi Introduzione

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

UNIVERSITÀ di ROMA TOR VERGATA

Statistica4-29/09/2015

Prova d esame di Statistica - II canale - 10 CFU

obbligatorio - n. iscrizione sulla lista se non ve lo ricordate siete fritti; o no?

0 altimenti 1 soggetto trova lavoroentro 6 mesi}

STATISTICA. Esercizi vari

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

Esercizi svolti di statistica. Gianpaolo Gabutti

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Esercitazioni di statistica

Un esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione

ISTOGRAMMI E DISTRIBUZIONI:

Esame di Statistica del 14 dicembre 2007 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola

Matematica II: Calcolo delle Probabilità e Statistica Matematica

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Esercitazioni di Statistica

Statistica. Alfonso Iodice D Enza

Esercitazione: La distribuzione NORMALE

Analisi della varianza

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003

Esercitazione 4 del corso di Statistica 2 Prof. Domenico Vistocco

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Ringraziamenti dell Editore

INFERENZA STATISTICA I (CANALE B)

Il confronto fra medie

LAUREA SPECIALISTICA IN FARMACIA - Prova scritta di MATEMATICA - 24/01/03 ANNI PRECEDENTI. 1. (Punti 10) Si consideri la funzione

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

Z-test, T-test, χ 2 -test

Casa dello Studente. Casa dello Studente

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):

Esercitazione 4 del corso di Statistica (parte 2)

Statistica a.a Autovalutazione 1

ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Distribuzioni campionarie

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3

Esercitazione 8 maggio 2014

FACOLTÀ DI ECONOMIA Prova scritta di Statistica II Perugia, 27 gennaio 2006 COGNOME NOME

LA DISTRIBUZIONE NORMALE (Vittorio Colagrande)

STATISTICA SERALE (NOF) Appello del 12/07/12 Effettuare i calcoli arrotondando alla seconda cifra decimale A PARTE PRIMA

Matricola: Corso: 1. (4 Punti) Stimare la variazione del reddito quando il prezzo del prodotto finale raddoppia.

a) 36/100 b) 1/3 c)

obbligatorio - n. iscrizione sulla lista

Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo

Verifica delle ipotesi: Binomiale

Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da:

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)

1) Utilizzando gli sviluppi in serie delle funzioni, calcolare. sin(x 2 ) (1 cos x) 2 (1 cos(x 2 )) sinh x. lim

Statistica Applicata all edilizia: alcune distribuzioni di probabilità

Gli errori nella verifica delle ipotesi

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

ESEMPI DI DOMANDE PER TUTTE E DUE LE TIPOLOGIE DI PARTECIPANTI

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07

Esercitazione n. 3 - Corso di STATISTICA - Università della Basilicata - a.a. 2011/12 Prof. Roberta Siciliano

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)

Capitolo 5 Confidenza, significatività, test di Student e del χ 2

Proprietà della varianza

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

Transcript:

02.09.2015 - appello di STATISTICA per studenti ENE - docente: E. Piazza obbligatorio - n. iscrizione sulla lista il presente elaborato si compone di 5 (cinque) pagine se non ve lo ricordate siete fritti; o no? Cognome Nome matr.n. Avvertimento: nello svolgimento degli esercizi se una quantità è codificata dal simbolo x continuareachiamarlax,esesichiamaw nonchiamarlax,esesi chiamat i nonchiamarlax i,esesi chiama T n nonindicarlacon X n.sevoletescriveredipendentinonscriveteindipendenti,sedovete sottrarre non sommate. Si fanno troppi errori di distrazione. Mi raccomando: concentrazione. Si consiglia di lavorare con 3 decimali, arrotondando opportunamente. Problema 1. Maya lavora per il teatro Orion, dove sono stati già venduti tutti i 500 biglietti per la prima de La Dea Scarlatta. Maya tuttavia sa che, su 1000 posti venduti, tipicamente ne rimane 1 vuoto. Sono ammessi sia calcoli esatti, sia calcoli semplificati basati su opportune approssimazioni, sia mere limitazioni basate sulla disuguaglianza di Chebyshev. 1.1 Quale distribuzione hax k, la variabile che indica se ilk-esimo posto in teatro rimane vuoto? X k B(p), dovep=1/1000=0.001. 1.2 Quale relazione hay, il numero totale di posti vuoti, con le variabili X k? Quale distribuzione hay? 1.3 Qual è il numero atteso di posti vuoti? 500 Y = X k B(500,0.001). k=1 E[Y]=500 0.001=0.5. 1.4 Qual è la probabilità che Maya possa far sedere in teatro la sua amica Ayumi, rimasta senza biglietto? P(Y 1)=1 P(Y =0)=1 0.999 500 =0.3936. 1.5 Qual è il numero più probabile di posti vuoti? DatoP(Y =0)=0.6064>0.5, per forza di cose il valore più probabile èy =0. 1.6 Qual è la probabilità che rimanga vuoto almeno mezzo teatro? P(Y 250)=P(Y 0.5 249.5)=P[ Y 0.5 249.5] var(y) (249.5) 2 =8 10 6. 1

Problema 2. Il proprietario di una gelateria vuole essere sicuro che i suoi dipendenti riempiano le vaschette grandi con una quantita di gelato mediamente inferiore ad 1 kg. Ha quindi registrato i pesi x k delle ultime 25 vaschette grandi vendute, trovando dati così distribuiti Istogramma (sinistra) e NPP (destra) dei dati con una media campionaria ed una deviazione standard campionaria pari a x 25 =0.9857 kg, s 25 =0.0225 kg. 2.1 Fornire una stima puntuale della media e della deviazione standard del peso delle vaschette grandi vendute dalla gelateria. Siano µ e σ la media e la deviazione standard del peso delle vaschette grandi vendute dalla gelateria. µ=x 25 =0.9857kg, σ=s 25 =0.0225kg. 2.2 Fornire, se possibile, una stima intervallare al 99% della media e della deviazione standard del peso delle vaschette grandi vendute dalla gelateria. Anche se il campione non è particolarmente numeroso (n=25<30), il QQplot conferma la normalità della popolazione dei pesi delle vaschette grandi vendute dalla gelateria. Quindi IC al 99% perµ: x 25 ± s 25 25 t 24 (0.995)=0.9857±0.0126 = (0.9731;0.9983) IC al 99% perσ 2 : IC al 99% perσ: 24 24 χ 2 25, 24 (0,995)s2 χ 2 24 (0,995)s2 25 =(0.000267; 0.00123) (0.0163; 0.0351) Non rassicurato da mere stime, il proprietario vi chiede di quantificare con un p-value l evidenza statistica con cui le 25 vaschette controllate possono provare che il peso medio di tutte le vaschette grandi vendute sia inferiore ad 1 kg. 2.3 Impostare un opportuno test statistico per rispondere al quesito del proprietario, specificando: ipotesi nulla, ipotesi alternativa, regione critica di livello α, condizioni di applicabilità del test. H 0 :µ 1 vs H 1 :µ<1 R α :x 25 <1 s 25 25 t 24 (γ) che si può utilizzare (con livello sotto controllo) se il campione proviene da una popolazione è normale (il nostro caso) o se è numeroso. 2

2.4 Calcolare il p-value dei dati raccolti. Con le tavole t 24 (0.995)=2.797< 1 x 25 s 25 25=3.18 p-value < 0.05 mentre con conto esatto: p-value = 0.002. 2.5 Trarre le debite conclusioni. Sono forti o deboli? Il p-value è inferiore agli usuali livelli di significatività per cui si può concludere che si rifiutah 0 cioè si accetta µ<1 (conclusione forte). 3

Problema 3. La Electron S.p.A. è un azienda che produce componenti elettroniche, che sta testando un nuovo tipo di processori. La temperatura dei processori va tenuta monitorata, in modo da non comprometterne il funzionamento. In particolare, la ditta è interessata alla relazione tra la temperatura dei processori Y, la temperatura esterna T e il numero di processi che sta gestendo il processore N. Vengono raccolti i dati relativi a 20 processori, ottenendo i seguenti dati di sintesi (media e varianza campionaria di ogni variabile): y=57.1628, s 2 y =64.0205, t=29.1386, s2 t =20.0575, n=6.3, s2 n =12.6421 Vengono proposti gli output di R del modello di regressione, il grafico dei residui e i p-value del test di Shapiro- Wilk per i residui per ciascuno dei seguenti modelli: Modello 1 Y =β 0 +β 1 T+β 2 N+ǫ ǫ N(0,σ 2 ) Output dell analisi per il modello 1 Modello 2 Y =β 0 +β 1 T+ǫ ǫ N(0,σ 2 ) Output dell analisi per il modello 2 4

3.1 Si commenti la bontà dei modelli proposti e si scelga quello che meglio descrive il problema in esame. Il Modello 1 ha un R2 adjusted molto elevato, i residui non presentano particolari trend. Considerando il p-value del test di Shapiro-Wilks, l ipotesi della normalità dei residui non è rifiutata a tutti i livelli usuali. Pertanto è possibile considerare i test di significatività proposti nell output di R. Il modello è globalmente significativo (p-value: 6.476 10 14 ), ma il coefficiente β 2 risulta non significativamente diverso da 0 (p-value: 0.201), e anche l intercetta del modello potrebbe non essere significativamente diversa da zero (p-value: 0.070). Sarebbe opportuno eliminare il predittore N dal modello. Il Modello 2, ottenuto proprio eliminando N, presenta le stesse buone caratteristiche del Modello 1, ma in questo caso tutti i predittori risultano significativi. É un modello più semplice del Modello 1, avendo un regressore in meno, ma ha le stesse performances. Per questi motivi è opportuno scegliere il Modello 2. 3.2 Si scriva l equazione di regressione stimata per il modello prescelto. L equazione stimata per il modello 2 è la seguente: Ŷ =5.91778+1.75866 T 3.3 Un processore dello stesso tipo di quelli testati viene montato su una videocamera da installare all esterno. Sapendo che oggi la temperatura esterna è di 33 C e che il processore dovrà gestire 10 processi, calcolare la stima puntuale della temperatura del processore, utilizzando il modello scelto. La previsione puntuale per la temperatura del processore è Ŷ 0 =Ŷ T=33 =5.91778+1.75866 33=63.95356 C. 3.4 Calcolare un intervallo di previsione al 95% per la temperatura del processore alle condizioni di 3.3. L intervallo di previsione cercato è: Ŷ 0 ±t n 2 (0.975)ˆσ 1+ 1 n +(T 0 t) 2, S tt cons tt =s 2 t(n 1), da cui l intervallo cercato: [60.78094;67.12618]. 5