EMBA PART TIME 2012 ROMA I ANNO
|
|
- Taddeo Gioia
- 8 anni fa
- Visualizzazioni
Transcript
1 BUSINESS STATISTICS: ASSIGNMENT II: EMBA PART TIME 2012 ROMA I ANNO PROF. MOSCONI ESERCIZIO 1: USO DEL MODELLO DI REGRESSIONE PER DETERMINARE IL VALORE DEGLI IMMOBILI. ESERCIZIO 2: PREVISIONE DI VARIABILI ENERGETICHE CONSEGNA: 10 MARZO 2013 GRUPPO: TARTARINO, TRILLO, VENANZI, VERRUSO ESERCIZIO 1 1) Stimate la regressione utilizzando tutte le variabili. Analizzate i risultati in termini di significatività dei parametri (quali variabili dovrebbero essere tenute e quali non danno alcun significativo contributo?), R 2 (quanto della variabilità è spiegata dal modello?) e deviazione standard dei residui. Eliminate la variabili non significative e ristimate la regressione. Il modello migliora? Per svolgere questo esercizio è stato considerato il codice zip che si trova nella città di Miami in Florida. Abbiamo selezionato nel sito di ricerca di offerte per immobili realtor.com con la sola condizione che fossero case per famiglie escludendo ville a schiera e appartamenti in condomini, palazzi e ovviamente locali commerciali, uffici o terreni agricoli e industriali. Il motore di ricerca ci ha restituito una popolazione di 100 immobili corrispondenti alle specifiche di ricerca (in data ). La nostra riflessione ci ha portato a selezionare 6 variabili indipendenti di seguito elencate: X1 X2 X3 X4 X5 X6 CAMERE LETTO BAGNI LIVING SPACE ANNO GARAGE PISCINA Per living space intendiamo la superficie coperta misurata in [feet 2 ] della villa, per anno l anno di costruzione dell immobile, per garage intendiamo il numero di posti auto al coperto e per la piscina intendiamo la presenza o meno della piscina (variabile dummy), la nostra variabile dipendente Y = prezzo dell immobile. Abbiamo numerato da 1 a 100 le case trovate e abbiamo estratto tramite phstat un campione pari a 59 numeri casuali a cui abbiamo associato la riga corrispondente della nostra popolazione (foglio campione casuale). Su questo campione stimiamo un modello di regressione utilizzando le 6 variabili indipendenti, e otteniamo così un equazione di regressione multipla nella seguente forma: Precisiamo che la curva ottenuta con questo modello di regressione ha validità esclusivamente all interno del range dei prezzi del nostro campione con Y ϵ [70 900; 1 940'000]. Passiamo ad analizzare i risultati dell output fornitoci da excel (foglio regressione a 6 variabile) scomponendo tutte le sue componenti: Statistica della regressione R multiplo 0, R al quadrato 0, R al quadrato corretto 0, Errore standard ,1341 Osservazioni 59 Per quanto riguarda R 2 possiamo osservare come il modello di regressione qui presentato sia in grado di legare la variabilità di prezzo del 79,5% degli immobili in vendita ai 6 parametri mostrati. Il valore dello R 2 corretto, che invece considera il numero di parametri considerati, si attesta invece al 77,1%. Passando ora ad analizzare la bontà del nostro modello di regressione attraverso l analisi della varianza e il test F; excel ci restituisce la seguente tabella dell analisi della varianza: ANALISI VARIANZA gdl SQ MQ F Significatività F Regressione 6 6,50479E+12 1,08413E+12 33, ,12317E-16 Residuo 52 1,67781E Totale 58 8,1826E+12 Procediamo con la verifica della bontà di adattamento del modello utilizzando il test F. Utilizziamo il seguente sistema di ipotesi nulla H 0 : b1=b2=b3=b4=b5=b6=0; ovvero non c è alcuna relazione lineare tra la variabile dipendente e le variabili 1
2 Residui indipendenti oppure esistenza di una relazione lineare tra la variabile indipendente e le dipendenti. Verifichiamo così se se Fstat>Fα, per capire se rifiutare o meno l ipotesi nulla dei coefficienti. Le condizioni da rispettare sono le seguenti: Gradi di libertà (n k 1) = 52; Numero variabili ind. k = 6; livello di significatività = 0,05; Facendo riferimento alle tabelle dei valori critici F di Fisher osserviamo come per n=circa 60 e k=6 otteniamo un Fα= 2,25. Dal confronto con Fstat riportato nella tabella osserviamo come 33,6>2,25. Questa verifica ci permette di rifiutare l ipotesi di non corrispondenza lineare e ci permette di affermare che almeno una variabile indipendente sulle 6 osservate è in grado di spiegare l andamento delle vendite. Passiamo ora a valutare se esiste un effetto significativo sulla variabile Y di ogni singola variabile indipendente, verificando la relazione del t stat : Con: S bi = errore standard del coefficiente di regressione b i b i = coefficiente di regressione di Y rispetto alla variabile i rimanendo costanti gli effetti delle altre variabili indipendenti. L ipotesi da verificare è H 0 : β i =0 con i = (1,,6) Per valutare queste ipotesi ci serviamo dei valori elaborati da excel nella colonna Stat t e li confrontiamo con il valore critico della distribuzione t student corrispondente ad un livello di significatività dello 0,05 con 52 gradi di libertà. I valori critici sono ± 2,0066 e quindi adesso passiamo a verificare la nostra ipotesi: X1 T stat = 3, > Rifiuto l ipotesi di non influenza del parametro X1 su Y X2 T stat = < Accetto l ipotesi di non influenza del parametro X2 su Y X3 T stat = > Rifiuto l ipotesi di non influenza del parametro X3 su Y X4 T stat = < Accetto l ipotesi di non influenza del parametro X4 su Y X5 T stat = < Accetto l ipotesi di non influenza del parametro X5 su Y X6 T stat = < Accetto l ipotesi di non influenza del parametro X6 su Y Questo test ci aiuta a capire che la maggior significatività del modello ci è fornita dalle due variabili indipendenti X1 = numero di camere e X3 = superficie della casa. Andiamo ora ad analizzare i residui attraverso il grafico seguente: $ $ $ - -$ $ - $ $ $ $ $ Prezzo stimato Possiamo notare che essi non presentano elementi di omoschedasticità e inoltre, essendo la loro media prossima a zero, possiamo affermare che essi sono casuali e non sistematici (si veda tabella foglio excel regressione a 6 variabili). Notiamo la presenza di alcuni outlier (cerchio rosso in alto a destra). Per queste 2 rilevazioni il modello che abbiamo ipotizzato non spiega quindi un prezzo così elevato. Adesso passiamo a ristimare il modello alla luce della precedente analisi di significatività che ha condotto ad individuare i due soli parametri indipendenti più significativi, ovvero X1 ed X3. L equazione della regressione diventa la seguente: 2
3 Statistica della regressione R multiplo 0, R al quadrato 0, R al quadrato corretto 0, Errore standard ,1291 Osservazioni 59 Notiamo che il valore di R quadro si riduce leggermente rispetto al modello precedente arrivando a spiegare il 76% del prezzo delle abitazioni delle case da noi considerate. Il valore di R quadro corretto si attesta al 75%. Per quanto riguarda l analisi della varianza avremo: ANALISI VARIANZA gdl SQ MQ F Significatività F Regressione 2 6,24107E+12 3,12054E+12 90, ,21406E-18 Residuo 56 1,94153E Totale 58 8,1826E+12 Verifichiamo se Fstat>Fα per capire se rifiutare l ipotesi nulla dei coefficienti. Gradi di libertà (n k 1) = 56, Numero variabili ind. k = 2, livello di significatività = 0,05 Facendo riferimento alle tabelle dei valori critici F di Fisher osserviamo come per n=circa 60 e k=2 otteniamo un Fα= 3,15. Dal confronto con Fstat riportato nella tabella excel osserviamo come 90,006 >2,25. Questa verifica ci permette di rifiutare l ipotesi di non corrispondenza lineare e di affermare che almeno una variabile indipendente sulle 2 osservate, è in grado di spiegare l andamento delle vendite. Stimando adesso nuovamente la regressione (vedi tabella regressione 2 variabili indipendenti) otteniamo i seguenti coefficienti di regressione: b 0 = ; b 1 = ,1; b 3 = 256,8538; Adesso rieffettuiamo il test T con l ipotesi H 0 : b i =0 con i = (1, 2) Confrontiamo i valori nella colonna Stat t con il valore critico della distribuzione t student corrispondente ad un livello di significatività dello 0,05 con 56 gradi di libertà. I valori critici sono ± 2,0032 e quindi adesso passiamo a verificare la nostra ipotesi: X1 T stat = 3, > Rifiuto l ipotesi di non influenza del parametro X1 su Y X3 T stat = 6, > Rifiuto l ipotesi di non influenza del parametro X3 su Y Confrontando i due modelli di studiati notiamo che il secondo modello ha un R 2 pari a 0,76 mentre il primo presenta un valore di 0,79. Possiamo così dire che il secondo modello pur prendendo in considerazione solo 2 variabili indipendenti rispetto alle 6 del primo modello perde solo il 3% della capacità di stimare correttamente il costo delle villette, quindi per il criterio di parsimonia riteniamo il secondo modello preferibile al primo. 2) Cercate di interpretare il segno e la grandezza di ciascun coefficiente. Sono come ve li aspettereste? Passiamo ora ad analizzare l analisi dei coefficienti di regressione considerando sia la prima regressione che la seconda regressione. Prima regressione: il valore dell intercetta b o da considerarsi fuori dal dominio di valutazione dei prezzi perché altrimenti dovremmo pensare che una casa con 0 stanze, 0 bagni e con tutte le altre caratteristiche nulle dovrebbe avere un valore negativo pari a $ Per quanto riguarda il parametro b 1 è facile osservare che il prezzo di una casa aumenta di circa $ per ogni stanza in più presente. La stessa considerazione vale per il numero di bagni mentre per la superficie della casa possiamo osservare che il prezzo aumenta di $167,8 per ogni foot 2 aggiuntivo dell immobile. Ci sembra verosimile anche il parametro b 4 relativo all anno di costruzione che (a differenza delle dimore storiche dei centri urbani italiani) indica una diminuzione del prezzo dell immobile di circa $4.166 per ogni anno in più di anzianità della casa. La presenza del garage incrementa il valore dell immobile di circa $ per ogni box auto disponibile. Per ultimo osserviamo il parametro b 6 relativo alla presenza della piscina. Questo coefficiente indica che il prezzo di un immobile scende di circa $3.475 in presenza di una piscina. Questo contraddice le nostre aspettative, ma il modello preso in considerazione, forse a causa del ridotto numero di osservazioni non valorizza la presenza di una piscina. Una possibile spiegazione che possiamo darci è che la presenza di una piscina rappresenti un onere in più in termini di costi di manutenzione. 3
4 Frequenza Frequenza Residui Seconda regressione: per l intercetta valgono le considerazioni fatte prima. Per quanto riguarda il parametro b 1 è facile osservare che il prezzo di una casa aumenta di circa $ ,1 per ogni stanza in più presente. Per la superficie della casa possiamo osservare che il prezzo aumenta di $256,85 per ogni foot 2 aggiuntivo dell immobile. 3) Analizzate i residui. Vi pare che siano distribuiti in modo normale? Ci sono valori anomali (outlier)? Passando all analisi dei residui del modello stimato possiamo affermare che i residui si distribuiscono in modo casuale, inoltre notiamo la presenza di alcuni outlier (le stesse osservazioni del modello precedente) che possiamo spiegare con la presenza di qualche altra variabile da noi non considerata che fa crescere il prezzo dell abitazione. $ $ $ - -$ $ - $ $ $ $ $ $ Prezzo stimato Inoltre dal valore dei residui standardizzati (foglio regressione a 2 variabile) vediamo come circa il 95% (93% per l esattezza) di essi assume valore compreso tra -1,96 e +1,96 (che corrisponde al 95% della distribuzione normale standard). Inoltre studiando anche la simmetria della curva notiamo che il valore dell asimmetria è di poco maggiore rispetto a zero (0,16 per la precisione) (tabella foglio regressione 2 variabili). La leggerissima asimmetria positiva (curva leggermente spostata a destra) e il valore del 93% può essere spiegata dalla presenza dei 2 outlier nella distribuzione. Soddisfacendo anche il criterio di simmetria possiamo affermare che i residui si distribuiscono come una normale. Sicuramente ristimando la regressione escludendo i due outlier le condizioni della distribuzione normale sarebbero totalmente soddisfatte. 4) In base alla distribuzione delle variabili indipendenti del vostro campione, definite una casa di lusso, casa ordinaria e casa economica per la vostra zona. Usando le vostre stime, calcolate il prezzo medio con una banda di confidenza al 95%, per ognuna delle tre tipologie di casa. Per definire la segmentazione del nostro campione in case di lusso, case ordinarie e case economiche, considerando solo le 2 variabili del nostro modello finale abbiamo effettuato una distribuzione di frequenza sia di X 1 che di X 3 e abbiamo ottenuto i seguenti istogrammi: 40 Camere da letto 40 Ft square > 3200 e abbiamo deciso la seguente segmentazione (le condizioni da rispettare sono entrambe): case di lusso: X 1 4 e X 3 > 3200 feet 2 case ordinarie: X 1 3 e 1900 X 3 < 3200 feet 2 case economiche: X 1 2 e 0 < X 3 < 1900 feet 2 abbiamo poi stimato la media secondo il test t e abbiamo ottenuto i seguenti valori (fogli stima casa ) casa di lusso casa media casa economica valore inferiore $ ,54 $ ,26 $ ,63 media $ ,33 $ ,00 $ ,00 valore superiore $ ,46 $ ,74 $ ,37 4
5 Esercizio 2. Si tratta di una serie storica su base mensile, l osservazione i-esima puo essere il risultato di più componenti, ovvero: Y i =T i *S i* C i* I i. In questo modo teniamo conto delle componenti di: trend, stagionalità, ciclicità ed irregolarità. Per l analisi e la previsione di dati su base mensile la teoria propone il modello dei minimi quadrati adattato attraverso la stima del trend esponenziale dove: Ўi =b0 Il trend esponenziale è confermato dalle serie delle Medie Mobili (MA n-mesi ) e da quelle con smussamento esponenziale. Con un peso W=0,25 o mediando 4 osservazioni si ha una buona approssimazione della serie, questo indica la presenza di ciclicità di breve periodo e,o, di irregolarità L analisi grafica, il confronto tra gli errori standard delle stime (S xy ), i valori della deviazione media assoluta (MAD), il confronto tra i grafici dei residui (che non indica un modello specifico a parte l espoenziale) e quello delle differenze prime ci portano a procedere con il modello auto regressivo di ordine 2 comparandolo inoltre con il modello dei minimi quadrati adattato. Par/Modello lineare quadratico polinomiale(5) esponenziale Autoregressivo(2) Quadratico adattato Sxy 15,35 5,82 4,39 14,04 4,34 0,09 SIGMA 1787,51 562,33 413,34 628,04 246,31 594,96 MAD 13,34 4,20 3,08 4,69 1,84 4,44 L ordine del modello auto regressivo e stato scelto pari a 2, con un ordine pari a 3 si ottiene per il coefficiente XL 3 : p- value= 0,65 > α=0,05 che ci permette di rifiutare l ipotesi nulla H 0, XL 3 non e significativo nella rappresentazione della serie. Il grafico dei residui mostra una buona casualità. E probabile una cattiva interpretazione della componente ciclica ed una tendenza a perdere l omoschedasticità (varianza non nulla) nella parte finale della serie. Dal grafico riportato a seguire si evince che Il modello scelto interpola bene la serie di dati. 5
6 Si e introdotta la stima della variabile Biofuel contro la variabile tempo e Biofuel(t-1) ovvero: Ў i = Regressione(t i,y t-1 ). Le statistiche dei due modelli sono comparabili nei valori, la Stima(t,t- 1) segue piu fedelmente gli andamenti della produzione reale ritardati t-1. Si puo utilizzare questo modello per la previsione della produzione tenendo conto dell operatore ritardo introdotto. Non ci sono tuttavia sufficienti motivi per preferire questo modello all Autoregressivo di ordine 2. Si calcolano a seguire i valori stimati per i sei mesi successivi alla fine del campione utilizzando la formula generica: Ў i = a 0 +a n y n con n ordine del modello. Gli intervalli di confidenza sono stati ottenuti con Excel utilizzando PHPStat e la funzione di regressione calcolando l intervallo di confidenza per il valore n-esimo. Osservazione Produzione Stima Aut.(2) Intervallo di conf. Stima (t,t-1) Intervallo di conf Febbraio 150,71 169, , Marzo 169,85 169, , Aprile - 162,68 149,41 209,76 171,87 159,98 219, Maggio - 169,05 158,28 218,90 156,48 142,89 202, Giugno - 168,48 157,75 218,34 174,06 164,64 224, Luglio - 171,49 161,96 222,68 160,48 148,61 207, Agosto - 172,67 163,80 224,57 176,41 168,16 228, Settembre - 174,81 166,85 227,71 164,45 159,22 218,77 Autoregressione (2) dati logaritmici R multiplo 0, R al quadrato 0, R al quadrato corretto 0, Errore standard 0, Stima(t.t-1) dati logaritmici R multiplo 0, R al quadrato 0, R al quadrato corretto 0, Errore standard 0, Trasformando la serie in valori logaritmici si abbattono gli effetti di ciclicità e stagionalità, migliorando la capacità previsionale. La serie viene linearizzata e la Stima(t,t-1) interpola meglio la serie di dati. Questo modello risulta preferibile. Dal grafico dei residui tuttavia si nota una associazione non lineare (vedasi allegato Excel). 6
Capitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara
DettagliAbbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995).
ANALISI DI UNA SERIE TEMPORALE Analisi statistica elementare Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995). Si puo' osservare una media di circa 26 C e una deviazione
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliANALISI DELLE FREQUENZE: IL TEST CHI 2
ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento
DettagliStatistica. Lezione 6
Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante
DettagliRAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL
RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL 1 RAPPRESENTAZIONE GRAFICA Per l analisi dati con Excel si fa riferimento alla versione 2007 di Office, le versioni successive non differiscono
DettagliCorso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 14: Analisi della varianza (ANOVA)
Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 4: Analisi della varianza (ANOVA) Analisi della varianza Analisi della varianza (ANOVA) ANOVA ad
DettagliSTATISTICA IX lezione
Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri
DettagliLEZIONE n. 5 (a cura di Antonio Di Marco)
LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,
DettagliSPC e distribuzione normale con Access
SPC e distribuzione normale con Access In questo articolo esamineremo una applicazione Access per il calcolo e la rappresentazione grafica della distribuzione normale, collegata con tabelle di Clienti,
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,
DettagliLa distribuzione Normale. La distribuzione Normale
La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una
DettagliRegressione Mario Guarracino Data Mining a.a. 2010/2011
Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume
Dettagli1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:
Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi
DettagliLA CORRELAZIONE LINEARE
LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
Dettagli3. Confronto tra medie di due campioni indipendenti o appaiati
BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO
DettagliALLEGATO 1 Analisi delle serie storiche pluviometriche delle stazioni di Torre del Lago e di Viareggio.
ALLEGATO 1 Analisi delle serie storiche pluviometriche delle stazioni di Torre del Lago e di Viareggio. Per una migliore caratterizzazione del bacino idrologico dell area di studio, sono state acquisite
DettagliLa regressione lineare multipla
13 La regressione lineare multipla Introduzione 2 13.1 Il modello di regressione multipla 2 13.2 L analisi dei residui nel modello di regressione multipla 9 13.3 Il test per la verifica della significatività
Dettagli1. Distribuzioni campionarie
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 9 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 TEST D IPOTESI Partiamo da un esempio presente sul libro di testo.
DettagliUniversità di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008
Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica 18 dicembre 008 Esame sull intero programma: esercizi da A a D Esame sulla seconda parte del programma: esercizi
DettagliUniversità degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI
Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI 1. L azienda Wood produce legno compensato per costruzioni
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 5-Indici di variabilità (vers. 1.0c, 20 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliUniversità del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza
Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica
DettagliRelazioni statistiche: regressione e correlazione
Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica
DettagliLineamenti di econometria 2
Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) La Regressione Multipla La Regressione Multipla La regressione multipla
Dettagli19txtI_BORRA_2013 18/11/13 10:52 Pagina 449 TAVOLE STATISTICHE
19txtI_BORRA_2013 18/11/13 10:52 Pagina 449 TAVOLE STATISTICHE Nell inferenza è spesso richiesto il calcolo di alcuni valori critici o di alcune probabilità per le variabili casuali che sono state introdotte
DettagliCapitolo 11 Test chi-quadro
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova
DettagliI ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale
I ESERCITAZIONE ESERCIZIO 1 Si vuole testare un nuovo farmaco contro il raffreddore. Allo studio partecipano 200 soggetti sani della stessa età e dello stesso sesso e con caratteristiche simili. i) Che
DettagliL Analisi della Varianza ANOVA (ANalysis Of VAriance)
L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 CONCETTI GENERALI Finora abbiamo descritto test di ipotesi finalizzati alla verifica di ipotesi sulla differenza tra parametri di due popolazioni
DettagliSoluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)
Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini) Esercizio 1 In uno studio sugli affitti mensili, condotto su un campione casuale di 14 monolocali nella città nella città
DettagliAnalisi di dati di frequenza
Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato
DettagliESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE
ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE e-mail: tommei@dm.unipi.it web: www.dm.unipi.it/ tommei Ricevimento: su appuntamento Dipartimento di Matematica, piano terra, studio 114
DettagliVERIFICA DELLE IPOTESI
VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliRELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della
RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili
DettagliFACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA
FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA NB Come potete vedere facendo la somma dei punteggi il numero di quesiti è superiore a quello
DettagliCAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI
VERO FALSO CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI 1. V F Un ipotesi statistica è un assunzione sulle caratteristiche di una o più variabili in una o più popolazioni 2. V F L ipotesi nulla unita
DettagliEsercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)
Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso
DettagliStima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una
DettagliIl metodo della regressione
Il metodo della regressione Consideriamo il coefficiente beta di una semplice regressione lineare, cosa significa? È una differenza tra valori attesi Anche nel caso classico di variabile esplicativa continua
DettagliLezione n. 2 (a cura di Chiara Rossi)
Lezione n. 2 (a cura di Chiara Rossi) QUANTILE Data una variabile casuale X, si definisce Quantile superiore x p : X P (X x p ) = p Quantile inferiore x p : X P (X x p ) = p p p=0.05 x p x p Graficamente,
DettagliVALORE DELLE MERCI SEQUESTRATE
La contraffazione in cifre: NUOVA METODOLOGIA PER LA STIMA DEL VALORE DELLE MERCI SEQUESTRATE Roma, Giugno 2013 Giugno 2013-1 Il valore economico dei sequestri In questo Focus si approfondiscono alcune
DettagliGeneral Linear Model. Esercizio
Esercizio General Linear Model Una delle molteplici applicazioni del General Linear Model è la Trend Surface Analysis. Questa tecnica cerca di individuare, in un modello di superficie, quale tendenza segue
DettagliLineamenti di econometria 2
Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) Aspetti Statistici della Regressione Aspetti Statistici della Regressione
DettagliUn po di statistica. Christian Ferrari. Laboratorio di Matematica
Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di
DettagliIl confronto fra proporzioni
L. Boni Il rapporto Un rapporto (ratio), attribuendo un ampio significato al termine, è il risultato della divisione di una certa quantità a per un altra quantità b Il rapporto Spesso, in maniera più specifica,
DettagliTest statistici di verifica di ipotesi
Test e verifica di ipotesi Test e verifica di ipotesi Il test delle ipotesi consente di verificare se, e quanto, una determinata ipotesi (di carattere biologico, medico, economico,...) è supportata dall
DettagliAnalisi di scenario File Nr. 10
1 Analisi di scenario File Nr. 10 Giorgio Calcagnini Università di Urbino Dip. Economia, Società, Politica giorgio.calcagnini@uniurb.it http://www.econ.uniurb.it/calcagnini/ http://www.econ.uniurb.it/calcagnini/forecasting.html
DettagliVerifica di ipotesi e intervalli di confidenza nella regressione multipla
Verifica di ipotesi e intervalli di confidenza nella regressione multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2014 Rossi MRLM Econometria - 2014 1 / 23 Sommario Variabili di controllo
DettagliEsercitazione n.2 Inferenza su medie
Esercitazione n.2 Esercizio L ufficio del personale di una grande società intende stimare le spese mediche familiari dei suoi impiegati per valutare la possibilità di attuare un programma di assicurazione
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato
DettagliProbabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)
Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:
DettagliOpportunità e rischi derivanti dall'impiego massivo dell'informatica in statistica. Francesco Maria Sanna Roma, 3 maggio 2012
Opportunità e rischi derivanti dall'impiego massivo dell'informatica in statistica Francesco Maria Sanna Roma, 3 maggio 2012 Procedere alla misura, al rilevamento e al trattamento dei dati è sempre stato
DettagliEsercitazione n.4 Inferenza su varianza
Esercizio 1 Un industria che produce lamiere metalliche ha ricevuto un ordine di acquisto di un grosso quantitativo di lamiere di un dato spessore. Per assicurare la qualità della propria fornitura, l
DettagliAnalisi della performance temporale della rete
Analisi della performance temporale della rete In questo documento viene analizzato l andamento nel tempo della performance della rete di promotori. Alcune indicazioni per la lettura di questo documento:
DettagliE naturale chiedersi alcune cose sulla media campionaria x n
Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile
DettagliGUIDA AL CALCOLO DEI COSTI DELLE ATTIVITA DI RICERCA DOCUMENTALE
GUIDA AL CALCOLO DEI COSTI DELLE ATTIVITA DI RICERCA DOCUMENTALE L applicazione elaborata da Nordest Informatica e disponibile all interno del sito è finalizzata a fornirvi un ipotesi dell impatto economico
DettagliIndici di dispersione
Indici di dispersione 1 Supponiamo di disporre di un insieme di misure e di cercare un solo valore che, meglio di ciascun altro, sia in grado di catturare le caratteristiche della distribuzione nel suo
Dettagli( x) ( x) 0. Equazioni irrazionali
Equazioni irrazionali Definizione: si definisce equazione irrazionale un equazione in cui compaiono uno o più radicali contenenti l incognita. Esempio 7 Ricordiamo quanto visto sulle condizioni di esistenza
DettagliInferenza statistica. Statistica medica 1
Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella
Dettaglipostulato della valutazione tramite indicatori: La valutazione di un sistema sanitario tramite indicatori ipotizza
postulato della valutazione tramite indicatori: La valutazione di un sistema sanitario tramite indicatori ipotizza la praticabilità di una scomposizione della complessità in informazioni elementari ed
DettagliEsercitazione n.1 (v.c. Binomiale, Poisson, Normale)
Esercizio 1. Un azienda produce palline da tennis che hanno probabilità 0,02 di essere difettose, indipendentemente l una dall altra. La confezione di vendita contiene 8 palline prese a caso dalla produzione
Dettagli2. Leggi finanziarie di capitalizzazione
2. Leggi finanziarie di capitalizzazione Si chiama legge finanziaria di capitalizzazione una funzione atta a definire il montante M(t accumulato al tempo generico t da un capitale C: M(t = F(C, t C t M
DettagliPer studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R
Studio di funzione Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R : allo scopo di determinarne le caratteristiche principali.
DettagliPro e contro delle RNA
Pro e contro delle RNA Pro: - flessibilità: le RNA sono approssimatori universali; - aggiornabilità sequenziale: la stima dei pesi della rete può essere aggiornata man mano che arriva nuova informazione;
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 3.1 Introduzione all inferenza statistica Prima Parte Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014
DettagliLa categoria «ES» presenta (di solito) gli stessi comandi
Utilizzo delle calcolatrici FX 991 ES+ Parte II PARMA, 11 Marzo 2014 Prof. Francesco Bologna bolfra@gmail.com ARGOMENTI DELLA LEZIONE 1. Richiami lezione precedente 2.Calcolo delle statistiche di regressione:
DettagliSlide Cerbara parte1 5. Le distribuzioni teoriche
Slide Cerbara parte1 5 Le distribuzioni teoriche I fenomeni biologici, demografici, sociali ed economici, che sono il principale oggetto della statistica, non sono retti da leggi matematiche. Però dalle
DettagliStatistiche campionarie
Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle
Dettaglilezione 18 AA 2015-2016 Paolo Brunori
AA 2015-2016 Paolo Brunori Previsioni - spesso come economisti siamo interessati a prevedere quale sarà il valore di una certa variabile nel futuro - quando osserviamo una variabile nel tempo possiamo
DettagliAnalisi statistica delle funzioni di produzione
Analisi statistica delle funzioni di produzione Matteo Pelagatti marzo 28 Indice La funzione di produzione di Cobb-Douglas 2 2 Analisi empirica della funzione di produzione aggregata 3 Sommario Con la
DettagliSTATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE
STATISTICA DESCRITTIVA SCHEDA N. : REGRESSIONE LINEARE Nella Scheda precedente abbiamo visto che il coefficiente di correlazione fra due variabili quantitative X e Y fornisce informazioni sull esistenza
DettagliMisure della dispersione o della variabilità
QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.
DettagliRISCHIO E CAPITAL BUDGETING
RISCHIO E CAPITAL BUDGETING Costo opportunità del capitale Molte aziende, una volta stimato il loro costo opportunità del capitale, lo utilizzano per scontare i flussi di cassa attesi dei nuovi progetti
DettagliMetodi Matematici e Informatici per la Biologia----31 Maggio 2010
Metodi Matematici e Informatici per la Biologia----31 Maggio 2010 COMPITO 4 (3 CREDITI) Nome: Cognome: Matricola: ISTRUZIONI Gli esercizi che seguono sono di tre tipi: Domande Vero/Falso: cerchiate V o
DettagliLineamenti di econometria 2
Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) Regressione con Variabili Dummy Regressione con Variabili Dummy La
DettagliInferenza statistica I Alcuni esercizi. Stefano Tonellato
Inferenza statistica I Alcuni esercizi Stefano Tonellato Anno Accademico 2006-2007 Avvertenza Una parte del materiale è stato tratto da Grigoletto M. e Ventura L. (1998). Statistica per le scienze economiche,
DettagliDimensione di uno Spazio vettoriale
Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione
DettagliLa dispersione dei prezzi al consumo. I risultati di un indagine empirica sui prodotti alimentari.
La dispersione dei prezzi al consumo. I risultati di un indagine empirica sui prodotti alimentari. Giovanni Anania e Rosanna Nisticò EMAA 14/15 X / 1 Il problema Un ottimo uso del vostro tempo! questa
DettagliEsercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test
STATISTICA (2) ESERCITAZIONE 6 05.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test Il preside della scuola elementare XYZ sospetta che
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliMetodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla
Il metodo della regressione può essere esteso dal caso in cui si considera la variabilità della risposta della y in relazione ad una sola variabile indipendente X ad una situazione più generale in cui
Dettagli2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale
BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk
Dettagli~ Copyright Ripetizionando - All rights reserved ~ http://ripetizionando.wordpress.com STUDIO DI FUNZIONE
STUDIO DI FUNZIONE Passaggi fondamentali Per effettuare uno studio di funzione completo, che non lascia quindi margine a una quasi sicuramente errata inventiva, sono necessari i seguenti 7 passaggi: 1.
DettagliPolitecnico di Torino. Esercitazioni di Protezione idraulica del territorio
Politecnico di Torino Esercitazioni di Protezione idraulica del territorio a.a. 2012-2013 ESERCITAZIONE 1 VALUTAZIONE DELLA RARITÀ DI UN EVENTO PLUVIOMETRICO ECCEZIONALE 1. Determinazione del periodo di
DettagliLa distribuzione Gaussiana
Università del Piemonte Orientale Corso di Laurea in Biotecnologie Corso di Statistica Medica La distribuzione Normale (o di Gauss) Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione
DettagliExcel Terza parte. Excel 2003
Excel Terza parte Excel 2003 TABELLA PIVOT Selezioniamo tutti i dati (con le relative etichette) Dati Rapporto tabella pivot e grafico pivot Fine 2 La tabella pivot viene messa di default in una pagina
DettagliProva di autovalutazione Prof. Roberta Siciliano
Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.
DettagliDisegni di Ricerca e Analisi dei Dati in Psicologia Clinica. Indici di Affidabilità
Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica Indici di Affidabilità L Attendibilità È il livello in cui una misura è libera da errore di misura È la proporzione di variabilità della misurazione
DettagliTema A. 1.2. Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che
Statistica Cognome: Laurea Triennale in Biologia Nome: 26 luglio 2012 Matricola: Tema A 1. Parte A 1.1. Sia x 1, x 2,..., x n un campione di n dati con media campionaria x e varianza campionaria s 2 x
DettagliStatistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice
Esercitazione 15 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 18 L importanza del gruppo di controllo In tutti i casi in cui si voglia studiare l effetto di un certo
Dettagli1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.
Esercizio 1 Sia X 1,..., X un campione casuale estratto da una variabile aleatoria normale con media pari a µ e varianza pari a 1. Supponiamo che la media campionaria sia x = 2. 1a) Calcolare gli estremi
DettagliEsercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco
Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco Alfonso Iodice D Enza April 26, 2007 1...prima di cominciare Contare, operazione solitamente semplice, può diventare complicata se lo scopo
DettagliEQUAZIONI DIFFERENZIALI. 1. Trovare tutte le soluzioni delle equazioni differenziali: (a) x = x 2 log t (d) x = e t x log x (e) y = y2 5y+6
EQUAZIONI DIFFERENZIALI.. Trovare tutte le soluzioni delle equazioni differenziali: (a) x = x log t (d) x = e t x log x (e) y = y 5y+6 (f) y = ty +t t +y (g) y = y (h) xy = y (i) y y y = 0 (j) x = x (k)
DettagliFinanza Aziendale. Lezione 13. Introduzione al costo del capitale
Finanza Aziendale Lezione 13 Introduzione al costo del capitale Scopo della lezione Applicare la teoria del CAPM alle scelte di finanza d azienda 2 Il rischio sistematico E originato dalle variabili macroeconomiche
DettagliT DI STUDENT Quando si vogliono confrontare solo due medie, si può utilizzare il test t di Student La formula per calcolare il t è la seguente:
T DI STUDENT Quando si vogliono confrontare solo due medie, si può utilizzare il test t di Student La formula per calcolare il t è la seguente: t = X i X j s 2 i (n i 1) + s 2 j (n j 1) n i + n j - 2 1
DettagliLE CARTE DI CONTROLLO (4)
LE CARTE DI CONTROLLO (4) Tipo di carta di controllo Frazione difettosa Carta p Numero di difettosi Carta np Dimensione campione Variabile, solitamente >= 50 costante, solitamente >= 50 Linea centrale
DettagliI punteggi zeta e la distribuzione normale
QUINTA UNITA I punteggi zeta e la distribuzione normale I punteggi ottenuti attraverso una misurazione risultano di difficile interpretazione se presi in stessi. Affinché acquistino significato è necessario
Dettagli