Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico )
|
|
- Flavia Castellani
- 8 anni fa
- Visualizzazioni
Transcript
1 Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 011-1) REGRESSIONE LINEARE SEMPLICE OPEN STATISTICA 8.44 Per 8 settimanali, appartenenti alla medesima fascia di prezzo e presenti in edicola a una certa data, sono stati rilevati il numero X di pagine dedicate ad arte e cultura e le vendite Y (in milioni di lire) effettuate nella settimana. I dati sono riportati nella seguente tabella: X Y a) Si stimino con il metodo dei minimi quadrati i parametri β 0 e β 1 del modello: Y=β 0 + β 1X + ε In R i due vettori dei dati X e Y vengono costruiti come segue: x<-c(0,1,,5,7,10,14,0) y<-c(375,450,500,75,800,950,105,100) Può essere interessante visualizzare la nube dei punti attraverso un grafico che contenga la cosiddetta spezzata di regressione. In R si utilizza la funzione plot che visualizza la successione dei punti seguita dalla funzione lines che ha l obiettivo di congiungere con una linea i punti del diagramma. Gli argomenti delle funzioni sono nell ordine il vettore delle X e quello delle Y: plot(x,y) lines(x,y) 1
2 Esistono altri argomenti opzionali per la personalizzazione del grafico (relativamente agli assi, ai titoli, legenda, colori ecc.). Per una più dettagliata trattazione si rimanda all help in linea del linguaggio R: help(plot) Per stimare i parametri della retta di regressione si può procedere calcolando dettagliatamente tutte le formule derivanti dal metodo dei minimi quadrati oppure utilizzando le funzioni già predisposte a questo proposito in R. Relativamente al primo approccio, (più laborioso ma sicuramente più costruttivo!) è necessario valutare medie, devianze e codevianze. Si costruiscano i vettori scarto dalle medie utilizzando la funzione mean che calcola la media aritmetica di una successione di valori: x.scarti<- x-mean(x) y.scarti<- y-mean(y) La devianza di X, quella di Y e la codevianza risultano allora: dev.x <- sum(x.scarti^) dev.y <- sum(y.scarti^) codev.xy <- sum(x.scarti*y.scarti) L intercetta e il coefficiente di regressione risultano quindi: b1 <- codev.xy/dev.x b0 <- mean(y)-mean(x)*b Alternativamente per stimare un modello di regressione lineare si può utilizzare la funzione lm. Tale funzione è può essere utilizzata più in generale per vari tipi di modelli lineari, quali modelli di regressione lineari e multipli, analisi della varianza e analisi della covarianza. Come ogni altra funzione, lm prevede argomenti necessari e facoltativi. Quello indispensabile in questo caso è una formula, ovvero una descrizione simbolica del modello da stimare. La descrizione deve essere fatta in questo modo: pertanto in questo contesto la funzione sarà: output.reg.lin <- lm(y~x) variabile risposta ~ variabili esplicative Il risultato della regressione lineare è racchiuso in una lista un oggetto complesso in R articolato in più vettori, matrici o altri oggetti. Al fine di visualizzare separatamente gli oggetti della lista si utilizza il simbolo $ seguito dal nome dell oggetto stesso. La stima dei parametri è contenuta nel vettore coefficients: output.reg.lin$coefficients (Intercept) x A questo punto è possibile visualizzare graficamente la retta di regressione. A tal proposito si valutino i valori teorici: y.teorici<-b0+b1*x
3 Se si vuole ottenere un grafico che visualizzi la retta passante attraverso la nube dei punti osservata si digitino le funzioni plot per la nube dei punti e points che aggiunge una serie di dati ad un grafico corrente. Con le opzioni type= l e col= (rosso) si intende rappresentare una linea continua e di colore rosso: plot(x,y) points(x,y.teorici,type="l",col="") Si potevano altresì utilizzare i comandi: plot(x,y) abline(output.reg.lin) b) Si determinino gli intervalli di confidenza al 99% per il coefficiente angolare e l intercetta Prima di utilizzare l output derivante dalla funzione lm si proceda per passi, calcolando tutte le quantità necessarie per le formule: b 1 ± tα ; n ( x x) s ydisp 1 x + n bo ± tα ; n s ydisp ( x x) La radice quadrata della varianza di dispersione si può calcolare nel seguente modo: dev.disp<-sum((y-y.teorici)^) s.disp<-sqrt(dev.disp/6)
4 Alternativamente l output della funzione lm comprende i valori teorici e i residui negli oggetti denominati rispettivamente fitted.values e residuals. Pertanto la devianza di dispersione si poteva ottenere anche nel seguente modo: dev.disp<-sum((output.reg.lin$residuals)^) Il valore teorico della distribuzione t di Student in corrispondenza di un determinato livello di significatività lo si determina facendo ricorso alla funzione qt. Tale funzione (cosi come le funzioni qnorm, qbinom, qf, ecc.) determina il valore di ascissa della funzione di ripartizione in modo che l area alla sua sinistra corrisponda ad una determinata frazione percentuale. La funzione prende due argomenti necessari: la frazione percentuale dell area e i gradi di libertà. Essendo l intervallo di confidenza pari al 99% si noti che qt(0.005,6) qt(0.995,6) essendo la distribuzione t simmetrica e pertanto il valore teorico di t è dato da: t.value<-qt(0.995,6) Ora gli estremi dell intervallo di confidenza per il coefficiente angolare sono dati da: inf.b1<-b1-t.value*s.disp/sqrt(dev.x) sup.b1<-b1+t.value*s.disp/sqrt(dev.x) mentre quelli per l intercetta sono dati da: sup.b0<-b0+t.value*s.disp*sqrt(1/8+(mean(x)^/dev.x)) inf.b0<-b0-t.value*s.disp*sqrt(1/8+(mean(x)^/dev.x)) c) Il valore medio della variabile Y, E(Y x d) quando x d =7 Si tratta di un problema di previsione: poiché non si è in grado di prevedere in maniera esatta il valore di una singola estrazione occorre determinare l intervallo di confidenza per il valore medio E(Y x d). Tale intervallo viene determinato applicando la formula: Dunque si avrà: 1 ( xd x) i = ( b0 + b1 xd ) ± tα ; n s ydisp + n ( x x) inf.prev<-b0+b1*7-(t.value*s.disp*sqrt(1/8+((7-mean(x))^/dev.x))) sup.prev<-b0+b1*7+(t.value*s.disp*sqrt(1/8+((7-mean(x))^/dev.x)))
5 Per visualizzare graficamente le bande di confidenza attorno alla retta di regressione si costruisce una variabile xx contenente una successione di valori da 0 a 0 e si procede come al passo precedente al calcolo dell estremo inferiore e superiore per tali valori: xx<-0:0 inf.prev.xx<-b0+b1*xx-(t.value*s.disp*sqrt(1/8+((xx-mean(x))^/dev.x))) sup.prev.xx<-b0+b1*xx+(t.value*s.disp*sqrt(1/8+((xx-mean(x))^/dev.x))) plot(x,y.teorici,"l") lines(x=xx,y=inf.prev.xx,col=,type="c") lines(x=xx,y=sup.prev.xx,col=,type="c") y.teorici x 5
6 open statistica 8.44 Si sono valutati i consumi di 10 utilitarie di case automobilistiche diverse con i seguenti risultati: Velocità in miglia per ora (X) Consumo in miglia per gallone (Y) a) Si stimi il modello di regressione di Y su X x<-c(50,50,55,55,60,60,65,70,70,75) y<-c(34.8,33.6,34.6,34.1,3.8,31.9,3.6,31.6,31.8,30.9) output.reg.lin<-lm(y~x) output.reg.lin$coefficients (Intercept) x b) Si valuti con un test opportuno l esistenza di un legame lineare tra la velocità e il consumo di benzina, scegliendo α=0,01. Si tratta di verificare l ipotesi nulla H 0: β 1=0 attraverso la statistica test: t c = b 1 * ( y y ) ) ( x ) ( n x in cui la devianza di dispersione è: dev.disp<-sum(output.reg.lin$residuals^) la devianza di x è: dev.x<-sum((x-mean(x))^) 690 mentre b 1 è il secondo elemento del vettore output.reg.lin$coefficients e lo si seleziona mediante b1<-output.reg.lin$coefficients[] Pertanto la statistica test risulta : tc<-b1/sqrt(dev.disp/(8*dev.x)) Per verificare l ipotesi nulla si confronta tale valore con quello teorico ottenuto in corrispondenza di α=0,01 e di 8 gradi di libertà: 6
7 qt(0.005,8) Poiché < si rifiuta l ipotesi nulla. In modo analogo si poteva calcolare il p-value associato alla statistica test La funzione pt (e così le funzioni pnorm, pbinom, pf ecc.) calcola l area della coda della distribuzione t di Student in corrispondenza di due argomenti: l ascissa e i gradi di libertà. Pertanto: *pt( ,8) ed essendo <0.01 (=α) si conclude che o si è verificato un evento molto raro, oppure l ipotesi nulla non è vera. Quindi si rifiuta l ipotesi nulla di indipendenza lineare tra i consumi e la velocità. Agli stessi risultati si poteva arrivare utilizzando la funzione summary applicata all output di lm. La funzione produce alcune informazioni di sintesi sulla stima del modello lineare: summary(output.reg.lin) Call: lm(formula = y ~ x) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-09 *** x *** --- Signif. codes: 0 `***' `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 Residual standard error: on 8 degrees of freedom Multiple R-Squared: , Adusted R-squared: F-statistic: on 1 and 8 DF, p-value: Vi sono elencate informazioni sui residui, sulla verifica di ipotesi dei parametri, sull indice di determinazione lineare e sul test F per valutare la significatività del modello di regressione. Con riferimento alla parte intitolata Coefficients si ritrova la statistica test e il p-value calcolati per la stima del coefficiente di regressione. L indice di determinazione lineare R-Squared risulta e lo si poteva altresì ottenere con i seguenti passaggi: dev.tot<-sum((y-mean(y))^) dev.reg<-dev.tot-dev.disp dev.reg/dev.tot sreg La statistica F, Fc = la si può calcolare anche come: s disp dev.reg/(dev.disp/8)
8 Se si vuole visualizzare la tabella dell analisi della varianza per questo modello di regressione si può utilizzare il comando anova: anova(output.reg.lin) Analysis of Variance Table Response: y Df Sum Sq Mean Sq F value Pr(>F) x *** Residuals Signif. codes: 0 `***' `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 8
Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico )
Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 05-6) REGRESSIONE LINEARE SEMPLICE OPEN STATISTICA 8.44 Per 8 settimanali, appartenenti alla medesima fascia di prezzo e presenti in edicola
Dettagli> d = alimentazione == "benz" > mean(percorr.urbana[!d]) - mean(percorr.urbana[d]) [1] 2.385627. > sd(percorr.urbana[d]) [1] 2.
A questo punto vale la pena di soffermarci di più sull alimentazione. Intanto cerchiamo di indagare se l alimentazione è davvero un fattore significativo per la percorrenza come è luogo comune pensare.
DettagliEsercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza
Esercitazione Statistica Computazionale B Modelli di regressione lineare semplice Verifica di ipotesi - Analisi della varianza 3 maggio 2005 Esercizio 1 Consideriamo l esempio del libro di testo Annette
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato
DettagliLEZIONE n. 5 (a cura di Antonio Di Marco)
LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,
DettagliRelazioni statistiche: regressione e correlazione
Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica
DettagliStatistica. Lezione 6
Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante
DettagliIndice. 1 Introduzione ai modelli lineari 2. 2 Dataset 3. 3 Il Modello 8. 4 In pratica 12 4.1 Peso e percorrenza... 12
Indice 1 Introduzione ai modelli lineari 2 2 Dataset 3 3 Il Modello 8 4 In pratica 12 41 Peso e percorrenza 12 1 Capitolo 1 Introduzione ai modelli lineari Quando si analizzano dei dati, spesso si vuole
DettagliValidazione dei modelli Strumenti quantitativi per la gestione
Validazione dei modelli Strumenti quantitativi per la gestione Emanuele Taufer Validazione dei modelli Il data set Auto I dati Il problema analizzato Validation set approach Diagramma a dispersione Test
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
Dettagli(a cura di Francesca Godioli)
lezione n. 12 (a cura di Francesca Godioli) Ad ogni categoria della variabile qualitativa si può assegnare un valore numerico che viene chiamato SCORE. Passare dalla variabile qualitativa X2 a dei valori
DettagliFACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA
FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA NB Come potete vedere facendo la somma dei punteggi il numero di quesiti è superiore a quello
DettagliLa distribuzione Normale. La distribuzione Normale
La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una
DettagliProf.ssa Paola Vicard
Questa nota consiste perlopiù nella traduzione (con alcune integrazioni) da Descriptive statistics di J. Shalliker e C. Ricketts, 2000, University of Plymouth Consideriamo i dati nel file esercizio10_dati.xls.
DettagliSoluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)
Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini) Esercizio 1 In uno studio sugli affitti mensili, condotto su un campione casuale di 14 monolocali nella città nella città
DettagliRAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL
RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL 1 RAPPRESENTAZIONE GRAFICA Per l analisi dati con Excel si fa riferimento alla versione 2007 di Office, le versioni successive non differiscono
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 3.1 Introduzione all inferenza statistica Prima Parte Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014
DettagliL Analisi della Varianza ANOVA (ANalysis Of VAriance)
L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 CONCETTI GENERALI Finora abbiamo descritto test di ipotesi finalizzati alla verifica di ipotesi sulla differenza tra parametri di due popolazioni
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi per la media (varianza nota), p-value del test Il manager di un fast-food
Dettagli1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:
Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi
DettagliSTATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 8: 27-05-2004
esercitazione 8 p. 1/8 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 8: 27-05-2004 Luca Monno Università degli studi di Pavia luca.monno@unipv.it http://www.lucamonno.it
DettagliLineamenti di econometria 2
Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) Aspetti Statistici della Regressione Aspetti Statistici della Regressione
DettagliRELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della
RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili
DettagliRegressione Mario Guarracino Data Mining a.a. 2010/2011
Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume
DettagliGrafici delle distribuzioni di frequenza
Grafici delle distribuzioni di frequenza L osservazione del grafico può far notare irregolarità o comportamenti anomali non direttamente osservabili sui dati; ad esempio errori di misurazione 1) Diagramma
DettagliProva di autovalutazione Prof. Roberta Siciliano
Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.
DettagliLa grafica. La built-in funzione grafica plot. x spezzata poligonale. discretizzato
La grafica. Il Matlab possiede un ambiente grafico abbastanza potente paragonabile a software grafici operanti in altri contesti. In questo corso ci limiteremo ad illustrare solo una funzione grafica,
DettagliEsercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)
Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso
DettagliAnalisi della performance temporale della rete
Analisi della performance temporale della rete In questo documento viene analizzato l andamento nel tempo della performance della rete di promotori. Alcune indicazioni per la lettura di questo documento:
DettagliInferenza statistica. Statistica medica 1
Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella
DettagliUn po di statistica. Christian Ferrari. Laboratorio di Matematica
Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di
DettagliUniversità degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI
Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI 1. L azienda Wood produce legno compensato per costruzioni
DettagliEsercitazione n.1 (v.c. Binomiale, Poisson, Normale)
Esercizio 1. Un azienda produce palline da tennis che hanno probabilità 0,02 di essere difettose, indipendentemente l una dall altra. La confezione di vendita contiene 8 palline prese a caso dalla produzione
DettagliEsercizi di riepilogo Statistica III canale, anno 2008
Esercizio 1 - Esercizio 5 esame 22 giugno 2004 Esercizi di riepilogo Statistica III canale, anno 2008 Data la seguente distribuzione di 100 dipendenti di un azienda in base al tempo impiegato (in minuti)
DettagliESAME DI STATISTICA Nome: Cognome: Matricola:
ESAME DI STATISTICA Nome: Cognome: Matricola: ISTRUZIONI: Per la prova è consentito esclusivamente l uso di una calcolatrice tascabile, delle tavole della normale e della t di Student. I risultati degli
DettagliCorso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica
Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica Nome N. Matricola Ancona, 14 luglio 2015 1. Tre macchine producono gli stessi pezzi
DettagliESERCIZI SVOLTI PER LA PROVA DI STATISTICA
ESERCIZI SVOLTI PER LA PROVA DI STATISTICA Stefania Naddeo (anno accademico 4/5) INDICE PARTE PRIMA: STATISTICA DESCRITTIVA. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE. VALORI CARATTERISTICI
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,
DettagliSTATISTICA IX lezione
Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri
DettagliRegressione lineare multipla Strumenti quantitativi per la gestione
Regressione lineare multipla Strumenti quantitativi per la gestione Emanuele Taufer Regressione lineare multipla (RLM) Esempio: RLM con due predittori Stima dei coefficienti e previsione Advertising data
DettagliIl concetto di valore medio in generale
Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo
DettagliExcel Terza parte. Excel 2003
Excel Terza parte Excel 2003 TABELLA PIVOT Selezioniamo tutti i dati (con le relative etichette) Dati Rapporto tabella pivot e grafico pivot Fine 2 La tabella pivot viene messa di default in una pagina
DettagliMATEMATICA 2001. p = 4/6 = 2/3; q = 1-2/3 = 1/3. La risposta corretta è quindi la E).
MATEMATICA 2001 66. Quale fra le seguenti affermazioni è sbagliata? A) Tutte le funzioni ammettono la funzione inversa B) Una funzione dispari è simmetrica rispetto all origine C) Una funzione pari è simmetrica
DettagliVERIFICA DELLE IPOTESI
VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi
DettagliRapporto dal Questionari Insegnanti
Rapporto dal Questionari Insegnanti SCUOLA CHIC81400N N. Docenti che hanno compilato il questionario: 60 Anno Scolastico 2014/15 Le Aree Indagate Il Questionario Insegnanti ha l obiettivo di rilevare la
DettagliSTATISTICA DESCRITTIVA SCHEDA N. 5: REGRESSIONE LINEARE
STATISTICA DESCRITTIVA SCHEDA N. : REGRESSIONE LINEARE Nella Scheda precedente abbiamo visto che il coefficiente di correlazione fra due variabili quantitative X e Y fornisce informazioni sull esistenza
DettagliStima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una
DettagliIl modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.
DettagliAnova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011
Anova e regressione Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011 Nella sperimentazione agronomica e biologica in genere è normale organizzare
DettagliEsercitazione n.2 Inferenza su medie
Esercitazione n.2 Esercizio L ufficio del personale di una grande società intende stimare le spese mediche familiari dei suoi impiegati per valutare la possibilità di attuare un programma di assicurazione
Dettagli2 + (σ2 - ρσ 1 ) 2 > 0 [da -1 ρ 1] b = (σ 2. 2 - ρσ1 σ 2 ) = (σ 1
1 PORTAFOGLIO Portafoglio Markowitz (2 titoli) (rischiosi) due titoli rendimento/varianza ( μ 1, σ 1 ), ( μ 2, σ 2 ) Si suppone μ 1 > μ 2, σ 1 > σ 2 portafoglio con pesi w 1, w 2 w 1 = w, w 2 = 1- w 1
DettagliINDICE PREFAZIONE VII
INDICE PREFAZIONE VII CAPITOLO 1. LA STATISTICA E I CONCETTI FONDAMENTALI 1 1.1. Un po di storia 3 1.2. Fenomeno collettivo, popolazione, unità statistica 4 1.3. Caratteri e modalità 6 1.4. Classificazione
DettagliL analisi dei dati. Capitolo 4. 4.1 Il foglio elettronico
Capitolo 4 4.1 Il foglio elettronico Le più importanti operazioni richieste dall analisi matematica dei dati sperimentali possono essere agevolmente portate a termine da un comune foglio elettronico. Prenderemo
DettagliINTRODUZIONE AL DOE come strumento di sviluppo prodotto Francesca Campana Parte 3 Piani a fattore singolo e relativi test di interpretazione
INTRODUZIONE AL DOE come strumento di sviluppo prodotto Francesca Campana Parte 3 Piani a fattore singolo e relativi test di interpretazione Pagina 1 PIANI A SINGOLA VARIABILE Questi piani sono l esempio
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 5-Indici di variabilità (vers. 1.0c, 20 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliAbbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995).
ANALISI DI UNA SERIE TEMPORALE Analisi statistica elementare Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995). Si puo' osservare una media di circa 26 C e una deviazione
DettagliANALISI DELLE FREQUENZE: IL TEST CHI 2
ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento
DettagliLA CORRELAZIONE LINEARE
LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione
DettagliLABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE
LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE 5.1 ESEMPIO DI ANOVA AD UNA VIA In un esperimento un gruppo di bambini è stato assegnato a caso a 3 trattamenti, allo scopo di determinare
DettagliExcel avanzato. I nomi. Gli indirizzi e le formule possono essere sostituiti da nomi. Si creano tramite Inserisci Nome Definisci
Excel avanzato I nomi marco.falda@unipd.it Gli indirizzi e le formule possono essere sostituiti da nomi documentazione astrazione Si creano tramite Inserisci Nome Definisci Vengono raccolti nell area riferimento
DettagliLE FUNZIONI A DUE VARIABILI
Capitolo I LE FUNZIONI A DUE VARIABILI In questo primo capitolo introduciamo alcune definizioni di base delle funzioni reali a due variabili reali. Nel seguito R denoterà l insieme dei numeri reali mentre
DettagliLaboratorio di Statistica Aziendale Modello di regressione lineare multipla
Laboratorio di Statistica Aziendale Modello di regressione lineare multipla Michela Pasetto michela.pasetto2@unibo.it Definizione del modello OLS (semplice) L obiettivo della regressione lineare è di valutare
DettagliAnalisi sensitività. Strumenti per il supporto alle decisioni nel processo di Valutazione d azienda
Analisi sensitività. Strumenti per il supporto alle decisioni nel processo di Valutazione d azienda Premessa Con l analisi di sensitività il perito valutatore elabora un range di valori invece di un dato
DettagliTema A. 1.2. Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che
Statistica Cognome: Laurea Triennale in Biologia Nome: 26 luglio 2012 Matricola: Tema A 1. Parte A 1.1. Sia x 1, x 2,..., x n un campione di n dati con media campionaria x e varianza campionaria s 2 x
Dettagli1) A partire dalla seguente tabella a doppia entrata per le variabili QUALIFICA FUNZIONALE e STIPENDIO PERCEPITO (3 classi): STIPENDIO PERCEPITO
ESERCIZIO La tabella littlecompany,disponibile sul sito (in formato pdf e xls) riporta i dati relativi a 40 dipendenti dell'azienda Little Company S.r.l. su cui sono state rilevate le seguenti variabili:
DettagliElaborazione dei dati su PC Regressione Multipla
21 Elaborazione dei dati su PC Regressione Multipla Analizza Regressione Statistiche Grafici Metodo di selezione Analisi dei dati 21.1 Introduzione 21.2 Regressione lineare multipla con SPSS 21.3 Regressione
DettagliFACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE SIMULAZIONE della PROVA SCRITTA di STATISTICA 23/03/2011
FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE SIMULAZIONE della PROVA SCRITTA di STATISTICA 23/3/2 ESERCIZIO (2+2+2+2) La seguente tabella riporta la distribuzione della variabile "Stato Civile"
DettagliChe cosa e come valutano le prove di matematica e con quali risultati. nell A.S. 2008 2009
Che cosa e come valutano le prove di matematica e con quali risultati nell A.S. 2008 2009 Presentazione a cura di Roberta Michelini Casalpusterlengo, 8 gennaio 2010 http://www.invalsi.it/esamidistato0809/
DettagliVARIANZA CAMPIONARIA E DEVIAZIONE STANDARD. Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza.
VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD Si definisce varianza campionaria l indice s 2 = 1 (x i x) 2 = 1 ( xi 2 n x 2) Si definisce scarto quadratico medio o deviazione standard la radice quadrata della
DettagliDimensione di uno Spazio vettoriale
Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione
DettagliMetodi statistici per la ricerca sociale ANOVA e ANCOVA in
Metodi statistici per la ricerca sociale ANOVA e ANCOVA in Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze mattei@disia.unifi.it LM 88
Dettagli3. Confronto tra medie di due campioni indipendenti o appaiati
BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO
DettagliLineamenti di econometria 2
Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) Regressione con Variabili Dummy Regressione con Variabili Dummy La
DettagliGeneral Linear Model. Esercizio
Esercizio General Linear Model Una delle molteplici applicazioni del General Linear Model è la Trend Surface Analysis. Questa tecnica cerca di individuare, in un modello di superficie, quale tendenza segue
DettagliOpportunità e rischi derivanti dall'impiego massivo dell'informatica in statistica. Francesco Maria Sanna Roma, 3 maggio 2012
Opportunità e rischi derivanti dall'impiego massivo dell'informatica in statistica Francesco Maria Sanna Roma, 3 maggio 2012 Procedere alla misura, al rilevamento e al trattamento dei dati è sempre stato
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito Soluzioni della simulazione del 17/05/2011 Gianmarco Altoè Dipartimento di Psicologia Università di Cagliari, Anno Accademico 2010-2011 Leggere BENE le avvertenze prima
DettagliVALIDAZIONE SECONDO LE NORME ISO ED UNI-ENV-ISO DEL METODO COLORIMETRICO QUANTITATIVO MBS CONTA DI COLIFORMI IN ACQUE SUPERFICIALI
VALIDAZIONE SECONDO LE NORME ISO ED UNI-ENV-ISO DEL METODO COLORIMETRICO QUANTITATIVO MBS CONTA DI COLIFORMI IN ACQUE SUPERFICIALI Le metodiche sperimentali e le analisi statistiche che vengono applicate
Dettagli0.1 Percorrenza e Cilindrata
0.1 Percorrenza e Cilindrata Iniziamo ora un analisi leggermente più complessa basata sempre sui concetti appena introdotti. Innanzi tutto possiamo osservare, dal grafico ottenuto con il comando pairs,
DettagliLineamenti di econometria 2
Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) La Regressione Multipla La Regressione Multipla La regressione multipla
DettagliStatistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice
Esercitazione 15 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 18 L importanza del gruppo di controllo In tutti i casi in cui si voglia studiare l effetto di un certo
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 9 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 TEST D IPOTESI Partiamo da un esempio presente sul libro di testo.
DettagliCapitolo 13: L offerta dell impresa e il surplus del produttore
Capitolo 13: L offerta dell impresa e il surplus del produttore 13.1: Introduzione L analisi dei due capitoli precedenti ha fornito tutti i concetti necessari per affrontare l argomento di questo capitolo:
DettagliBasi di matematica per il corso di micro
Basi di matematica per il corso di micro Microeconomia (anno accademico 2006-2007) Lezione del 21 Marzo 2007 Marianna Belloc 1 Le funzioni 1.1 Definizione Una funzione è una regola che descrive una relazione
DettagliCome costruire una distribuzione di frequenze per caratteri quantitativi continui
Come costruire una distribuzione di frequenze per caratteri quantitativi continui Consideriamo i dati contenuti nel primo foglio di lavoro (quello denominato dati) del file esempio2.xls. I dati si riferiscono
Dettagli6. Modelli statistici: analisi della regressione lineare
BIOSTATISTICA 6. Modelli statistici: analisi della regressione lineare Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO
DettagliCriteri di Valutazione della scheda - Solo a carattere indicativo -
Criteri di Valutazione della scheda - Solo a carattere indicativo - Previsioni Sono state fatte le previsioni e discussi i valori attesi con il ragionamento con cui sono stati calcolati E stata usata la
DettagliPotenzialità statistiche Excel
Potenzialità statistiche Excel INTRODUZIONE A MS EXCEL Prof. Raffaella Folgieri Email folgieri@mtcube.com Fogli di calcolo MS Excel Prof. Folgieri 1 I Fogli Elettronici (Microsoft Excel) Sono strumenti
DettagliIndici di dispersione
Indici di dispersione 1 Supponiamo di disporre di un insieme di misure e di cercare un solo valore che, meglio di ciascun altro, sia in grado di catturare le caratteristiche della distribuzione nel suo
Dettagli4. Confronto tra medie di tre o più campioni indipendenti
BIOSTATISTICA 4. Confronto tra medie di tre o più campioni indipendenti Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO
Dettaglietà sesso luogo-abitazione scuola superiore esperienza insegnamento 1 2 2 2 1 2 2 2 2 2 1 2 3 2 2 2 1 2 4 2 2 2 1 2 5 3 2 2 1 2 6 2 2 2 1 2 7 3 2 1 1
età sesso luogo-abitazione scuola superiore esperienza insegnamento 1 1 1 3 1 4 1 5 3 1 6 1 7 3 1 1 8 3 1 9 3 1 10 3 1 11 3 1 1 1 13 4 1 1 14 3 1 15 1 16 1 17 1 18 1 19 1 0 1 1 1 1 3 3 1 4 1 Come analizzare
Dettagli1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.
Esercizio 1 Sia X 1,..., X un campione casuale estratto da una variabile aleatoria normale con media pari a µ e varianza pari a 1. Supponiamo che la media campionaria sia x = 2. 1a) Calcolare gli estremi
DettagliMetodi Matematici e Informatici per la Biologia----31 Maggio 2010
Metodi Matematici e Informatici per la Biologia----31 Maggio 2010 COMPITO 4 (3 CREDITI) Nome: Cognome: Matricola: ISTRUZIONI Gli esercizi che seguono sono di tre tipi: Domande Vero/Falso: cerchiate V o
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliAnalisi delle relazioni tra due caratteri
Analisi delle relazioni tra due caratteri Le misure di connessione misurano il grado di associazione tra due caratteri qualsiasi sotto il profilo statistico (e non causale in quanto non è compito della
DettagliCorso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza
Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 17/06/2015 NOME: COGNOME: MATRICOLA: Esercizio 1 Un sistema
DettagliStrumenti per la costruzione di modelli economici in Excel. Parte 4. Altre Funzioni
Strumenti per la costruzione di modelli economici in Excel Parte 4. Altre Funzioni Agenda 1. Obiettivi del documento 2. Funzioni basilari 3. Strumenti per analisi di sensitività 4. Strumenti di ottimizzazione
DettagliLA STATISTICA NEI TEST INVALSI
LA STATISTICA NEI TEST INVALSI 1 Prova Nazionale 2011 Osserva il grafico seguente che rappresenta la distribuzione percentuale di famiglie per numero di componenti, in base al censimento 2001. Qual è la
Dettagli