Laboratorio di Probabilità e Statistica

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Laboratorio di Probabilità e Statistica"

Transcript

1 Laboratorio di Probabilità e Statistica lezione 9 Massimo Guerriero Ettore Benedetti

2 Indice Lezione Prerequisiti dalla lezione scorsa Analisi di regressione: Cambiamenti di scala Schema generale sull analisi di regressione Analisi di regressione in ambito inferenziale Bande di confidenza Estensioni del modello di regressione

3 Prerequisiti dalla lezione scorsa Disegnare grafici di dispersione Costruzione del modello (es retta di regressione) Valutazione del modello Considerazioni, deduzioni sul modello (es trattamento outlier, significatività)

4 Cambiamenti di scala 1/3 Spesso ci si accorge dal grafico di dispersione dei dati che questi non si distribuiscono lungo una retta del tipo Y=a+bX Es > x<-c(75,76,77,78,79,80,81) > y<-c(21,155,117,107,92,89,8) > cor(x,y) [1] > plot(x,y) > model<-lm(y~x) > abline(model, col="blue",lw=2) > yy<-predict(model,dataframe(x)) > e<-y-yy > plot(e) > abline(h=0, col="blue", lwd=2)

5 Cambiamenti di scala 2/3 L andamento dei punti nel grafico sembra di tipo esponenziale negativo quindi, se vogliamo ricondurci ad una forma funzionale lineare, possiamo passare ai logaritmi naturali Y = e -X log(y) = log(e -X ) = -X Vogliamo quindi pensare ad un modello di regressione lineare del tipo: log(y) = a+bx (trascuriamo il segno meno, verrà incluso nei coefficienti a e b)

6 Cambiamenti di scala 3/3 Abbiamo quindi semplicemente effettuato un cambiamento di scala sulla variabile Y Es > cor(x,log(y)) [1] > plot(x,log(y)) > model2<-lm(log(y)~x) > abline(model2, col="blue",lw=2) < yy<-predict(model2,dataframe(x)) < e<-log(y)-yy < plot(e) < abline(h=0,col="blue",lwd=2)

7 Schema generale sull analisi di regressione 1 Decidere chi è la variabile dipendente (Y) e chi quella indipendente (X) 2 Rappresentare i dati su un grafico di dispersione: plot(x,y) 3 Se i dati non appaiono allineati, provare ad effettuare cambiamenti di scala 4 Calcolare l indice di correlazione: cor(x,y) se risulta troppo vicino a 0, non eseguire l analisi 5 Calcolare i coefficienti a e b della retta di regressione: lm(y~x) e rappresentarla sul grafico: abline(lm(y~x)) 6 Tracciare il grafico dei residui e calcolare R 2, se compaiono evidenti irregolarità, o l indice è troppo basso, il modello è sospetto (ripartire dal 3) 7 Utilizzare il modello per le previsioni con cautela (range conosciuto fissato xmin, xmax)

8 Consegna 1 Calcolare e confrontare R 2 per i due modelli che abbiamo visto nelle slide precedenti 2 Si sono raccolti i risultati di 7 prove di frenata a velocità diverse Studiare la relazione tra le due variabili spazio di frenata Y e velocità X, proponendo un modello interpretativo per spiegarle < x <- c(33, 49, 65, 33, 79, 49, 93) < y <- c(53, 145, 2121, 65, 3845, 1123, 5042) Suggerimento Provare con Y = a + b X

9 Indice Lezione Prerequisiti dalla lezione scorsa Analisi di regressione: Cambiamenti di scala Schema generale sull analisi di regressione Analisi di regressione in ambito inferenziale Bande di confidenza Estensioni del modello di regressione

10 Analisi di regressione in ambito inferenziale 1/2 L analisi di regressione può essere effettuata anche su osservazioni campionarie modellando gli errori con un opportuna legge di probabilità Il modello di regressione lineare diventa del tipo: Y i = a + bx i + ε i Dove le Y i sono variabili casuali per effetto delle ε i Ipotesi minimali fatte sugli errori del modello sono: E(ε i ) = 0 (errori centrati) Cov(ε i, ε j ) = 0 se i j (incorrelazione) Var(ε i ) = σ 2 costante (omoschedasticità)

11 Analisi di regressione in ambito inferenziale 2/2 I coefficienti a e b si calcolano sempre allo stesso modo, si può però migliorare la parte inferenziale del problema aggiungendo ulteriori ipotesi sugli errori ε i In particolare si può assumere che gli errori siano distribuiti come delle variabili casuali di tipo normale ovvero: ε i ~ N(0, σ 2 ) Questo implica due risultati importanti relativi alle distribuzioni degli stimatori a e b: a ~ N(a, σ a2 ) b ~ N(b, σ b2 ) Con σ a 2 = Var( a) = σ 2 1 n + n i=1 x2 n x i x n 2 e σ b 2 = Var( b) = n i=1 σ 2 x i x 2 n

12 Bande di confidenza 1/2 Sempre in ambito inferenziale, è possibile studiare intervalli di confidenza per la retta di regressione: le cosiddette bande di confidenza Esistono due tipi di bande di confidenza: 1 Bande di confidenza: forniscono un indicazione sulla qualità della retta di regressione stessa 2 Bande di previsione: Sono molto più larghe delle bande di confidenza, esprimono l attendibilità previsiva della retta di regressione

13 Bande di confidenza 2/2 Esempio in R: > data(cars) > attach(cars) > model<-lm(dist~speed) > plot(speed,dist) > abline(model, col="blue",lw=2) «confidence» > pc<-predict(model,interval="c") > matlines(speed,pc[,2:3],lty=1:1,col=6:6, lwd=2:2) «prediction» > pp<-predict(model,interval="p") > matlines(speed,pp[,2:3],lty=1:1,col=3:3, lwd=2:2) > detach()

14 Estensioni del modello di regressione 1/5 Molto spesso è riduttivo pensare che solo le variabili X e Y entrino in gioco in un modello di tipo lineare: L andamento di Y è intuitivamente spiegato da più variabili Stiamo parlando di un modello del tipo: Y= f(x 1, X 2,, X k ) Che assume il seguente aspetto: Y = β 0 + β 1 X 1 + β 2 X β k X k dove β =(β 0, β 1,, β k ) è il vettore dei coefficienti del modello Come nel caso unidimensionale, si suppone che vi sia un errore gaussiano: yi = β 0 + β 1 x i1 + β 2 x i2 + + β k x ik + ε i

15 Estensioni del modello di regressione 2/5 Tale modello (con ε i ), può essere scritto in forma matriciale: Dove: y = Xβ y = (y1, y2,, yn) e X = x 11 x 21 x n1 x 12 x 22 x n2 x 1k x 2k x nk

16 Estensioni del modello di regressione 3/5 In R: Vediamo un applicazione di modello con 2 regressori: > x1<-dataset$hlib_lv > x2<-dataset$hlib_we > y<-dataset$h_pc > lm(y~x1+x2) Call: lm(formula = y ~ x1 + x2) Coefficients: (Intercept) x1 x Spesso i dati si presentano come dataframe, quindi si può usare la forma contratta: > lm(h_pc ~ hlib_lv + hlib_we, data=dataset) Call: lm(formula = h_pc ~ hlib_lv + hlib_we, data = dataset) Coefficients: (Intercept) hlib_lv hlib_we

17 Estensioni del modello di regressione 4/5 In R: Infine, se si vuole un modello passante per l origine, si deve includere «-1» tra i regressori, ovvero: > lm(h_pc ~ hlib_lv + hlib_we -1, data=dataset) Call: lm(formula = h_pc ~ hlib_lv + hlib_we - 1, data = dataset) Coefficients: hlib_lv hlib_we

18 Estensioni del modello di regressione 5/5 - Rappresentazione Grafica - > x1<-dataset$hlib_lv > x2<-dataset$hlib_we > y<-dataset$h_pc > model<-lm(y~x1+x2) > installpackages("scatterplot3d") > library("scatterplot3d") > scatter<-scatterplot3d(x1, x2, y,highlight3d=t) > scatter$plane3d(model)

19 Consegna 1 Riprendendo il secondo esercizio dell ultima consegna della lezione scorsa (numero 8), calcolare le bande di confidenza e quelle di previsione 2 Provare ad installare il pacchetto scatterplot3d dalla sezione packages -> Install Packages, finita l installazione selezionarlo 3 Generare un modello che metta in relazione lineare la spesa per internet al mese spesa_mese con le ore passate al pc e sul table (h_pc, h_tablet) 4 Verificare se la relazione lineare potrebbe effettivamente esistere generando lo scatteplot3d

Laboratorio di Probabilità e Statistica

Laboratorio di Probabilità e Statistica Laboratorio di Probabilità e Statistica lezione 8 Massimo Guerriero Ettore Benedetti Consegna 1. Implementare delle funzioni che, accettando opportuni parametri in ingresso, risolvano le formule viste

Dettagli

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1 Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

Regressione. Monica Marabelli. 15 Gennaio 2016

Regressione. Monica Marabelli. 15 Gennaio 2016 Regressione Monica Marabelli 15 Gennaio 2016 La regressione L analisi di regressione é una tecnica statistica che serve a studiare la relazione tra variabili. In particolare, nel modello di regressione

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università

Dettagli

Covarianza, correlazione e retta di regressione. Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2

Covarianza, correlazione e retta di regressione. Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2 Covarianza, correlazione e retta di regressione Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2 Questa presentazione è stata preparata attingendo dai seguenti testi S. M. Iacus, Statistica,

Dettagli

STATISTICA. Esercitazione 5

STATISTICA. Esercitazione 5 STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei

Dettagli

Laboratorio di Statistica Aziendale Modello di regressione lineare multipla

Laboratorio di Statistica Aziendale Modello di regressione lineare multipla Laboratorio di Statistica Aziendale Modello di regressione lineare multipla Michela Pasetto michela.pasetto2@unibo.it Definizione del modello OLS (semplice) L obiettivo della regressione lineare è di valutare

Dettagli

Esercizi vari sulle schede di statistica

Esercizi vari sulle schede di statistica Esercizi vari sulle schede di statistica December 4, 2008 1 Introduzione Nelle prove scritte ci sarà un esercizio relativo alla parte di statistica e la sua implementazione con R. Tale parte dello scritto

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione Rapporti statistici di composizione la parte rispetto al tutto percentuali di derivazione per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione di frequenza (tassi) rapporti

Dettagli

Regressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Regressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007 Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il costo mensile Y di produzione e il corrispondente volume produttivo X per uno dei propri stabilimenti. Volume

Dettagli

Test delle Ipotesi Parte I

Test delle Ipotesi Parte I Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test

Dettagli

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice STATISTICA Regressione-3 L inferenza per il modello lineare semplice Regressione lineare: GRAFICO DI DISPERSIONE & & analisi residui A. Valutazione preliminare se una retta possa essere una buona approssimazione

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative.

La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative. Lezione 14 (a cura di Ludovica Peccia) MULTICOLLINEARITA La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative. In un modello di regressione Y= X 1, X 2, X 3

Dettagli

Laboratorio di Probabilità e Statistica

Laboratorio di Probabilità e Statistica Laboratorio di Probabilità e Statistica lezione 6 Massimo Guerriero Ettore Benedetti Indice Lezione Prerequisiti dalla lezione scorsa Intervallo di confidenza per la media Verifica d ipotesi sulla media

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 6 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI REGRESSIONE LINEARE: SPORT - COLESTEROLO ESERCIZIO 8: La tabella seguente

Dettagli

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione. Coppie o vettori di dati Spesso i dati osservati sono di tipo vettoriale. Ad esempio studiamo 222 osservazioni relative alle eruzioni del geyser Old Faithful. Old Faithful, Yellowstone Park. Old Faithful

Dettagli

1. variabili dicotomiche: 2 sole categorie A e B

1. variabili dicotomiche: 2 sole categorie A e B Variabile X su scala qualitativa (due categorie) modello di regressione: variabili quantitative misurate almeno su scala intervallo (meglio se Y è di questo tipo e preferibilmente anche le X i ) variabili

Dettagli

Laboratorio di Probabilità e Statistica

Laboratorio di Probabilità e Statistica Laboratorio di Probabilità e Statistica lezione 2 Massimo Guerriero Ettore Benedetti Informazioni utili per il laboratorio Ogni studente ha a disposizione 120MB di spazio disco in rete. Superata la quota

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria

Dettagli

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0. Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive

Dettagli

lezione 7 AA Paolo Brunori

lezione 7 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove siamo arrivati? - se siamo interessati a studiare l andamento congiunto di due fenomeni economici - possiamo provare a misurare i due fenomeni e poi usare la lineare semplice

Dettagli

COGNOME.NOME...MATR..

COGNOME.NOME...MATR.. STATISTICA 29.01.15 - PROVA GENERALE (CHALLENGE) Modalità A (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

Errori sistematici e casuali

Errori sistematici e casuali Errori sistematici e casuali Errori Casuali Tempo di reazione nel far partire o fermare l orologio: Può essere sia in eccesso che in difetto (ad esempio partenza e arrivo), quindi l errore può avere segno

Dettagli

STATISTICA A D (72 ore)

STATISTICA A D (72 ore) STATISTICA A D (72 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

Regressione lineare. Lucio Demeio Dipartimento di Ingegneria Industriale e Scienze Matematiche Università Politecnica delle Marche.

Regressione lineare. Lucio Demeio Dipartimento di Ingegneria Industriale e Scienze Matematiche Università Politecnica delle Marche. Regressione lineare Lucio Demeio Dipartimento di Ingegneria Industriale e Scienze Matematiche Università Politecnica delle Marche Siano x ed y due variabili legate tra loro da una forma funzionale del

Dettagli

0 altimenti 1 soggetto trova lavoroentro 6 mesi}

0 altimenti 1 soggetto trova lavoroentro 6 mesi} Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta

Dettagli

Laboratorio 8. Regressione multipla. 8.1 Analisi del dataset HOOK.DAT

Laboratorio 8. Regressione multipla. 8.1 Analisi del dataset HOOK.DAT Laboratorio 8 Regressione multipla 8.1 Analisi del dataset HOOK.DAT I dati contenuti nel file hook.dat, raccolti da Joseph Hooker sulle montagne dell Himalaya, riportano le temperature di ebollizione dell

Dettagli

Relazioni tra variabili (fenomeni) aziendali

Relazioni tra variabili (fenomeni) aziendali Relazioni tra variabili (fenomeni) aziendali - giornate di assenza dal lavoro è collegato a qualifica professionale, anzianità, sesso, dei dipendenti? - incidenti sul lavoro sono collegati a orario di

Dettagli

ECONOMETRIA: Laboratorio I

ECONOMETRIA: Laboratorio I ECONOMETRIA: Laboratorio I Luca De Angelis CLASS - Università di Bologna Programma Laboratorio I Valori attesi e varianze Test di ipotesi Stima di un modello lineare attraverso OLS Valore atteso Data una

Dettagli

Laboratorio di Probabilità e Statistica

Laboratorio di Probabilità e Statistica Laboratorio di Probabilità e Statistica lezione 5 Massimo Guerriero Ettore Benedetti Indice Lezione Prerequisiti dalla lezione scorsa Media e varianza campionaria Legge dei grandi numeri Teorema del limite

Dettagli

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6

Dettagli

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1 lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

Rappresentazioni grafiche di distribuzioni doppie

Rappresentazioni grafiche di distribuzioni doppie Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi

Dettagli

Regressione & Correlazione

Regressione & Correlazione Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione

Dettagli

lezione 4 AA Paolo Brunori

lezione 4 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente

Dettagli

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Metodi per l Analisi dei Dati Sperimentali AA009/010 IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Sommario Massima Verosimiglianza Introduzione La Massima Verosimiglianza Esempio 1: una sola misura sperimentale

Dettagli

Limiti di funzioni 1 / 41

Limiti di funzioni 1 / 41 Limiti di funzioni 1 / 41 Comportamento agli estremi: operazione di ite 2 / 41 Sia f (x) una funzione definita su R e supponiamo di voler studiare l andamento della funzione agli estremi del dominio: x

Dettagli

Fasi del modello di regressione

Fasi del modello di regressione Fasi del modello di regressione Specificazione del modello: scelta del tipo di funzione da utilizzare per descrivere un fenomeno; definizione delle ipotesi di base Stima dei parametri: uso di stimatori

Dettagli

Statistica descrittiva: analisi di regressione

Statistica descrittiva: analisi di regressione Statistica descrittiva: analisi di regressione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.

Dettagli

ESAME. 9 Gennaio 2017 COMPITO B

ESAME. 9 Gennaio 2017 COMPITO B ESAME 9 Gennaio 2017 COMPITO B Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto

Dettagli

Statistica Inferenziale

Statistica Inferenziale Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

Corso di Laurea: Numero di Matricola: Esame del 31 maggio 2018 Tempo consentito: 120 minuti

Corso di Laurea: Numero di Matricola: Esame del 31 maggio 2018 Tempo consentito: 120 minuti Corso di Laurea: Numero di Matricola: Esame del 31 maggio 2018 Tempo consentito: 120 minuti Professor Paolo Vitale Anno Accademico 2017-8 UdA, Scuola d Economia Domanda 1 [6 punti]. (a) La multi-collineartità

Dettagli

Analisi bivariata. Il caso di caratteri quantitativi

Analisi bivariata. Il caso di caratteri quantitativi Analisi bivariata Il caso di caratteri quantitativi Pagina 382 Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma

Dettagli

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

INTRODUZIONE AL DOE come strumento di sviluppo prodotto Francesca Campana Parte 2 Concetti di base

INTRODUZIONE AL DOE come strumento di sviluppo prodotto Francesca Campana Parte 2 Concetti di base INTRODUZIONE AL DOE come strumento di sviluppo prodotto Francesca Campana Parte Concetti di base Pagina CONCETTI STATISTICI DI PARTENZA - DESCRITTORI DI UNA VARIABILE RANDOM - GRAFICI UTILI - DISTRIBUZIONI

Dettagli

La regressione lineare semplice

La regressione lineare semplice La regressione lineare semplice Il modello di regressione lineare semplice - 1 y = β 0 + βx + ε 10 8 Una retta nel piano Variabile Y 6 4 2 0 0 1 2 3 4 Variabile X 1 Il modello di regressione lineare semplice

Dettagli

Correlazione e regressione

Correlazione e regressione Correlazione e regressione Correlazione 1 Come posso determinare il legame tra due o più variabili? Correlazione COEFFICIENTE DI CORRELAZIONE (r di Pearson) massimo consumo di ossigeno e prestazione nelle

Dettagli

Cognome e Nome:... Matricola e corso di laurea:...

Cognome e Nome:... Matricola e corso di laurea:... Statistica - corso base Prof. B. Liseo Prova di esame dell 8 gennaio 2014 Cognome e Nome:................................................................... Matricola e corso di laurea:...................................................

Dettagli

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: esercitazione 7 p. 1/13 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: 20-05-2004 Luca Monno Università degli studi di Pavia luca.monno@unipv.it http://www.lucamonno.it

Dettagli

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa

Dettagli

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi

Dettagli

Statistica di base per l analisi socio-economica

Statistica di base per l analisi socio-economica Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme

Dettagli

1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE)

1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE) 1. ISTOGRAMMI E GRAFICI DI ALCUNE DENSITA (COMPLEMENTO ALLA LEZIONE PRECEDENTE) Riprendiamo l esempio X = seq(-5,5,0.01) Y= dnorm(x) plot(x,y) Si poteva automatizzare la scelta delle X ponendo: X=rnorm(1000)

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1

Dettagli

Verifica di ipotesi e intervalli di confidenza nella regressione multipla

Verifica di ipotesi e intervalli di confidenza nella regressione multipla Verifica di ipotesi e intervalli di confidenza nella regressione multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2013 Rossi MRLM Econometria - 2013 1 / 54 Sommario Verifica di ipotesi e intervalli

Dettagli

PROGRAMMA DI STATISTICA BITETTO-BOGLI aa. 2018/2019 CON DETTAGLIO ARGOMENTI DA STUDIARE E LEGGERE * SUI LIBRI ADOTTATI

PROGRAMMA DI STATISTICA BITETTO-BOGLI aa. 2018/2019 CON DETTAGLIO ARGOMENTI DA STUDIARE E LEGGERE * SUI LIBRI ADOTTATI 1 PROGRAMMA DI STATISTICA BITETTO-BOGLI aa. 2018/2019 CON DETTAGLIO ARGOMENTI DA STUDIARE E LEGGERE * SUI LIBRI ADOTTATI In merito al programma del corso B di statistica già pubblicato con i relativi riferimenti

Dettagli

II ESERCITAZIONE ESERCIZIO

II ESERCITAZIONE ESERCIZIO II ESERCITAZIONE ESERCIZIO 1 Quale percentuale di osservazioni sotto la curva normale standardizzata cade nell'intervallo compreso tra i valori z=-1 e z=+1? a) 66% circa b) 70,2% circa c) 68,2% circa d)

Dettagli

Argomenti della lezione:

Argomenti della lezione: Lezione 7 Argomenti della lezione: La regressione semplice Il modello teorico Il calcolo dei parametri Regressione lineare Esamina la relazione lineare tra una o più variabili esplicative (o indipendenti,

Dettagli

Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1 Lezione 1 - Martedì 23 Settembre 2014 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

CAPITOLO 11 ANALISI DI REGRESSIONE

CAPITOLO 11 ANALISI DI REGRESSIONE VERO FALSO CAPITOLO 11 ANALISI DI REGRESSIONE 1. V F Se c è una relazione deterministica tra due variabili,x e y, ogni valore dato di x,determinerà un unico valore di y. 2. V F Quando si cerca di scoprire

Dettagli

Tipi di variabili. Indici di tendenza centrale e di dispersione

Tipi di variabili. Indici di tendenza centrale e di dispersione Tipi di variabili. Indici di tendenza centrale e di dispersione L. Boni Variabile casuale In teoria della probabilità, una variabile casuale (o variabile aleatoria o variabile stocastica o random variable)

Dettagli

Facoltà di Psicologia Università di Padova Anno Accademico Corso di Psicometria - Modulo B

Facoltà di Psicologia Università di Padova Anno Accademico Corso di Psicometria - Modulo B Facoltà di Psicologia Università di Padova Anno Accademico 2010-2011 Corso di Psicometria - Modulo B Dott. Marco Vicentini marco.vicentini@unipd.it Rev. 27/12/2010 Regressione lineare Modello geometrico

Dettagli

Teoria e tecniche dei test. Concetti di base

Teoria e tecniche dei test. Concetti di base Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi

Dettagli

tabelle grafici misure di

tabelle grafici misure di Statistica Descrittiva descrivere e riassumere un insieme di dati in maniera ordinata tabelle grafici misure di posizione dispersione associazione Misure di posizione Forniscono indicazioni sull ordine

Dettagli

MODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza,

MODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza, MODELLO DI REGRESSIONE LINEARE le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza, teorema di Gauss-Markov, verifica di ipotesi e test di

Dettagli

LEZIONE N.8 (a cura di Teresa Fanelli) Questa forma risulta importante nel modello di regressione con più variabili.

LEZIONE N.8 (a cura di Teresa Fanelli) Questa forma risulta importante nel modello di regressione con più variabili. LEZIONE N.8 (a cura di Teresa Fanelli) Forma matriciale del Modello di Regressione Semplice L assunzione di base del modello è: Y i =β 0 +x i β 1 +ε i i=1,2,..n. Lo stesso modello può essere scritto attraverso

Dettagli

Soluzioni della prova scritta del 6 Marzo 2013 (a.a. 2012/2013)

Soluzioni della prova scritta del 6 Marzo 2013 (a.a. 2012/2013) Soluzioni della prova scritta del 6 Marzo 2013 (a.a. 2012/2013) 1. Per monitorare se la produzione è in controllo statistico costruiamo una carta p. Se x è il vettore dei dati assegnati, le percentuali

Dettagli

Esercizio 2: voto e ore dedicate allo studio

Esercizio 2: voto e ore dedicate allo studio La seguente tabella riporta il voto riportato da 10 studenti all esame di Statistica Sociale e il numero di ore di lezione non seguite dallo studente (il corso prevede 30 ore di lezione). Ci si chiede

Dettagli

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2

Dettagli

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Lezione 1 - Mercoledì 28 Settembre 2016 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

Metodo dei Minimi Quadrati. Dott. Claudio Verona

Metodo dei Minimi Quadrati. Dott. Claudio Verona Metodo dei Minimi Quadrati Dott. Claudio Verona E in generale interessante studiare l andamento di una variabile in funzione di un altra e capire se c è una funzione matematica che le lega. Viceversa è

Dettagli

Prova di recupero di Probabilità e Statistica - A * 21/04/2006

Prova di recupero di Probabilità e Statistica - A * 21/04/2006 Prova di recupero di Probabilità e Statistica - A * /04/006 (NB: saranno prese in considerazione solo le risposte adeguatamente motivate) tempo di lavoro: Due ore. Per conseguire la patente di guida, un

Dettagli

Correlazione e regressione

Correlazione e regressione Correlazione e regressione Il termine associazione è largamente usato nella letteratura scientifica ed esprime la relazione che esiste tra due variabili Per studiare l associazione tra due variabili bisogna

Dettagli

Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione

Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze

Dettagli

Regressione lineare semplice. Strumenti quantitativi per la gestione

Regressione lineare semplice. Strumenti quantitativi per la gestione Regressione lineare semplice Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3a_rls.html#(1) 1/33 Regressione lineare (RL) La RL è uno degli

Dettagli

Corso di Statistica Industriale

Corso di Statistica Industriale Corso di Statistica Industriale Corsi di Laurea Specialistica in Ingegneria Gestionale e Ingegneria Meccanica Docente: Ilia Negri Orario del corso: Martedì: dalle 14.00 alle 16.00 Venerdì: dalle 10.30

Dettagli

1.1 Obiettivi della statistica Struttura del testo 2

1.1 Obiettivi della statistica Struttura del testo 2 Prefazione XV 1 Introduzione 1.1 Obiettivi della statistica 1 1.2 Struttura del testo 2 2 Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati 5 2.2 Distribuzioni di frequenza

Dettagli

Laboratorio di Statistica Aziendale Modello di regressione lineare semplice

Laboratorio di Statistica Aziendale Modello di regressione lineare semplice Laboratorio di Statistica Aziendale Modello di regressione lineare semplice Dott.ssa Michela Pasetto michela.pasetto2@unibo.it Caricamento del dataset Il dataset SalesData si trova nella cartella condivisa

Dettagli

Esercitazioni di Statistica Matematica A Lezione 7. Variabili aleatorie continue

Esercitazioni di Statistica Matematica A Lezione 7. Variabili aleatorie continue Esercitazioni di Statistica Matematica A Lezione 7 Variabili aleatorie continue.) Determinare la costante k R tale per cui le seguenti funzioni siano funzioni di densità. Determinare poi la media e la

Dettagli

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica 13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi Corso di laurea in Informatica e Bioinformatica 4 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI 1 - STATISTICA DESCRITTIVA

Dettagli

Statistica Applicata all edilizia Lezione: approccio stocastico all analisi delle serie storiche

Statistica Applicata all edilizia Lezione: approccio stocastico all analisi delle serie storiche Lezione: approccio stocastico all analisi delle serie storiche E-mail: orietta.nicolis@unibg.it 3 maggio 2011 Programma 1 Approccio stocastico all analisi delle serie storiche Programma Approccio stocastico

Dettagli

PROBABILITA' E STATISTICA Prova del 16/09/2016 Traccia A

PROBABILITA' E STATISTICA Prova del 16/09/2016 Traccia A PROBABILITA' E STATISTICA Prova del 16/09/2016 Traccia A ESERCIZIO 1 Sulla distribuzione di frequenze presentata in tabella, calcolare: a) la media aritmetica, la media armonica e la media geometrica;

Dettagli

Test per la correlazione lineare

Test per la correlazione lineare 10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche

Dettagli

Parametri statistici

Parametri statistici SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Parametri statistici 24/1/2005 Deviazione standard della media La variabilità di una distribuzione può quindi essere espressa da un indice

Dettagli