Regressione lineare semplice

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Regressione lineare semplice"

Transcript

1 Regressione lineare semplice Strumenti quantitativi per la gestione Emanuele Taufer Regressione lineare (RL) La regressione lineare per i dati Advertising Analisi d interesse Regressione lineare semplice (un unico predittore X) Previsione Stima dei parametri con i minimi quadrati Advertising data Uso dei risultati Retta stimata e residui Valutare la precisione delle stime dei coefficienti Proprietà di β^0 e β^1 Intervalli di confidenza Verifica delle ipotesi Valutare la bontà del modello L errore standard residuo (RSE) La statistica di bontà di adattamento R 2 Grafici R 2 Esempio: Diamond Alcune statistiche e plot RLS con R e output Retta stimata e IC IC per la retta Come ottenere un intercetta più interpretabile Interpolazione Previsioni Riferimenti bibliografici Regressione lineare (RL) La RL è uno degli approcci più semplici nel cd supervised learning. La RL assume che la dipendenza di Y da X1, X2, X p sia lineare. Nella pratica le vere " funzioni di regressione f non sono mai lineari! L assunzione di linearità va sempre intesa come un approssimazione della verità. Anche se può sembrare troppo semplicistico, il modello di RL è estremamente utile sia concettualmente che praticamente. è di facile interpretazione è estremamente flessibile molti metodi moderni sono estensioni della RL: capirla a fondo ci permette di capire a fondo anche tecniche più sofisticate. file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3a_rls.html 1/14

2 La regressione lineare per i dati Advertising Si considerino i dati Advertising Analisi d interesse C è una relazione tra budget pubblicitario e vendite? Qual è l intensità della relazione tra budget pubblicitario vendite? Quali media contribuiscono alle vendite? Come si può prevedere con precisione le vendite future? La relazione è lineare? C è sinergia (o interazione) tra canali pubblicitari? Regressione lineare semplice (un unico predittore ) X Assumiamo un modello Y = β0 + β1x + ε, β0 e β1 sono due costanti sconosciute che rappresentano l intercetta e la pendenza della retta, noti anche come coefficienti o parametri. ε è il termine di errore (include tutto ciò di cui ci siamo dimenticati o non possiamo misurare) altri fattori (pubblicità su giornali e radio, ) variabilità intrinseca al fenomeno nonlinearità Ad esempio, X può rappresentare la pubblicità televisiva e Y può rappresentare le vendite. Allora possiamo regredire vendite su TV usando il modello file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3a_rls.html 2/14

3 Previsione I valori di β0 e β1 vengono stimati usando i training data Date delle stime β^0 e β^1 per i coefficenti del modello, possiamo prevedere le vendite future con dove indica una previsione di in base a. Il simbolo ^ denota un valore stimato. Stima dei parametri con i minimi quadrati Sia y^i β^0 β^1x i la previsione per Y in base all i esimo valore di X. e i y i y^i rappresenta il residuo i esimo. Si definisca la somma dei quadrati dei residui (RSS) come o equivalentemente L approccio dei minimi quadrati sceglie i valori β^0 e β^1 che minimizzano lo RSS. Le soluzioni sono Advertising data vendite β0 + β1 T V. y^ = β^0 + β^1 x, y^ Y X = x = + = Dati sulle spese in pubblicità (in migliaia di $) e vendite (in migliaia di unità di prodotto) in 200 mercati diversi. Alcuni dati: (n = 200) RSS = e e e 2 n, RSS = ( y1 β^0 β^1x1) ( y n β^0 β^1x n ) 2 β^1 ( )( ) = n i=1 x i x y i ȳ, n i=1( x i x ) 2 β^0 = ȳ β^1x X TV Radio Newspaper Sales file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3a_rls.html 3/14

4 dai dati otteniamo β^0 = 7.03, = β^1 Uso dei risultati La previsione con il modello di RL semplice è Per una spesa pubblicitaria in TV pari a 20000$ ci si aspettano vendite per un totale di ossia 7980 unità del prodotto y^ = x y^ = (20) = 7.98 Il coefficente β0 ci indica la quantità venduta attesa in assenza di pubblicità TV β^1 y^ x Il coefficiente ci indica l incremento in per un incremento di. In pratica, ogni 1000$ spesi in più in pubblicità TV, ci si aspetta un incremento di vendite di 47.5 unità del prodotto. Retta stimata e residui Valutare la precisione delle stime dei coefficienti Il modello file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3a_rls.html 4/14

5 idealmente rappresenta la popolazione che vorremmo analizzare, che include, ad esempio anche dati su vendite e pubblicità in altri mercati e dati su vendite e pubblicità future. Il modello stimato Y = β0 + β1x + ε, y^ = β^0 + β^1 x, è basato sui dati campionari che abbiamo a disposizione (i training data) In pratica β^0 e β^1 sono degli stimatori (ottenuti con il metodo dei minimi quadrati) di β0 e β1 e pertanto soggetti a variabilità campionaria Rosso: retta popolazione Blu: retta stimata Proprietà di β^0 e β^1 β^0 e β^1 sono stimatori corretti per β0 e β1. Ossia non vi sono errori sistematici di sotto stima o sovra stima. Lo standard error ci dà una misura della loro variabilità campionaria dove σ 2 = V ar(ε) σ SE( β^1 ) = 2, n i=1( x i x ) 2 β^0 σ [ + ] 2 1 x 2 SE( ) = file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3a_rls.html 5/14 n n i=1( x i x ) 2

6 Tipicamente σ 2 è sconosciuta e, nella RL semplice, viene stimata con RSS/(n 2) Lo SE calcolato utilizzando la stima di σ 2 è un SE stimato che per correttezza, dovrebbe essere indicato con E, di seguito e nel testo si usa sempre la simbologia SE per semplicità. Intervalli di confidenza Gli SE possono essere utilizzati per calcolare intervalli di confidenza. Nel caso di β1, fornisce un IC approssimativamente di livello. Per il data set Advertising l intervallo di confidenza al 95% per è. Verifica delle ipotesi S^ Gli errori standard possono anche essere utilizzati per eseguire test di ipotesi sui coefficienti. Il test più comune consiste nel verificare il set di ipotesi H0 : Non vi è alcuna relazione tra X e Y H A : Vi è relazione tra X e Y β^1 Matematicamente, ciò corrisponde a testare H0 H A : β1 = 0 : β1 0 = 0 ± 2SE( ), poiché se β1 allora il modello si riduce a Y = β0 + ε, e quindi X non è associato con Y. β^1 (1 α = 0.95) β1 [0.042; 0.053] Per verificare l ipotesi nulla, si calcola la statistica test t che ha distribuzione con gradi di libertà, sotto ipotesi che β1. L ouput di R, fornisce automaticamente probabilità di osservare un valore uguale o superiore, ossia il p value t Per il dataset Advertising: t = 0 β^1 SE( β^1 ) t n 2 = 0 ## Warning: package 'xtable' was built under R version EstimateStd. Errort valuepr(> t ) (Intercept) TV Nota: rifiuto H0 β1, esiste relazione tra X e Y : = 0 Valutare la bontà del modello file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3a_rls.html 6/14

7 Respinta l ipotesi nulla ( in favore dell alternativa H0 β1, è naturale voler quantificare la misura in cui il modello si adatta ai dati. La qualità di un modello di regressione lineare viene tipicamente valutata utilizzando due grandezze collegate: l errore standard residuo (RSE) R 2 L errore standard residuo (RSE) Si noti che nel modello errore ε. ad ogni osservazione è associato n termine di Anche se si conoscesse la vera retta di regressione ( β0 e β1 conosciuti), non saremmo in grado di prevedere perfettamente Y da X. L RSE è una stima della deviazione standard di ε, Nel caso dei dati Advertising,. In altre parole, le vendite effettive in ogni mercato si discostano in media dalla linea di regressione vera di circa unità (in migliaia). Che 3260 H0 : β1 = 0 : 0 y = β0 + β1x + ε V ar(ε) 1 RSE = 1 RSS = n ( y n 2 n 2 i y^i) 2 i=1 RSE = 3.26 unità sia o meno un errore di previsione accettabile dipende dal contesto in esame. Nel set di dati Advertising, il valore medio delle vendite su tutti i mercati è di circa e quindi l errore percentuale è 3260/14000 = 23% La statistica di bontà di adattamento unità, L RSE fornisce una misura assoluta di adattamento del modello ai dati. Ma poiché è misurata in unità di Y, non è sempre chiaro quale sia un buon RSE per i dati in esame R La statistica R 2 fornisce una misura di adattamento alternativa. Ha valore sempre compreso tra 0 e 1, ed è indipendente dalla scala di Y. dove R 2 T SS RSS = = 1 RSS T SS = n i=1( y i ȳ) 2 Y RSS T SS TSS misura la varianza totale nella variabile risposta, RSS misura la quantità di variabilità che rimane inspiegata dopo aver adattato la regressione. Quindi, TSS RSS misura la quantità di variabilità in Y che viene spiegata (o rimossa) eseguendo la regressione e R 2 misura la proporzione di variabilità in Y che può essere spiegata con X. Abbiamo dunque le seguenti regole interpretative R 2 : tutti i punti sono allineati lungo la retta = 1 file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3a_rls.html 7/14

8 R 2 : non vi è alcuna relazione lineare (punti sparsi in modo casuale) 0 < R 2 < 10 nei casi intermedi R 2 non dice nulla sull intensità della relazione (valore di β1 ). Nel set di dati Advertising R 2 = 0.61, e quindi poco meno di due terzi della variabilità delle vendite si spiega con la pubblicità TV. Grafici = 0 R 2 ## Warning: package 'ggplot2' was built under R version Esempio: Diamond Il dataset diamond dalla libreria UsingR contiene i prezzi di una serie di Singapore) ed il loro peso in carati. diamanti (in dollari di Per caricare i dati è necessario installare prima il pacchetto UsingR. Con i comandi names e head è possibile vedere, rispettivamente, i nomi delle variabili del dataset e le prime righe di dati 48 file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3a_rls.html 8/14

9 library(usingr) data(diamond) names(diamond) head(diamond) [1] "carat" "price" carat price Alcune statistiche e plot summary(diamond) carat price Min. :0.12 Min. : 223 1st Qu.:0.16 1st Qu.: 338 Median :0.18 Median : 428 Mean :0.20 Mean : 500 3rd Qu.:0.25 3rd Qu.: 657 Max. :0.35 Max. :1086 plot(diamond$price,diamond$carat, xlab = "Massa (carati)", ylab = "Prezzo (SIN $)", bg = "red", col = "black", cex = 1.5, pch = 21, frame = FALSE) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3a_rls.html 9/14

10 RLS con R e output reg< lm(price ~ carat, data = diamond) summary(reg) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3a_rls.html 10/14

11 Call: lm(formula = price ~ carat, data = diamond) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) <2e 16 *** carat <2e 16 *** Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 32 on 46 degrees of freedom Multiple R squared: 0.978, Adjusted R squared: F statistic: 2.07e+03 on 1 and 46 DF, p value: <2e 16 t p < 2e 16 = 2 (10) 16 Il test relativo a carat è significativo ( value hanno capacità predittiva sul prezzo ). Ossia i carati In media ci si aspetta un aumento di prezzo pari a dollari per ogni incremento di un carato del diamante RSE = n con gradi di libertà. I gradi di libertà corrispondono a parametri della retta, in questo caso 2 (intercetta e pendenza). Da questo ad esempio ricaviamo che ci sono dati nei training data 48 R 2 grafico. = ; l adattamento dei punti alla retta è molto buono, come si vede anche dal R 2 corretto e statistica F: si discuteranno nelle prossime lezioni Retta stimata e IC plot(diamond$carat, diamond$price, xlab = "Massa (carati)", ylab = "Prezzo (SIN $)", bg = "red", col = "black", cex = 1.1, pch = 21,frame = FALSE) abline(reg, lwd = 2) file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3a_rls.html 11/14

12 IC per la retta Per ottenere gli IC al 95% per i parametri della retta confint(reg) 2.5 % 97.5 % (Intercept) carat Come ottenere un intercetta più interpretabile L intercetta è il prezzo atteso (dal modello) di un diamante di carati! L intercetta negativa non ha interpretazione nel contesto in esame, poichè non esistono diamanti a carati 0 il valore ci permette comunque di fare una previsione corretta per diamanti in un range di carati simile a quello presente nei training data. file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3a_rls.html 12/14

13 se si desidera ottenere qualcosa interpretabile nel contesto in esame è possibile traslare l asse y in una zona dove ci sono dati. Questo si può fare semplicemente calcolando la regressione di y su x x reg2 < lm(price ~ I(carat mean(carat)), data = diamond) summary(reg2) ## ## Call: ## lm(formula = price ~ I(carat mean(carat)), data = diamond) ## ## Residuals: ## Min 1Q Median 3Q Max ## ## ## Coefficients: ## Estimate Std. Error t value Pr(> t ) ## (Intercept) <2e 16 *** ## I(carat mean(carat)) <2e 16 *** ## ## Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Residual standard error: 32 on 46 degrees of freedom ## Multiple R squared: 0.978, Adjusted R squared: ## F statistic: 2.07e+03 on 1 and 46 DF, p value: <2e Così dollari è il prezzo per un diamante (dei training data) di dimensione media ( carati). Interpolazione Per calcolare i valori interpolati dalla retta stimata per i training data, ci basta semplicemente (si ricordi che abbiamo chiamato reg l oggetto che contiene i risultati della procedura lm ) interp< predict(reg) attach(diamond) df< data.frame("prezzo"=price, "Carati"=carat,"Prezzo modello"=interp) head(df) Prezzo Carati Prezzo.modello Previsioni file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3a_rls.html 13/14

14 Per fare le previsioni sulla base di un predittore x0 non presente nei training data è necessario creare un data.frame che contiene i valori dei predittori Proviamo a prevedere il prezzo per dei diamanti di 1, 2 e 3 carati dfp< data.frame("carat"=c(1,2,3)) predict(reg,dfp) E possibile ottenere gli IC per il valor medio previsto con predict(reg,dfp,interval="confidence") fit lwr upr In questo caso gli intervalli ( lwr, upr ) di livello 0.95 forniscono un range di valori per il prezzo medio, dato il valore del predittore carat Se nell intervallo vogliamo considerare anche la variabilità data dal termine di errore ε (ossia la parte irriducibile) è necessario specificare l opzione prediction predict(reg,dfp,interval="prediction") fit lwr upr Si noti che gli intervalli così ottenuti sono più ampi rispetto ai precedenti Riferimenti bibliografici An Introduction to Statistical Learning, with applications in R. (Springer, 2013) Alcune delle figure in questa presentazione sono tratte dal testo con il permesso degli autori: G. James, D. Witten, T. Hastie e R. Tibshirani file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3a_rls.html 14/14

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

Modelli con predittori qualitativi e modelli con interazioni

Modelli con predittori qualitativi e modelli con interazioni Modelli con predittori qualitativi e modelli con interazioni Strumenti quantitativi per la gestione Emanuele Taufer Utilizzare variabili indipendenti qualitative (VIQ) Codifica binaria 0,1 Esempio: salari

Dettagli

Modelli con predittori qualitativi e modelli con interazioni. Strumenti quantitativi per la gestione

Modelli con predittori qualitativi e modelli con interazioni. Strumenti quantitativi per la gestione Modelli con predittori qualitativi e modelli con interazioni Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3d_viq.html#(1) 1/26 Utilizzare

Dettagli

Regressione lineare multipla Strumenti quantitativi per la gestione

Regressione lineare multipla Strumenti quantitativi per la gestione Regressione lineare multipla Strumenti quantitativi per la gestione Emanuele Taufer Regressione lineare multipla (RLM) Esempio: RLM con due predittori Stima dei coefficienti e previsione Advertising data

Dettagli

0.1 Percorrenza e Cilindrata

0.1 Percorrenza e Cilindrata 0.1 Percorrenza e Cilindrata Iniziamo ora un analisi leggermente più complessa basata sempre sui concetti appena introdotti. Innanzi tutto possiamo osservare, dal grafico ottenuto con il comando pairs,

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 6 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI REGRESSIONE LINEARE: SPORT - COLESTEROLO ESERCIZIO 8: La tabella seguente

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Dettagli

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE

Dettagli

Test F per la significatività del modello

Test F per la significatività del modello Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno

Dettagli

Multicollinearità. Strumenti quantitativi per la gestione

Multicollinearità. Strumenti quantitativi per la gestione Multicollinearità Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3c_mc.html#(1) 1/13 Quando non tutto va come dovrebbe Si parla di multi-collinearità

Dettagli

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1 lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,

Dettagli

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: esercitazione 7 p. 1/13 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: 20-05-2004 Luca Monno Università degli studi di Pavia luca.monno@unipv.it http://www.lucamonno.it

Dettagli

Validazione dei modelli Strumenti quantitativi per la gestione

Validazione dei modelli Strumenti quantitativi per la gestione Validazione dei modelli Strumenti quantitativi per la gestione Emanuele Taufer Validazione dei modelli Il data set Auto I dati Il problema analizzato Validation set approach Diagramma a dispersione Test

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017

Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017 Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017 Contents 1 Inferenza sulla regressione semplice 1 1.1 Test sulla pendenza della retta................................... 1 1.2 Test sull

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

Esercizio 1 GRAFICO 1. X e Y sono indipendenti. X e Y non sono correlate. La correlazione tra X e Y è <1. X e Y sono perfettamente correlate

Esercizio 1 GRAFICO 1. X e Y sono indipendenti. X e Y non sono correlate. La correlazione tra X e Y è <1. X e Y sono perfettamente correlate Esercizio 1 Osservare il grafico 1 riportato in figura che mette in relazione una variabile dipendente Y ed una variabile indipendente X e rispondere alle seguenti domande. 400 300 200 GRAFICO 1 100 0

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro

Dettagli

Analisi della regressione multipla

Analisi della regressione multipla Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,

Dettagli

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 Confronto fra gruppi: il metodo ANOVA Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 1 Nella popolazione, per ciascun gruppo la distribuzione della variabile risposta

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi Corso di laurea in Informatica e Bioinformatica 4 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI 1 - STATISTICA DESCRITTIVA

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

Metodi per la riduzione della dimensionalità. Strumenti quantitativi per la gestione

Metodi per la riduzione della dimensionalità. Strumenti quantitativi per la gestione Metodi per la riduzione della dimensionalità Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/6c_pca.html#(1) 1/25 Introduzione Gli approcci

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi

Dettagli

LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE

LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE 5.1 ESEMPIO DI ANOVA AD UNA VIA In un esperimento un gruppo di bambini è stato assegnato a caso a 3 trattamenti, allo scopo di determinare

Dettagli

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova

Dettagli

ESAME. 9 Gennaio 2017 COMPITO B

ESAME. 9 Gennaio 2017 COMPITO B ESAME 9 Gennaio 2017 COMPITO B Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI

DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Università degli Studi di Perugia Versione on-line: http://www.unipg.it/ onofri/rtutorial/index.html

Dettagli

Analisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura

Analisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura Analisi grafica residui in R Da output grafico analisi regressionelm1.csv Vedi dispensa peso-statura 1) Il plot in alto a sinistra mostra gli errori residui contro i loro valori stimati. I residui devono

Dettagli

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare

Dettagli

Statistica di base per l analisi socio-economica

Statistica di base per l analisi socio-economica Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

Regressione logistica

Regressione logistica Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer Metodi di classificazione Tecniche principali Alcuni esempi Data set Default I dati La regressione logistica Esempio Il modello

Dettagli

Lezione 18. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 18. A. Iodice

Lezione 18. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 18. A. Iodice Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 45 Outline 1 2 3 4 5 () Statistica 2 / 45 Modello di In molte applicazioni il ruolo delle variabili

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

La regressione lineare multipla

La regressione lineare multipla 13 La regressione lineare multipla Introduzione 2 13.1 Il modello di regressione multipla 2 13.2 L analisi dei residui nel modello di regressione multipla 9 13.3 Il test per la verifica della significatività

Dettagli

Stima dei parametri di modelli lineari

Stima dei parametri di modelli lineari Stima dei parametri di modelli lineari Indice Introduzione................................ 1 Il caso studio................................ 2 Stima dei parametri............................ 3 Bontà delle

Dettagli

Introduzione alla Regressione Logistica

Introduzione alla Regressione Logistica Introduzione alla Regressione Logistica Contenuto regressione lineare semplice e multipla regressione logistica lineare semplice La funzione logistica Stima dei parametri Interpretazione dei coefficienti

Dettagli

lezione 7 AA Paolo Brunori

lezione 7 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove siamo arrivati? - se siamo interessati a studiare l andamento congiunto di due fenomeni economici - possiamo provare a misurare i due fenomeni e poi usare la lineare semplice

Dettagli

Esercizio 8. Ne segue, ovviamente che le aree geografiche di riferimento sono Africa e America del Sud.

Esercizio 8. Ne segue, ovviamente che le aree geografiche di riferimento sono Africa e America del Sud. Esercizio 8 La Swiss Economic Research della Union Bank of Switzerland conduce un controllo periodico dei livelli dei prezzi e dei salari nella principali città del mondo. Una delle variabili rilevate

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Analisi discriminante in R Strumenti quantitativi per la gestione

Analisi discriminante in R Strumenti quantitativi per la gestione Analisi discriminante in R Strumenti quantitativi per la gestione Emanuele Taufer Default data LDA con R Output Plot Previsione Tabella di classificazione Cambiare il criterio di classificazione Costruire

Dettagli

05. Errore campionario e numerosità campionaria

05. Errore campionario e numerosità campionaria Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui

Dettagli

Ringraziamenti dell Editore

Ringraziamenti dell Editore Indice Elenco dei simboli e delle abbreviazioni in ordine di apparizione Ringraziamenti dell Editore XI XVII 1 Introduzione FAQ e qualcos altro, da leggere prima 1 1.1 QuestoèunlibrodiStatistica....................

Dettagli

CAPITOLO 11 ANALISI DI REGRESSIONE

CAPITOLO 11 ANALISI DI REGRESSIONE VERO FALSO CAPITOLO 11 ANALISI DI REGRESSIONE 1. V F Se c è una relazione deterministica tra due variabili,x e y, ogni valore dato di x,determinerà un unico valore di y. 2. V F Quando si cerca di scoprire

Dettagli

obbligatorio - n. iscrizione sulla lista

obbligatorio - n. iscrizione sulla lista 02.09.2015 - appello di STATISTICA per studenti ENE - docente: E. Piazza obbligatorio - n. iscrizione sulla lista il presente elaborato si compone di 5 (cinque) pagine se non ve lo ricordate siete fritti;

Dettagli

STATISTICHE DESCRITTIVE Parte II

STATISTICHE DESCRITTIVE Parte II STATISTICHE DESCRITTIVE Parte II INDICI DI DISPERSIONE Introduzione agli Indici di Dispersione Gamma Differenza Interquartilica Varianza Deviazione Standard Coefficiente di Variazione introduzione Una

Dettagli

Laboratorio di R - 3 a lezione Prof. Mauro Gasparini

Laboratorio di R - 3 a lezione Prof. Mauro Gasparini Laboratorio di R - 3 a lezione Prof. Mauro Gasparini 1. Verifica di ipotesi: il test t di Student In R è disponibile la funzione t.test che effettua il test t di Student ad un campione, a due campioni

Dettagli

Statistical learning Strumenti quantitativi per la gestione

Statistical learning Strumenti quantitativi per la gestione Statistical learning Strumenti quantitativi per la gestione Emanuele Taufer Vendite Simbologia Reddito Statistical learning A cosa ci serve f? 1 Previsione 2 Inferenza Previsione Errore riducibile e errore

Dettagli

Analisi Discriminante Strumenti quantitativi per la gestione

Analisi Discriminante Strumenti quantitativi per la gestione Analisi Discriminante Strumenti quantitativi per la gestione Emanuele Taufer Un esempio introduttivo Approccio con Bayes Perchè un altro metodo di classificazione? Classificazione con Bayes Analisi discriminante

Dettagli

Laboratorio di Statistica Aziendale Modello di regressione lineare semplice

Laboratorio di Statistica Aziendale Modello di regressione lineare semplice Laboratorio di Statistica Aziendale Modello di regressione lineare semplice Dott.ssa Michela Pasetto michela.pasetto2@unibo.it Caricamento del dataset Il dataset SalesData si trova nella cartella condivisa

Dettagli

La regressione lineare. Rappresentazione analitica delle distribuzioni

La regressione lineare. Rappresentazione analitica delle distribuzioni La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta

Dettagli

11.2. Introduzione alla statistica 2/ed. Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici

11.2. Introduzione alla statistica 2/ed. Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici CAPITOLO 11 L ANALISI DI REGRESSIONE SOLUZIONI 11.1 a) una relazione lineare potrebbe essere appropriata b)l equazione di regressione è y cappello=0,96+0,00006 x c)olanda: y cappello=0,96+0,00006 (53560)=4,57

Dettagli

Presentazione dell edizione italiana

Presentazione dell edizione italiana 1 Indice generale Presentazione dell edizione italiana Prefazione xi xiii Capitolo 1 Una introduzione alla statistica 1 1.1 Raccolta dei dati e statistica descrittiva... 1 1.2 Inferenza statistica e modelli

Dettagli

ESPERIENZA DI LABORATORIO N 1. 1) Misura diretta mediante tester della resistenza elettrica dei resistori R1, R2, R3 e calcolo degli errori di misura.

ESPERIENZA DI LABORATORIO N 1. 1) Misura diretta mediante tester della resistenza elettrica dei resistori R1, R2, R3 e calcolo degli errori di misura. ESPERIENZA DI LABORATORIO N. ) Misura diretta mediante tester della resistenza elettrica dei resistori R, R, R3 e calcolo degli errori di misura. Dalla misurazione diretta delle singole resistenze abbiamo

Dettagli

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati: Obiettivi: Esplicitare la correlazione esistente tra l altezza di un individuo adulto e la lunghezza del suo piede e del suo avambraccio. Idea del progetto: Il progetto nasce dall idea di acquistare scarpe

Dettagli

Analisi Multivariata dei Dati. Regressione Multipla

Analisi Multivariata dei Dati. Regressione Multipla Analisi Multivariata dei Dati Regressione Multipla A M D Marcello Gallucci Milano-Bicocca Lezione: III Effetti multipli Consideriamo ora il caso in cui la variabile dipendente possa essere spiegata da

Dettagli

Corso di Statistica Industriale

Corso di Statistica Industriale Corso di Statistica Industriale Corsi di Laurea Specialistica in Ingegneria Gestionale e Ingegneria Meccanica Docente: Ilia Negri Orario del corso: Martedì: dalle 14.00 alle 16.00 Venerdì: dalle 10.30

Dettagli

Esercizio 2: voto e ore dedicate allo studio

Esercizio 2: voto e ore dedicate allo studio La seguente tabella riporta il voto riportato da 10 studenti all esame di Statistica Sociale e il numero di ore di lezione non seguite dallo studente (il corso prevede 30 ore di lezione). Ci si chiede

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 4 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI 1 - STATISTICA DESCRITTIVA VENDITE PC ESERCIZIO 1: La seguente tabella

Dettagli

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi) CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON

Dettagli

Scale di Misurazione Lezione 2

Scale di Misurazione Lezione 2 Last updated April 26, 2016 Scale di Misurazione Lezione 2 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura II anno, II semestre Tipi di Variabili 1 Scale di Misurazione 1. Variabile

Dettagli

Fasi del modello di regressione

Fasi del modello di regressione Fasi del modello di regressione Specificazione del modello: scelta del tipo di funzione da utilizzare per descrivere un fenomeno; definizione delle ipotesi di base Stima dei parametri: uso di stimatori

Dettagli

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25 Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità

Dettagli

Misure di dispersione (o di variabilità)

Misure di dispersione (o di variabilità) 08/04/014 Misure di dispersione (o di variabilità) Range Distanza interquartile Deviazione standard Coefficiente di variazione Misure di dispersione 7 8 9 30 31 9 18 3 45 50 x 9 range31-74 x 9 range50-941

Dettagli

Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si

Dettagli

Il modello di regressione

Il modello di regressione Il modello di regressione Capitolo e 3 A M D Marcello Gallucci Milano-Bicocca Lezione: II Concentti fondamentali Consideriamo ora questa ipotetica ricerca: siamo andati in un pub ed abbiamo contato quanti

Dettagli

Questo calcolo richiede che si conoscano media e deviazione standard della popolazione.

Questo calcolo richiede che si conoscano media e deviazione standard della popolazione. Università del Piemonte Orientale Corso di laurea in biotecnologie Corso di Statistica Medica La distribuzione t - student 1 Abbiamo visto nelle lezioni precedenti come il calcolo del valore Z, riferito

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 3 LA REGRESSIONE LINEARE ES. STUDIO RELAZIONE ALTEZZA - PESO Soggetto Altezza Peso A 174 75 B 166 63 C 173 70 D 171 71 E 168 68 F 167 68 G 165

Dettagli

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa

Dettagli

STATISTICA ESERCITAZIONE 13

STATISTICA ESERCITAZIONE 13 STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla

Dettagli

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica La distribuzione t - student 1 Abbiamo visto nelle lezioni precedenti come il calcolo del valore Z,

Dettagli

Indice. 1 Introduzione ai modelli lineari 2. 2 Dataset 3. 3 Il Modello 8. 4 In pratica 12 4.1 Peso e percorrenza... 12

Indice. 1 Introduzione ai modelli lineari 2. 2 Dataset 3. 3 Il Modello 8. 4 In pratica 12 4.1 Peso e percorrenza... 12 Indice 1 Introduzione ai modelli lineari 2 2 Dataset 3 3 Il Modello 8 4 In pratica 12 41 Peso e percorrenza 12 1 Capitolo 1 Introduzione ai modelli lineari Quando si analizzano dei dati, spesso si vuole

Dettagli

Metodi di regressione multivariata

Metodi di regressione multivariata Metodi di regressione multivariata Modellamento dei dati per risposte quantitative I metodi di regressione multivariata sono strumenti utilizzati per ricercare relazioni funzionali quantitative tra un

Dettagli

Contenuti: Capitolo 14 del libro di testo

Contenuti: Capitolo 14 del libro di testo Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4

Dettagli

Facoltà di ECONOMIA Università di Pavia 20 Aprile 2004 Prova scritta di Analisi dei dati MODALITÀ A

Facoltà di ECONOMIA Università di Pavia 20 Aprile 2004 Prova scritta di Analisi dei dati MODALITÀ A MODALITÀ A Riportare sul foglio nome, cognome, numero di matricola e modalità del testo d esame. Problema 1 (8 PUNTI) Su un collettivo di 10 clienti iscritti al programma frequent flyer di una nota compagnia

Dettagli

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo 1. Gli studi di simulazione possono permetterci di apprezzare alcune delle proprietà di distribuzioni campionarie ricavate

Dettagli

ESERCITAZIONE C. Analisi di dati sperimentali PARTE 3: REGRESIONE

ESERCITAZIONE C. Analisi di dati sperimentali PARTE 3: REGRESIONE Università degli Studi di Padova Facoltà di Scienze MM.FF.NN. Corso di Laurea Magistrale: Biologia Sanitaria/Biologia Molecolare Insegnamento: Statistica Applicata Docente: Prof.ssa Alessandra R. Brazzale

Dettagli

Tipi di variabili. Indici di tendenza centrale e di dispersione

Tipi di variabili. Indici di tendenza centrale e di dispersione Tipi di variabili. Indici di tendenza centrale e di dispersione L. Boni Variabile casuale In teoria della probabilità, una variabile casuale (o variabile aleatoria o variabile stocastica o random variable)

Dettagli

Giorno n. clienti di attesa

Giorno n. clienti di attesa Esercizio 1 Un aspetto cruciale per la qualità del servizio ai clienti in un supermercato è il cosiddetto checkout (ovvero il tempo che il cliente impiega dal momento in cui si mette in fila alla cassa

Dettagli

Distribuzione Gaussiana - Facciamo un riassunto -

Distribuzione Gaussiana - Facciamo un riassunto - Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura

Dettagli

Quanti soggetti devono essere selezionati?

Quanti soggetti devono essere selezionati? Quanti soggetti devono essere selezionati? Determinare una appropriata numerosità campionaria già in fase di disegno dello studio molto importante è molto Studi basati su campioni troppo piccoli non hanno

Dettagli

Distribuzioni campionarie

Distribuzioni campionarie 1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari

Dettagli

Uso elementare di R in Statistica G. Marchetti

Uso elementare di R in Statistica G. Marchetti Uso elementare di R in Statistica G. Marchetti Lezione 1 Introduzione R è un ambiente statistico di pubblico dominio. Il software è libero e può essere scaricato dal sito https: //cran.r-project.org/.

Dettagli

Esercitazione. 24 Aprile 2012

Esercitazione. 24 Aprile 2012 Esercitazione 24 Aprile 2012 Il modello di regressione logistica viene utilizzato quando si è interessati a studiare o analizzare la relazione causale tra una variabile dipendente dicotomica e una o più

Dettagli

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

Modelli non lineari Strumenti quantitativi per la gestione

Modelli non lineari Strumenti quantitativi per la gestione Modelli non lineari Strumenti quantitativi per la gestione Emanuele Taufer Metodi per affrontare problemi non lineari Regressione polinomiale Esempio: modellare i picchi di domanda di energia Fattori che

Dettagli

Note sulla probabilità

Note sulla probabilità Note sulla probabilità Maurizio Loreti Dipartimento di Fisica Università degli Studi di Padova Anno Accademico 2002 03 1 La distribuzione del χ 2 0.6 0.5 N=1 N=2 N=3 N=5 N=10 0.4 0.3 0.2 0.1 0 0 5 10 15

Dettagli

Distribuzioni e inferenza statistica

Distribuzioni e inferenza statistica Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione

Dettagli

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill Statistica - metodologie per le scienze economiche e sociali /e S Borra, A Di Ciaccio - McGraw Hill Es 6 Soluzione degli esercizi del capitolo 6 In base agli arrotondamenti effettuati nei calcoli, si possono

Dettagli

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n. 5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema

Dettagli

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza. Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza. Misure ripetute forniscono dati numerici distribuiti attorno ad un valore centrale indicabile con un indice (indice

Dettagli