MODELLO LINEARE: ESEMPI ED APPLICAZIONI

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "MODELLO LINEARE: ESEMPI ED APPLICAZIONI"

Transcript

1 MODELLO LINEARE: ESEMPI ED APPLICAZIONI Mario Romanazzi 1 ESEMPIO 1. PUBBLICITA E VENDITE 1.1 I DATI I dati sono le spese mensili in pubblicità (X, migliaia di dollari) e l ammontare mensile delle vendite (Y, milioni di dollari) di una catena di negozi di arredamento. > # ad: vettore delle spese mensili in pubblicità > ad <- c(23,46,60,54,28,33,25,31,36,88,90,99) > # sell: vettore delle vendite mensili > sell <- c(9.6,11.3,12.8,9.8,8.9,12.5,12,11.4,12.6,13.7,14.4,15.9) > # numerosità campionaria > n <- length(ad); n [1] 12 La stima di un modello lineare è sempre preceduta da un analisi preliminare volta a verificare le caratteristiche generali dei dati (tipologia distributiva, dati mancanti, presenza di outliers) e le ipotesi del modello, in particolare l esistenza di una relazione lineare tra le variabili. Riportiamo sotto le presentazioni ramo-foglia. La Fig. 1 mostra i diagrammi scatolabaffi. > stem(ad) The decimal point is 1 digit(s) to the right of the > stem(sell) 1

2 1 ESEMPIO 1. PUBBLICITA E VENDITE 2 The decimal point is at the > layout(matrix(1:2,nr=1,nc=2)) > boxplot(ad,ylab="spese Mensili Pubblicità") > boxplot(sell,ylab="ammontare Vendite Mensili") > layout(matrix(1)) Spese Mensili Pubblicità Ammontare Vendite Mensili Figura 1: Diagrammi scatola-baffi spese pubblicitarie e vendite mensili. La Fig. 2 mostra il diagramma di dispersione della distribuzione congiunta.

3 1 ESEMPIO 1. PUBBLICITA E VENDITE 3 > plot(ad,sell,pch=20, xlab="spese Mensili Pubblicità", + ylab="ammontare Vendite Mensili") Ammontare Vendite Mensili Spese Mensili Pubblicità Figura 2: Diagramma di dispersione spese pubblicitarie e vendite. 1.2 STATISTICHE RIASSUNTIVE Riportiamo di seguito le statistiche riassuntive di base. > # somma dati e somma dati al quadrato sia per ad che per sell > c(sum(ad),sum(ad^2)) [1] > c(sum(sell),sum(sell^2))

4 1 ESEMPIO 1. PUBBLICITA E VENDITE 4 [1] > # somma prodotti incrociati > sum(ad*sell) [1] A partire dalle statistiche riassuntive si ottengono le statistiche campionarie marginali e congiunte: medie, varianze, deviazioni standard, covarianza e correlazione. > # statistiche camp. spese pubblicitarie > mx <- mean(ad); varx <- var(ad); sdx <- sd(ad) > c(mx,varx,sdx) [1] > # statistiche camp. vendite > my <- mean(sell); vary <- var(sell); sdy <- sd(sell) > c(my,vary,sdy) [1] > # covarianza, correlazione > sxy <- cov(ad,sell); rxy <- cor(ad,sell) > c(sxy,rxy) [1] Riepiloghiamo i risultati precedenti nella Tab. 1. n i=1 x i i=1 y i i=1 x2 i i=1 y2 i i=1 x iy i x y s X s Y s X,Y r X,Y Tabella 1: Pubblicità e vendite. Statistiche riassuntive univariate e bivariate. 1.3 LA RETTA DEI MINIMI QUADRATI Il modello lineare, al livello più semplice, è un ipotesi riguardante la struttura delle variabili subordinate Y X = x, per un generico fissato valore x della variabile esplicativa. Y (X = x) = DEF α + βx + ɛ, (1)

5 1 ESEMPIO 1. PUBBLICITA E VENDITE 5 in cui α + βx µ Y (x) è la componente deterministica, una funzione lineare di x, mentre ɛ è la componente stocastica, una variabile aleatoria con valore atteso zero e deviazione standard σ ɛ, non dipendente da x (condizione di omoschedasticità). Inoltre, errori ɛ corrispondenti a distribuzioni subordinate diverse si assumono stocasticamente indipendenti. Prendendo il valore atteso dei due membri della (1) e usando E(ɛ) = 0, otteniamo E(Y X = x) = E(α + βx + ɛ) = α + βx. (2) Similmente, prendendo la varianza dei due membri della (1) e usando V ar(ɛ) = σ 2 ɛ, otteniamo V ar(y X = x) = V ar(α + βx + ɛ) = V ar(ɛ) = σ 2 ɛ. (3) In base al principio dei minimi quadrati (MQ), le stime campionarie dei coefficienti della retta sono ˆβ n = s X,Y s 2 X Inoltre, la stima campionaria non distorta di σ 2 ɛ è: s 2 ɛ = 1 n 2 = r X,Y s Y s X, (4) ˆα n = y n ˆβ n x n. (5) n i=1 e 2 i = 1 n 2 n (y i ŷ i ) 2, (6) dove ŷ i ˆα n + ˆβ n x i sono le previsioni dei dati y i ricavate dal modello lineare stimato. Ricordiamo che queste previsioni non sono altro che le stime di E(Y X = x i ), i valori attesi delle distribuzioni subordinate Y X = x i, i = 1,..., n. Le funzioni R riportate sotto calcolano i valori delle stime insieme con le statistiche che ne valutano il grado di accostamento ai dati, in particolare la statistica R 2 = r 2 X,Y. La Fig. 3 mostra il grafico di dispersione e la retta MQ stimata. E anche visualizzato il centroide, il punto di coordinate x n, y n, che appartiene sempre alla retta MQ campionaria. > # stima coefficiente angolare (beta cappello) > betah <- sxy/varx; betah [1] > # formula equivalente > betah <- rxy*sdy/sdx; betah [1] > # stima intercetta (alfa cappello) > alfah <- my-betah*mx; alfah i=1

6 1 ESEMPIO 1. PUBBLICITA E VENDITE 6 [1] > c(alfah,betah) [1] > # indice di bontà retta mq (R^2) > R2 <- rxy^2; R2 [1] > # scomposizione devianza Y > # devianza "spiegata" dal modello > devsp <- (n-1)*vary*r2; devsp [1] > # devianza "non spiegata" dal modello ("dei residui") > devres <- (n-1)*vary*(1-r2); devres [1] > # stima non distorta varianza ed sd dei residui > varres <- devres/(n-2); sdres <- sqrt(varres) > c(varres, sdres) [1] > plot(ad,sell,pch=20, xlab="spese Mensili Pubblicità", + ylab="ammontare Vendite Mensili") > abline(a=alfah,b=betah,lty="dashed",lwd=2,col="red") > points(mx,my,pch="*",cex=2,col="red") La retta MQ campionaria è dunque: ŷ = x. (7) Importante l interpretazione: in media, un aumento di 1000 dollari delle spese pubblicitarie mensili produce un aumento di circa dollari del corrispettivo delle vendite mensili. Per una spesa in pubblicità di dollari ci aspettiamo un ammontare di vendite pari a = ± 1.35 milioni di dollari.

7 1 ESEMPIO 1. PUBBLICITA E VENDITE 7 Ammontare Vendite Mensili * Spese Mensili Pubblicità Figura 3: Diagramma di dispersione con retta MQ e centroide. 1.4 ACCURATEZZA DELLA STIMA DEL COEFFICIENTE ANGOLARE Nell interpretazione della retta MQ campionaria, e della sua accuratezza come stima della retta MQ della popolazione, riveste un importanza particolare il coefficiente angolare ˆβ n = s X,Y /s 2 X. Si vuole soprattutto controllare l ipotesi β = 0, corrispondente all indipendenza lineare delle variabili e dunque alla non rilevanza di X come fattore esplicativo di Y, almeno nel quadro della linearità. A tale proposito si dimostra che 1. E( ˆβ n ) = β, 2. SD( ˆβ n ) = σ ɛ / (n 1)s 2 X,

8 1 ESEMPIO 1. PUBBLICITA E VENDITE 8 3. se, in aggiunta alle precedenti ipotesi sul modello lineare, aggiungiamo l ipotesi di normalità, Y (X = x) N(α + βx, σ ɛ ), allora ˆβ n N(β, σ ɛ / (n 1)s 2 X ), 4. valendo (1), (2) e (3), la variabile standardizzata (con l SE stimato) ( ˆβ n β)/ŝe( ˆβ n ) ha una distribuzione t di Student con n 2 gradi di libertà e quindi l intervallo di confidenza per β di livello 1 α è s ɛ ˆβ n ± t n 2;1 α/2. (8) (n 1)s 2 X Se il precedente intervallo include il valore zero, tenuto conto dell errore di campionamento, non si può escludere che, nella popolazione, il coefficiente angolare β sia nullo. Questo suonerebbe come una sconfessione del modello lineare. Il codice R sottostante calcola l errore standard stimato di ˆβ n e l intervallo di confidenza per β di livello Quest ultimo non include il valore zero, il che conferma la rilevanza della variabile X come fattore esplicativo per Y. Il risultato viene confermato anche ad un livello di confidenza > # errore standard stima camp. beta > sebetah <- sdres/sqrt((n-1)*varx); sebetah [1] > # intervalli di confidenza 95% e 99% > c(betah - qt(0.975,df=n-2)*sebetah, betah + qt(0.975,df=n-2)*sebetah) [1] > c(betah - qt(0.995,df=n-2)*sebetah, betah + qt(0.995,df=n-2)*sebetah) [1] CONTROLLO DELLE IPOTESI SUL TERMINE D ER- RORE Il modello lineare introduce ipotesi molto restrittive sul termine d errore ɛ che vengono controllate a posteriori sulla base dei residui stimati e i, i = 1,..., n. Innanzitutto, il modello implica che i residui standardizzati e i;st = e i /s e, i = 1,..., n, abbiano approssimativamente una distribuzione normale standard (è facile provare che la media campionaria degli e i è nulla). Un ramo foglia, un diagramma scatola baffi o un istogramma permettono un controllo grafico informale di questa ipotesi. Il codice R sottostante calcola i residui standardizzati e produce il ramo foglia e il diagramma scatola baffi.

9 2 ESEMPIO 2. FUMO E MORTALITA PER LEUCEMIA 9 > # vendite stimate > yhat <- alfah + betah * ad > # residui stimati > res <- sell - yhat > # residui standardizzati > resst <- res/sdres > stem(resst) The decimal point is at the > boxplot(resst,ylab="residui standardizzati",main="spese Pubblicitarie e Vendite") La Fig. 4 mostra una certa asimmetria ma tutti i residui sono compresi nell intervallo ( 2, 2). Un altra fondamentale ipotesi è l indipendenza stocastica dei residui corrispondenti a diversi valori della variabile esplicativa. Un controllo grafico informale si ottiene dal diagramma di dispersione della variabile esplicativa e dei residui o dei valori stimati della variabile risposta e dei residui. Il diagramma non dovrebbe suggerire alcun tipo di relazione tra le variabili. > layout(matrix(1:2,nr=1,nc=2)) > plot(ad,resst,xlab="spese pubblicitarie",ylab="residui standardizzati") > abline(h=0,lty="dashed",col="red") > plot(yhat,resst,xlab="vendite stimate",ylab="residui standardizzati") > abline(h=0,lty="dashed",col="red") > layout(matrix(1)) Come mostra la Fig. relazione tra le variabili. 5 i diagrammi di dispersione non suggeriscono alcun tipo di 2 ESEMPIO 2. FUMO E MORTALITA PER LEUCEMIA I dati sono presi dall Es. 8 Cap La variabile X fornisce il numero di sigarette pro capite fumate in un anno in un campione di stati USA, la variabile Y fornisce il numero di morti per leucemia per abitanti registrati in un anno. Il problema base (comune a tante ricerche epidemiologiche) è valutare la rilevanza del fumo come fattore esplicativo della mortalità per leucemia.

10 2 ESEMPIO 2. FUMO E MORTALITA PER LEUCEMIA 10 Spese Pubblicitarie e Vendite Residui standardizzati Figura 4: Diagramma scatola baffi dei residui standardizzati. > # sig: numero sigarette > sig <- c(2860,2010,2791,2618,2212,2184,2344,2692,2206,2914,3034,4240,1400,2257) > # leu: mortalità per leucemia > leu <- c(7.06,6.62,7.27,7.00,7.69,7.42,6.41,6.89,8.28,7.23,4.90,6.67,6.71,7.02) > # numerosità campionaria > n <- length(sig); n [1] 14 Come per l esempio precedente, calcoliamo le statistiche riassuntive di base e riepiloghiamo i risultati nella Tab. 2. La retta MQ campionaria risulta (vedi Fig. 6) ŷ = x (9)

11 2 ESEMPIO 2. FUMO E MORTALITA PER LEUCEMIA 11 Spese Pubblicitarie e Vendite Spese Pubblicitarie e Vendite Residui standardizzati Residui standardizzati Spese pubblicitarie Vendite stimate Figura 5: Diagrammi di dispersione variabile esplicativa, residui (a sinistra) e variabile risposta stimata, residui (a destra). ed inoltre s ɛ = , ŜE( ˆβ n ) = (10) L intervallo di confidenza 95% per β ( , ) (11) include il valore zero il che significa che non si può escludere che a livello di popolazione sia β = 0. Cioè, il consumo di sigarette non rappresenta un fattore esplicativo della mortalità

12 3 ESEMPIO 3. ANDAMENTO TEMPORALE DEL CONSUMO DI BEVANDE ALCOLICHE12 n i=1 x i i=1 y i i=1 x2 i i=1 y2 i i=1 x iy i x y s X s Y s X,Y r X,Y Tabella 2: Consumo di sigarette e mortalità per leucemia. Statistiche riassuntive univariate e bivariate. leucemica, almeno nel quadro della linearità. Ricordiamo che il coefficiente di correlazione campionario è circa 0.25! Il consumo di sigarette è invece un fattore esplicativo altamente significativo della mortalità per cancro del polmone (vedi Es. 6, C. 12.5). 3 ESEMPIO 3. ANDAMENTO TEMPORALE DEL CONSUMO DI BEVANDE ALCOLICHE I dati descrivono l andamento temporale (dal 2001 al 2012, manca il dato del 2004) della % di persone di 14 anni e più che consumano bevande alcoliche tutti i giorni (fonte: ISTAT, L uso e abuso di alcol in Italia, 2012). Ci proponiamo di stimare il trend temporale del fenomeno e di valutare se è stabile o crescente / decrescente. La variabile esplicativa è il tempo, con modalità 2001,..., 2012; la variabile risposta è la % di consumatori di bevande alcoliche rilevata annualmente. Un utile modello di partenza è quello lineare. La Fig. 7 suggerisce un trend decrescente. > # vettore degli anni di rilevazione > anni <- 2001:2012 > # vettore delle % di consumo di bevande alcoliche > alcol <- c(34.8, 34.5, 32.1, NA, 32.1, 30.6, 30.3, 28.3, 27.8, 27.2, , 24.4) > # numerosità campionaria > n <- length(alcol) > n [1] 12 > plot(anni,alcol,ylim=c(0,100),xlab="anni",ylab="consumatori quotidiani (%)", + main="consumo di Bevande Alcoliche, ITALIA ",sub="Fonte: ISTAT") La Tab. 3 riporta le statistiche di sintesi. Il 2004, mancando il dato della variabile dipendente, non è considerato. Riportiamo di seguito le stime campionarie dei parametri del modello lineare.

13 3 ESEMPIO 3. ANDAMENTO TEMPORALE DEL CONSUMO DI BEVANDE ALCOLICHE13 Mortalità leucemica * Consumo annuo di sigarette Figura 6: Diagramma di dispersione consumo di sigarette e mortalità leucemica, con retta MQ e centroide. ˆβ n = s X,Y , s 2 X ˆα n = y n ˆβ n x n , s 2 ɛ = 1 n 2 n i=1 e 2 i = (n 1)(1 R2 )s 2 Y n 2 s ɛ = s 2 ɛ , ŜE( ˆβ s ɛ n ) = (n 1)s 2 X , L equazione della retta MQ stimata è (vedi Fig. 8) ŷ = x.

14 3 ESEMPIO 3. ANDAMENTO TEMPORALE DEL CONSUMO DI BEVANDE ALCOLICHE14 Consumo di Bevande Alcoliche, ITALIA Consumatori quotidiani (%) Anni Fonte: ISTAT Figura 7: Diagramma di dispersione della % di consumatori di bevande alcoliche. Il risultato conferma il trend decrescente già evidente nel diagramma di dispersione: il modello stima una diminuzione annuale dei consumatori abituali di bevande alcoliche pari a %. Il grado di accostamento ai dati è molto buono (R %). Una semplice applicazione è la stima del dato mancante del ŷ = (2004) Questo risultato va interpretato come la stima della media della distribuzione subordinata Y X = Per valutare statisticamente il modello consideriamo il test H 0 : β = 0, contro l alternativa H 0 : β 0. La statistica test è ˆβ n β 0 ŜE( ˆβ n ) = ˆβn ŜE( ˆβ n )

15 3 ESEMPIO 3. ANDAMENTO TEMPORALE DEL CONSUMO DI BEVANDE ALCOLICHE15 n i=1 x i i=1 y i i=1 x2 i i=1 y2 i i=1 x iy i x y s X s Y s X,Y r X,Y Tabella 3: Consumo di bevande alcoliche in Italia, Statistiche riassuntive univariate e bivariate. e la sua determinazione campionaria è / , da confrontare con la distribuzione t con n 2 = 9 gradi di libertà. Le proprietà di tale distribuzione ci dicono che questo valore è lontanissimo dal centro, inducendoci a rifiutare H 0. Dunque la stima del coefficiente angolare della retta è significativamente diversa da zero, il che conferma la rilevanza del trend temporale. Notiamo che la regione di non rifiuto al livello di significatività dell 1% è (t 9;0.005, t 9;0.995) = ( , ), mentre il valore p è P ( t ) , quindi inferiore a un milionesimo! Le funzioni R per il calcolo di queste quantità sono riportate di seguito. > # regione di non rifiuto di H0 : beta = 0 (liv. sign. 1%) > c(qt(0.005,df=9),qt(0.995,df=9)) [1] > # valore p > 2*pt(-16.38,df=9) [1] e-08 L intervallo di confidenza di livello 95% per β è ˆβ n ± t 9;0.975 ŜE( ˆβ n ) = ± ( ) ( 1.01, 0.76). Questo risultato conferma il trend decrescente del fenomeno. L analisi dei residui standardizzati (vedi ramo-foglia sottostante e Fig. 9) non evidenzia deviazioni importanti dalle ipotesi del modello lineare. > # diagramma ramo-foglia residui standardizzati > stem(scale(rmqalcol$residuals)) The decimal point is at the

16 3 ESEMPIO 3. ANDAMENTO TEMPORALE DEL CONSUMO DI BEVANDE ALCOLICHE16 Consumo di Bevande Alcoliche, ITALIA Consumatori quotidiani (%) * Anni Fonte: ISTAT Figura 8: Diagramma di dispersione della % di consumatori di bevande alcoliche con centroide e retta MQ. > layout(matrix(1:2,nr=1,nc=2)) > plot(df$anni,scale(rmqalcol$residuals),xlab="anni", + ylab="residui standardizzati") > abline(h=0,lty="dashed",col="red") > plot(rmqalcol$fitted.values,scale(rmqalcol$residuals), + xlab="% stimate",ylab="residui standardizzati") > abline(h=0,lty="dashed",col="red") > layout(matrix(1))

17 3 ESEMPIO 3. ANDAMENTO TEMPORALE DEL CONSUMO DI BEVANDE ALCOLICHE17 Residui standardizzati Residui standardizzati Anni % stimate Figura 9: Diagrammi di dispersione variabile esplicativa, residui (a sinistra) e variabile risposta stimata, residui (a destra).

Prova Pratica di Statistica I+II - Prof. M. Romanazzi

Prova Pratica di Statistica I+II - Prof. M. Romanazzi 1 Università di Venezia - Corso di Statistica I + II (Cb-Ga) Prova Pratica di Statistica I+II - Prof. M. Romanazzi 3 Giugno 2008 Cognome e Nome............................................ N. Matricola............

Dettagli

Esame di Statistica A-Di Prof. M. Romanazzi

Esame di Statistica A-Di Prof. M. Romanazzi 1 Università di Venezia Esame di Statistica A-Di Prof. M. Romanazzi 25 Maggio 2015 Cognome e Nome..................................... N. Matricola.......... Valutazione Il punteggio massimo teorico di

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

Statistica 1 A.A. 2015/2016

Statistica 1 A.A. 2015/2016 Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 35 Il modello di regressione

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro

Dettagli

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1 Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

Lezione 18. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 18. A. Iodice

Lezione 18. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 18. A. Iodice Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 45 Outline 1 2 3 4 5 () Statistica 2 / 45 Modello di In molte applicazioni il ruolo delle variabili

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1

Dettagli

Analisi di Regressione Multivariata. β matrice incognita dei coeff. di regressione (regr. lineare in β)

Analisi di Regressione Multivariata. β matrice incognita dei coeff. di regressione (regr. lineare in β) Analisi di Regressione Multivariata Regressione: metodologia per dedurre info e per anticipare risposte di una variabile dip. Modello classico di regressione lineare: Y {z} n k = {z} X β + ρ {z} {z} n

Dettagli

Presentazione dell edizione italiana

Presentazione dell edizione italiana 1 Indice generale Presentazione dell edizione italiana Prefazione xi xiii Capitolo 1 Una introduzione alla statistica 1 1.1 Raccolta dei dati e statistica descrittiva... 1 1.2 Inferenza statistica e modelli

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

MODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza,

MODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza, MODELLO DI REGRESSIONE LINEARE le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza, teorema di Gauss-Markov, verifica di ipotesi e test di

Dettagli

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi) CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

Ringraziamenti dell Editore

Ringraziamenti dell Editore Indice Elenco dei simboli e delle abbreviazioni in ordine di apparizione Ringraziamenti dell Editore XI XVII 1 Introduzione FAQ e qualcos altro, da leggere prima 1 1.1 QuestoèunlibrodiStatistica....................

Dettagli

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51 Sommario 1 I dati...15 1.1 Classificazione delle rilevazioni...17 1.1.1 Esperimenti ripetibili (controllabili)...17 1.1.2 Rilevazioni su fenomeni non ripetibili...18 1.1.3 Censimenti...19 1.1.4 Campioni...19

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

Giorno n. clienti di attesa

Giorno n. clienti di attesa Esercizio 1 Un aspetto cruciale per la qualità del servizio ai clienti in un supermercato è il cosiddetto checkout (ovvero il tempo che il cliente impiega dal momento in cui si mette in fila alla cassa

Dettagli

Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo

Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo 1 Controllo di ipotesi sui parametri In questo contesto risulta necessario avvalersi dell assunzione di normalita

Dettagli

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: esercitazione 7 p. 1/13 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: 20-05-2004 Luca Monno Università degli studi di Pavia luca.monno@unipv.it http://www.lucamonno.it

Dettagli

ZIBALDONE DEL CORSO DI STATISTICA A Di

ZIBALDONE DEL CORSO DI STATISTICA A Di ZIBALDONE DEL CORSO DI STATISTICA A Di Mario Romanazzi 1 Argomenti non compresi in Ross, Introductory Statistics 1.1 Definizione di outlier secondo Tukey Il punto di partenza di Tukey è la regola empirica

Dettagli

Esame di Statistica A-Di Prof. M. Romanazzi

Esame di Statistica A-Di Prof. M. Romanazzi 1 Università di Venezia Esame di Statistica A-Di Prof. M. Romanazzi 22 Gennaio 2016 Cognome e Nome..................................... N. Matricola.......... Valutazione Il punteggio massimo teorico di

Dettagli

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui

Dettagli

Fasi del modello di regressione

Fasi del modello di regressione Fasi del modello di regressione Specificazione del modello: scelta del tipo di funzione da utilizzare per descrivere un fenomeno; definizione delle ipotesi di base Stima dei parametri: uso di stimatori

Dettagli

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA

Dettagli

Statistica descrittiva in due variabili

Statistica descrittiva in due variabili Statistica descrittiva in due variabili 1 / 65 Statistica descrittiva in due variabili 1 / 65 Supponiamo di misurare su un campione statistico due diverse variabili X e Y. Indichiamo come al solito con

Dettagli

Regressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Regressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007 Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il costo mensile Y di produzione e il corrispondente volume produttivo X per uno dei propri stabilimenti. Volume

Dettagli

Test F per la significatività del modello

Test F per la significatività del modello Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno

Dettagli

Test delle Ipotesi Parte I

Test delle Ipotesi Parte I Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test

Dettagli

Test per la correlazione lineare

Test per la correlazione lineare 10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche

Dettagli

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE

Dettagli

Cognome e Nome:... Corso di laurea:...

Cognome e Nome:... Corso di laurea:... Statistica - corso base Prof. B. Liseo Prova di esame dell 8 gennaio 201 Cognome e Nome:................................................................... Corso di laurea:.......................................................................

Dettagli

lezione 7 AA Paolo Brunori

lezione 7 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove siamo arrivati? - se siamo interessati a studiare l andamento congiunto di due fenomeni economici - possiamo provare a misurare i due fenomeni e poi usare la lineare semplice

Dettagli

Settimana 3. G. M. Marchetti. Marzo 2017

Settimana 3. G. M. Marchetti. Marzo 2017 Settimana 3 G. M. Marchetti Marzo 2017 1 / 26 Prima parte Relazioni tra variabili e regressione lineare 2 / 26 Una legge fisica approssimata Il fisico scozzese Forbes 3 / 26 L esperimento di Forbes Sulla

Dettagli

Esercizio 2: voto e ore dedicate allo studio

Esercizio 2: voto e ore dedicate allo studio La seguente tabella riporta il voto riportato da 10 studenti all esame di Statistica Sociale e il numero di ore di lezione non seguite dallo studente (il corso prevede 30 ore di lezione). Ci si chiede

Dettagli

Contenuti: Capitolo 14 del libro di testo

Contenuti: Capitolo 14 del libro di testo Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017

Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017 Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017 Contents 1 Inferenza sulla regressione semplice 1 1.1 Test sulla pendenza della retta................................... 1 1.2 Test sull

Dettagli

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi

Dettagli

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1 lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,

Dettagli

Confronto tra due popolazioni Lezione 6

Confronto tra due popolazioni Lezione 6 Last updated May 9, 06 Confronto tra due popolazioni Lezione 6 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura I anno, II semestre Concetti visti nell ultima lezione Le media

Dettagli

obbligatorio - n. iscrizione sulla lista

obbligatorio - n. iscrizione sulla lista 02.09.2015 - appello di STATISTICA per studenti ENE - docente: E. Piazza obbligatorio - n. iscrizione sulla lista il presente elaborato si compone di 5 (cinque) pagine se non ve lo ricordate siete fritti;

Dettagli

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova

Dettagli

1.4. Siano X B(1, 1/2) e Y B(1, 1/2) variabili aleatorie indipendenti. Quale delle seguenti affermazioni é falsa? E(X + Y ) = 1 V ar(x + Y ) = 1/2

1.4. Siano X B(1, 1/2) e Y B(1, 1/2) variabili aleatorie indipendenti. Quale delle seguenti affermazioni é falsa? E(X + Y ) = 1 V ar(x + Y ) = 1/2 Statistica N. Crediti: Cognome: Laurea Triennale in Biologia Nome: 4 settembre 2012 Matricola: 1. Parte A 1.1. Siano x 1, x 2,..., x 10 i dati relativi al peso di 10 neonati espressi in chilogrammi e y

Dettagli

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010. Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010 Statistica Esercitazione 4 12 maggio 2010 Dipendenza in media. Covarianza e

Dettagli

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza

Dettagli

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento. N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume

Dettagli

Analisi della regressione multipla

Analisi della regressione multipla Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,

Dettagli

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2

Dettagli

TRACCIA DI STUDIO. Test di confronto per misure qualitative. Verifica di ipotesi

TRACCIA DI STUDIO. Test di confronto per misure qualitative. Verifica di ipotesi TRACCIA DI STUDIO Verifica di ipotesi Nelle analisi statistiche di dati sperimentali riguardanti più gruppi di studio (talvolta più variabili) si pone come ipotesi da verificare la cosiddetta ipotesi zero:

Dettagli

STATISTICA ESERCITAZIONE 13

STATISTICA ESERCITAZIONE 13 STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla

Dettagli

Tema d esame del 15/02/12

Tema d esame del 15/02/12 Tema d esame del 15/0/1 Volendo aprire un nuovo locale, una catena di ristoranti chiede ad un consulente di valutare la posizione geografica ideale all interno di un centro abitato. A questo scopo, avvalendosi

Dettagli

Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1

Dettagli

Esercitazione 9 del corso di Statistica (parte seconda)

Esercitazione 9 del corso di Statistica (parte seconda) Esercitazione 9 del corso di Statistica (parte seconda) Dott.ssa Paola Costantini 17 Marzo 9 Esercizio 1 Esercizio Un economista del Ministero degli Esteri desidera verificare se gli accordi di negoziazione

Dettagli

Statistica multivariata Donata Rodi 08/11/2016

Statistica multivariata Donata Rodi 08/11/2016 Statistica multivariata Donata Rodi 08/11/2016 MANOVA: Multivariate Analysis of Variance Due o più variabili dipendenti quantitative Una o più variabili indipendenti categoriali (con più livelli) Residui

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione

Dettagli

Esercitazione 5 Sta/s/ca Aziendale

Esercitazione 5 Sta/s/ca Aziendale Esercitazione 5 Sta/s/ca Aziendale David Aristei 12 maggio 2015 Si è interessa/ ad analizzare le determinan/ a livello aziendale della produ>vità del lavoro (PL, in migliaia di euro per dipendente) di

Dettagli

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25 Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità

Dettagli

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

Regressione multipla

Regressione multipla Regressione multipla L obiettivo è costruire un modello probabilistico per spiegare la variabile y tramite più di una variabile indipendente x 1, x 2,..., x k. Esempio: Per un efficiente progettazione

Dettagli

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica 13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in

Dettagli

Laboratorio di Statistica 1 con R Esercizi per la Relazione. I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati

Laboratorio di Statistica 1 con R Esercizi per la Relazione. I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati Laboratorio di Statistica 1 con R Esercizi per la Relazione I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati nel corso. Esercizio 1. 1. Facendo uso dei comandi

Dettagli

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y ) Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni

Dettagli

PROBABILITÀ ELEMENTARE

PROBABILITÀ ELEMENTARE Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti

Dettagli

Cognome e Nome:... Matricola e corso di laurea:...

Cognome e Nome:... Matricola e corso di laurea:... Statistica - corso base Prof. B. Liseo Prova di esame dell 8 gennaio 2014 Cognome e Nome:................................................................... Matricola e corso di laurea:...................................................

Dettagli

lezione 5 AA Paolo Brunori

lezione 5 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove eravamo arrivati - le stime OLS ci consentono di approssimare linearmente la relazione fra una variabile dipendente (Y) e una indipendente (X) - i parametri stimati su un

Dettagli

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

Modelli Log-lineari Bivariati

Modelli Log-lineari Bivariati Modelli Log-lineari Bivariati Luca Stefanutti Università di Padova Dipartimento di Psicologia Applicata Via Venezia 8, 35131 Padova L.Stefanutti (Università di Padova) Modelli Log-lineari 1 / 71 Contenuti

Dettagli

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Lezione 1 - Mercoledì 28 Settembre 2016 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

Esercizi di Probabilità e Statistica

Esercizi di Probabilità e Statistica Esercizi di Probabilità e Statistica Samuel Rota Bulò 6 giugno 26 Statistica Esercizio Sia {X n } n una famiglia di v.a. di media µ e varianza σ 2. Verificare che X = n n X i σ 2 = n (X i µ) 2 S 2 = n

Dettagli

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie

Dettagli

Corso di Statistica Esercitazione 1.8

Corso di Statistica Esercitazione 1.8 Corso di Statistica Esercitazione.8 Test su medie e proporzioni Prof.ssa T. Laureti a.a. 202-203 Esercizio Un produttore vuole monitorare i valori dei livelli di impurità contenute nella merce che gli

Dettagli

11.2. Introduzione alla statistica 2/ed. Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici

11.2. Introduzione alla statistica 2/ed. Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici CAPITOLO 11 L ANALISI DI REGRESSIONE SOLUZIONI 11.1 a) una relazione lineare potrebbe essere appropriata b)l equazione di regressione è y cappello=0,96+0,00006 x c)olanda: y cappello=0,96+0,00006 (53560)=4,57

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 24 Outline 1 () Statistica 2 / 24 Outline 1 2 () Statistica 2 / 24 Outline 1 2 3 () Statistica 2 /

Dettagli

Casa dello Studente. Casa dello Studente

Casa dello Studente. Casa dello Studente Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino

Dettagli

Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza

Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 16/06/2016 NOME: COGNOME: MATRICOLA: Esercizio 1 Cinque lettere

Dettagli

Esercizi riassuntivi di Inferenza

Esercizi riassuntivi di Inferenza Esercizi riassuntivi di Inferenza Esercizio 1 Un economista vuole stimare il reddito medio degli abitanti di una cittadina mediante un intervallo al livello di confidenza del 95%. La distribuzione del

Dettagli

ESERCITAZIONE IV - Soluzioni

ESERCITAZIONE IV - Soluzioni umero di omicidi ESERCITAZIOE IV - Soluzioni Esercizio I. a),00 12,00 10,00 8,00 6,00 4,00 2,00 0,00 0 5 10 15 20 25 Popolazione povera (%) b) Poiché i due caratteri in analisi sono quantitativi per calcolare

Dettagli

Richiami di statistica

Richiami di statistica Richiami di statistica Eduardo Rossi 2 2 Università di Pavia (Italy) Marzo 2014 Rossi Statistica Econometria - 2014 1 / 61 Indice 1 Esempio 2 Elementi di probabilità 3 Stima 4 Verifica di ipotesi Rossi

Dettagli

La regressione lineare multipla

La regressione lineare multipla 13 La regressione lineare multipla Introduzione 2 13.1 Il modello di regressione multipla 2 13.2 L analisi dei residui nel modello di regressione multipla 9 13.3 Il test per la verifica della significatività

Dettagli

Modelli lineari generalizzati

Modelli lineari generalizzati Modelli lineari generalizzati Estensione del modello lineare generale Servono allo studio della dipendenza in media di una variabile risposta da una o più variabili antecedenti Vengono attenuate alcune

Dettagli

Test d ipotesi: confronto fra medie

Test d ipotesi: confronto fra medie Test d ipotesi: confronto fra medie Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona CONFRONTO FRA MEDIE 1) confronto fra una media campionaria e una media di popolazione

Dettagli

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.

Dettagli

Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione

Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze

Dettagli

Il modello di regressione

Il modello di regressione Il modello di regressione Capitolo e 3 A M D Marcello Gallucci Milano-Bicocca Lezione: II Concentti fondamentali Consideriamo ora questa ipotetica ricerca: siamo andati in un pub ed abbiamo contato quanti

Dettagli

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011 FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 1/9/11 ESERCIZIO 1 (+3++3) La seguente tabella riporta la distribuzione di frequenza dei valori di emoglobina nel sangue (espressi

Dettagli

Esercitazione 8 maggio 2014

Esercitazione 8 maggio 2014 Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un

Dettagli