MODELLO LINEARE: ESEMPI ED APPLICAZIONI
|
|
- Gennara Franceschini
- 6 anni fa
- Visualizzazioni
Transcript
1 MODELLO LINEARE: ESEMPI ED APPLICAZIONI Mario Romanazzi 1 ESEMPIO 1. PUBBLICITA E VENDITE 1.1 I DATI I dati sono le spese mensili in pubblicità (X, migliaia di dollari) e l ammontare mensile delle vendite (Y, milioni di dollari) di una catena di negozi di arredamento. > # ad: vettore delle spese mensili in pubblicità > ad <- c(23,46,60,54,28,33,25,31,36,88,90,99) > # sell: vettore delle vendite mensili > sell <- c(9.6,11.3,12.8,9.8,8.9,12.5,12,11.4,12.6,13.7,14.4,15.9) > # numerosità campionaria > n <- length(ad); n [1] 12 La stima di un modello lineare è sempre preceduta da un analisi preliminare volta a verificare le caratteristiche generali dei dati (tipologia distributiva, dati mancanti, presenza di outliers) e le ipotesi del modello, in particolare l esistenza di una relazione lineare tra le variabili. Riportiamo sotto le presentazioni ramo-foglia. La Fig. 1 mostra i diagrammi scatolabaffi. > stem(ad) The decimal point is 1 digit(s) to the right of the > stem(sell) 1
2 1 ESEMPIO 1. PUBBLICITA E VENDITE 2 The decimal point is at the > layout(matrix(1:2,nr=1,nc=2)) > boxplot(ad,ylab="spese Mensili Pubblicità") > boxplot(sell,ylab="ammontare Vendite Mensili") > layout(matrix(1)) Spese Mensili Pubblicità Ammontare Vendite Mensili Figura 1: Diagrammi scatola-baffi spese pubblicitarie e vendite mensili. La Fig. 2 mostra il diagramma di dispersione della distribuzione congiunta.
3 1 ESEMPIO 1. PUBBLICITA E VENDITE 3 > plot(ad,sell,pch=20, xlab="spese Mensili Pubblicità", + ylab="ammontare Vendite Mensili") Ammontare Vendite Mensili Spese Mensili Pubblicità Figura 2: Diagramma di dispersione spese pubblicitarie e vendite. 1.2 STATISTICHE RIASSUNTIVE Riportiamo di seguito le statistiche riassuntive di base. > # somma dati e somma dati al quadrato sia per ad che per sell > c(sum(ad),sum(ad^2)) [1] > c(sum(sell),sum(sell^2))
4 1 ESEMPIO 1. PUBBLICITA E VENDITE 4 [1] > # somma prodotti incrociati > sum(ad*sell) [1] A partire dalle statistiche riassuntive si ottengono le statistiche campionarie marginali e congiunte: medie, varianze, deviazioni standard, covarianza e correlazione. > # statistiche camp. spese pubblicitarie > mx <- mean(ad); varx <- var(ad); sdx <- sd(ad) > c(mx,varx,sdx) [1] > # statistiche camp. vendite > my <- mean(sell); vary <- var(sell); sdy <- sd(sell) > c(my,vary,sdy) [1] > # covarianza, correlazione > sxy <- cov(ad,sell); rxy <- cor(ad,sell) > c(sxy,rxy) [1] Riepiloghiamo i risultati precedenti nella Tab. 1. n i=1 x i i=1 y i i=1 x2 i i=1 y2 i i=1 x iy i x y s X s Y s X,Y r X,Y Tabella 1: Pubblicità e vendite. Statistiche riassuntive univariate e bivariate. 1.3 LA RETTA DEI MINIMI QUADRATI Il modello lineare, al livello più semplice, è un ipotesi riguardante la struttura delle variabili subordinate Y X = x, per un generico fissato valore x della variabile esplicativa. Y (X = x) = DEF α + βx + ɛ, (1)
5 1 ESEMPIO 1. PUBBLICITA E VENDITE 5 in cui α + βx µ Y (x) è la componente deterministica, una funzione lineare di x, mentre ɛ è la componente stocastica, una variabile aleatoria con valore atteso zero e deviazione standard σ ɛ, non dipendente da x (condizione di omoschedasticità). Inoltre, errori ɛ corrispondenti a distribuzioni subordinate diverse si assumono stocasticamente indipendenti. Prendendo il valore atteso dei due membri della (1) e usando E(ɛ) = 0, otteniamo E(Y X = x) = E(α + βx + ɛ) = α + βx. (2) Similmente, prendendo la varianza dei due membri della (1) e usando V ar(ɛ) = σ 2 ɛ, otteniamo V ar(y X = x) = V ar(α + βx + ɛ) = V ar(ɛ) = σ 2 ɛ. (3) In base al principio dei minimi quadrati (MQ), le stime campionarie dei coefficienti della retta sono ˆβ n = s X,Y s 2 X Inoltre, la stima campionaria non distorta di σ 2 ɛ è: s 2 ɛ = 1 n 2 = r X,Y s Y s X, (4) ˆα n = y n ˆβ n x n. (5) n i=1 e 2 i = 1 n 2 n (y i ŷ i ) 2, (6) dove ŷ i ˆα n + ˆβ n x i sono le previsioni dei dati y i ricavate dal modello lineare stimato. Ricordiamo che queste previsioni non sono altro che le stime di E(Y X = x i ), i valori attesi delle distribuzioni subordinate Y X = x i, i = 1,..., n. Le funzioni R riportate sotto calcolano i valori delle stime insieme con le statistiche che ne valutano il grado di accostamento ai dati, in particolare la statistica R 2 = r 2 X,Y. La Fig. 3 mostra il grafico di dispersione e la retta MQ stimata. E anche visualizzato il centroide, il punto di coordinate x n, y n, che appartiene sempre alla retta MQ campionaria. > # stima coefficiente angolare (beta cappello) > betah <- sxy/varx; betah [1] > # formula equivalente > betah <- rxy*sdy/sdx; betah [1] > # stima intercetta (alfa cappello) > alfah <- my-betah*mx; alfah i=1
6 1 ESEMPIO 1. PUBBLICITA E VENDITE 6 [1] > c(alfah,betah) [1] > # indice di bontà retta mq (R^2) > R2 <- rxy^2; R2 [1] > # scomposizione devianza Y > # devianza "spiegata" dal modello > devsp <- (n-1)*vary*r2; devsp [1] > # devianza "non spiegata" dal modello ("dei residui") > devres <- (n-1)*vary*(1-r2); devres [1] > # stima non distorta varianza ed sd dei residui > varres <- devres/(n-2); sdres <- sqrt(varres) > c(varres, sdres) [1] > plot(ad,sell,pch=20, xlab="spese Mensili Pubblicità", + ylab="ammontare Vendite Mensili") > abline(a=alfah,b=betah,lty="dashed",lwd=2,col="red") > points(mx,my,pch="*",cex=2,col="red") La retta MQ campionaria è dunque: ŷ = x. (7) Importante l interpretazione: in media, un aumento di 1000 dollari delle spese pubblicitarie mensili produce un aumento di circa dollari del corrispettivo delle vendite mensili. Per una spesa in pubblicità di dollari ci aspettiamo un ammontare di vendite pari a = ± 1.35 milioni di dollari.
7 1 ESEMPIO 1. PUBBLICITA E VENDITE 7 Ammontare Vendite Mensili * Spese Mensili Pubblicità Figura 3: Diagramma di dispersione con retta MQ e centroide. 1.4 ACCURATEZZA DELLA STIMA DEL COEFFICIENTE ANGOLARE Nell interpretazione della retta MQ campionaria, e della sua accuratezza come stima della retta MQ della popolazione, riveste un importanza particolare il coefficiente angolare ˆβ n = s X,Y /s 2 X. Si vuole soprattutto controllare l ipotesi β = 0, corrispondente all indipendenza lineare delle variabili e dunque alla non rilevanza di X come fattore esplicativo di Y, almeno nel quadro della linearità. A tale proposito si dimostra che 1. E( ˆβ n ) = β, 2. SD( ˆβ n ) = σ ɛ / (n 1)s 2 X,
8 1 ESEMPIO 1. PUBBLICITA E VENDITE 8 3. se, in aggiunta alle precedenti ipotesi sul modello lineare, aggiungiamo l ipotesi di normalità, Y (X = x) N(α + βx, σ ɛ ), allora ˆβ n N(β, σ ɛ / (n 1)s 2 X ), 4. valendo (1), (2) e (3), la variabile standardizzata (con l SE stimato) ( ˆβ n β)/ŝe( ˆβ n ) ha una distribuzione t di Student con n 2 gradi di libertà e quindi l intervallo di confidenza per β di livello 1 α è s ɛ ˆβ n ± t n 2;1 α/2. (8) (n 1)s 2 X Se il precedente intervallo include il valore zero, tenuto conto dell errore di campionamento, non si può escludere che, nella popolazione, il coefficiente angolare β sia nullo. Questo suonerebbe come una sconfessione del modello lineare. Il codice R sottostante calcola l errore standard stimato di ˆβ n e l intervallo di confidenza per β di livello Quest ultimo non include il valore zero, il che conferma la rilevanza della variabile X come fattore esplicativo per Y. Il risultato viene confermato anche ad un livello di confidenza > # errore standard stima camp. beta > sebetah <- sdres/sqrt((n-1)*varx); sebetah [1] > # intervalli di confidenza 95% e 99% > c(betah - qt(0.975,df=n-2)*sebetah, betah + qt(0.975,df=n-2)*sebetah) [1] > c(betah - qt(0.995,df=n-2)*sebetah, betah + qt(0.995,df=n-2)*sebetah) [1] CONTROLLO DELLE IPOTESI SUL TERMINE D ER- RORE Il modello lineare introduce ipotesi molto restrittive sul termine d errore ɛ che vengono controllate a posteriori sulla base dei residui stimati e i, i = 1,..., n. Innanzitutto, il modello implica che i residui standardizzati e i;st = e i /s e, i = 1,..., n, abbiano approssimativamente una distribuzione normale standard (è facile provare che la media campionaria degli e i è nulla). Un ramo foglia, un diagramma scatola baffi o un istogramma permettono un controllo grafico informale di questa ipotesi. Il codice R sottostante calcola i residui standardizzati e produce il ramo foglia e il diagramma scatola baffi.
9 2 ESEMPIO 2. FUMO E MORTALITA PER LEUCEMIA 9 > # vendite stimate > yhat <- alfah + betah * ad > # residui stimati > res <- sell - yhat > # residui standardizzati > resst <- res/sdres > stem(resst) The decimal point is at the > boxplot(resst,ylab="residui standardizzati",main="spese Pubblicitarie e Vendite") La Fig. 4 mostra una certa asimmetria ma tutti i residui sono compresi nell intervallo ( 2, 2). Un altra fondamentale ipotesi è l indipendenza stocastica dei residui corrispondenti a diversi valori della variabile esplicativa. Un controllo grafico informale si ottiene dal diagramma di dispersione della variabile esplicativa e dei residui o dei valori stimati della variabile risposta e dei residui. Il diagramma non dovrebbe suggerire alcun tipo di relazione tra le variabili. > layout(matrix(1:2,nr=1,nc=2)) > plot(ad,resst,xlab="spese pubblicitarie",ylab="residui standardizzati") > abline(h=0,lty="dashed",col="red") > plot(yhat,resst,xlab="vendite stimate",ylab="residui standardizzati") > abline(h=0,lty="dashed",col="red") > layout(matrix(1)) Come mostra la Fig. relazione tra le variabili. 5 i diagrammi di dispersione non suggeriscono alcun tipo di 2 ESEMPIO 2. FUMO E MORTALITA PER LEUCEMIA I dati sono presi dall Es. 8 Cap La variabile X fornisce il numero di sigarette pro capite fumate in un anno in un campione di stati USA, la variabile Y fornisce il numero di morti per leucemia per abitanti registrati in un anno. Il problema base (comune a tante ricerche epidemiologiche) è valutare la rilevanza del fumo come fattore esplicativo della mortalità per leucemia.
10 2 ESEMPIO 2. FUMO E MORTALITA PER LEUCEMIA 10 Spese Pubblicitarie e Vendite Residui standardizzati Figura 4: Diagramma scatola baffi dei residui standardizzati. > # sig: numero sigarette > sig <- c(2860,2010,2791,2618,2212,2184,2344,2692,2206,2914,3034,4240,1400,2257) > # leu: mortalità per leucemia > leu <- c(7.06,6.62,7.27,7.00,7.69,7.42,6.41,6.89,8.28,7.23,4.90,6.67,6.71,7.02) > # numerosità campionaria > n <- length(sig); n [1] 14 Come per l esempio precedente, calcoliamo le statistiche riassuntive di base e riepiloghiamo i risultati nella Tab. 2. La retta MQ campionaria risulta (vedi Fig. 6) ŷ = x (9)
11 2 ESEMPIO 2. FUMO E MORTALITA PER LEUCEMIA 11 Spese Pubblicitarie e Vendite Spese Pubblicitarie e Vendite Residui standardizzati Residui standardizzati Spese pubblicitarie Vendite stimate Figura 5: Diagrammi di dispersione variabile esplicativa, residui (a sinistra) e variabile risposta stimata, residui (a destra). ed inoltre s ɛ = , ŜE( ˆβ n ) = (10) L intervallo di confidenza 95% per β ( , ) (11) include il valore zero il che significa che non si può escludere che a livello di popolazione sia β = 0. Cioè, il consumo di sigarette non rappresenta un fattore esplicativo della mortalità
12 3 ESEMPIO 3. ANDAMENTO TEMPORALE DEL CONSUMO DI BEVANDE ALCOLICHE12 n i=1 x i i=1 y i i=1 x2 i i=1 y2 i i=1 x iy i x y s X s Y s X,Y r X,Y Tabella 2: Consumo di sigarette e mortalità per leucemia. Statistiche riassuntive univariate e bivariate. leucemica, almeno nel quadro della linearità. Ricordiamo che il coefficiente di correlazione campionario è circa 0.25! Il consumo di sigarette è invece un fattore esplicativo altamente significativo della mortalità per cancro del polmone (vedi Es. 6, C. 12.5). 3 ESEMPIO 3. ANDAMENTO TEMPORALE DEL CONSUMO DI BEVANDE ALCOLICHE I dati descrivono l andamento temporale (dal 2001 al 2012, manca il dato del 2004) della % di persone di 14 anni e più che consumano bevande alcoliche tutti i giorni (fonte: ISTAT, L uso e abuso di alcol in Italia, 2012). Ci proponiamo di stimare il trend temporale del fenomeno e di valutare se è stabile o crescente / decrescente. La variabile esplicativa è il tempo, con modalità 2001,..., 2012; la variabile risposta è la % di consumatori di bevande alcoliche rilevata annualmente. Un utile modello di partenza è quello lineare. La Fig. 7 suggerisce un trend decrescente. > # vettore degli anni di rilevazione > anni <- 2001:2012 > # vettore delle % di consumo di bevande alcoliche > alcol <- c(34.8, 34.5, 32.1, NA, 32.1, 30.6, 30.3, 28.3, 27.8, 27.2, , 24.4) > # numerosità campionaria > n <- length(alcol) > n [1] 12 > plot(anni,alcol,ylim=c(0,100),xlab="anni",ylab="consumatori quotidiani (%)", + main="consumo di Bevande Alcoliche, ITALIA ",sub="Fonte: ISTAT") La Tab. 3 riporta le statistiche di sintesi. Il 2004, mancando il dato della variabile dipendente, non è considerato. Riportiamo di seguito le stime campionarie dei parametri del modello lineare.
13 3 ESEMPIO 3. ANDAMENTO TEMPORALE DEL CONSUMO DI BEVANDE ALCOLICHE13 Mortalità leucemica * Consumo annuo di sigarette Figura 6: Diagramma di dispersione consumo di sigarette e mortalità leucemica, con retta MQ e centroide. ˆβ n = s X,Y , s 2 X ˆα n = y n ˆβ n x n , s 2 ɛ = 1 n 2 n i=1 e 2 i = (n 1)(1 R2 )s 2 Y n 2 s ɛ = s 2 ɛ , ŜE( ˆβ s ɛ n ) = (n 1)s 2 X , L equazione della retta MQ stimata è (vedi Fig. 8) ŷ = x.
14 3 ESEMPIO 3. ANDAMENTO TEMPORALE DEL CONSUMO DI BEVANDE ALCOLICHE14 Consumo di Bevande Alcoliche, ITALIA Consumatori quotidiani (%) Anni Fonte: ISTAT Figura 7: Diagramma di dispersione della % di consumatori di bevande alcoliche. Il risultato conferma il trend decrescente già evidente nel diagramma di dispersione: il modello stima una diminuzione annuale dei consumatori abituali di bevande alcoliche pari a %. Il grado di accostamento ai dati è molto buono (R %). Una semplice applicazione è la stima del dato mancante del ŷ = (2004) Questo risultato va interpretato come la stima della media della distribuzione subordinata Y X = Per valutare statisticamente il modello consideriamo il test H 0 : β = 0, contro l alternativa H 0 : β 0. La statistica test è ˆβ n β 0 ŜE( ˆβ n ) = ˆβn ŜE( ˆβ n )
15 3 ESEMPIO 3. ANDAMENTO TEMPORALE DEL CONSUMO DI BEVANDE ALCOLICHE15 n i=1 x i i=1 y i i=1 x2 i i=1 y2 i i=1 x iy i x y s X s Y s X,Y r X,Y Tabella 3: Consumo di bevande alcoliche in Italia, Statistiche riassuntive univariate e bivariate. e la sua determinazione campionaria è / , da confrontare con la distribuzione t con n 2 = 9 gradi di libertà. Le proprietà di tale distribuzione ci dicono che questo valore è lontanissimo dal centro, inducendoci a rifiutare H 0. Dunque la stima del coefficiente angolare della retta è significativamente diversa da zero, il che conferma la rilevanza del trend temporale. Notiamo che la regione di non rifiuto al livello di significatività dell 1% è (t 9;0.005, t 9;0.995) = ( , ), mentre il valore p è P ( t ) , quindi inferiore a un milionesimo! Le funzioni R per il calcolo di queste quantità sono riportate di seguito. > # regione di non rifiuto di H0 : beta = 0 (liv. sign. 1%) > c(qt(0.005,df=9),qt(0.995,df=9)) [1] > # valore p > 2*pt(-16.38,df=9) [1] e-08 L intervallo di confidenza di livello 95% per β è ˆβ n ± t 9;0.975 ŜE( ˆβ n ) = ± ( ) ( 1.01, 0.76). Questo risultato conferma il trend decrescente del fenomeno. L analisi dei residui standardizzati (vedi ramo-foglia sottostante e Fig. 9) non evidenzia deviazioni importanti dalle ipotesi del modello lineare. > # diagramma ramo-foglia residui standardizzati > stem(scale(rmqalcol$residuals)) The decimal point is at the
16 3 ESEMPIO 3. ANDAMENTO TEMPORALE DEL CONSUMO DI BEVANDE ALCOLICHE16 Consumo di Bevande Alcoliche, ITALIA Consumatori quotidiani (%) * Anni Fonte: ISTAT Figura 8: Diagramma di dispersione della % di consumatori di bevande alcoliche con centroide e retta MQ. > layout(matrix(1:2,nr=1,nc=2)) > plot(df$anni,scale(rmqalcol$residuals),xlab="anni", + ylab="residui standardizzati") > abline(h=0,lty="dashed",col="red") > plot(rmqalcol$fitted.values,scale(rmqalcol$residuals), + xlab="% stimate",ylab="residui standardizzati") > abline(h=0,lty="dashed",col="red") > layout(matrix(1))
17 3 ESEMPIO 3. ANDAMENTO TEMPORALE DEL CONSUMO DI BEVANDE ALCOLICHE17 Residui standardizzati Residui standardizzati Anni % stimate Figura 9: Diagrammi di dispersione variabile esplicativa, residui (a sinistra) e variabile risposta stimata, residui (a destra).
Prova Pratica di Statistica I+II - Prof. M. Romanazzi
1 Università di Venezia - Corso di Statistica I + II (Cb-Ga) Prova Pratica di Statistica I+II - Prof. M. Romanazzi 3 Giugno 2008 Cognome e Nome............................................ N. Matricola............
DettagliEsame di Statistica A-Di Prof. M. Romanazzi
1 Università di Venezia Esame di Statistica A-Di Prof. M. Romanazzi 25 Maggio 2015 Cognome e Nome..................................... N. Matricola.......... Valutazione Il punteggio massimo teorico di
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
DettagliR - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre
R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta
DettagliStatistica 1 A.A. 2015/2016
Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 35 Il modello di regressione
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
DettagliStatistica Applicata all edilizia: il modello di regressione
Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliRegressione lineare semplice
Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro
DettagliStatistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
DettagliDispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
DettagliIl modello di regressione lineare multipla. Il modello di regressione lineare multipla
Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa
DettagliRegressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
DettagliLezione 18. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 18. A. Iodice
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 45 Outline 1 2 3 4 5 () Statistica 2 / 45 Modello di In molte applicazioni il ruolo delle variabili
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
DettagliSTATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
DettagliAnalisi di Regressione Multivariata. β matrice incognita dei coeff. di regressione (regr. lineare in β)
Analisi di Regressione Multivariata Regressione: metodologia per dedurre info e per anticipare risposte di una variabile dip. Modello classico di regressione lineare: Y {z} n k = {z} X β + ρ {z} {z} n
DettagliPresentazione dell edizione italiana
1 Indice generale Presentazione dell edizione italiana Prefazione xi xiii Capitolo 1 Una introduzione alla statistica 1 1.1 Raccolta dei dati e statistica descrittiva... 1 1.2 Inferenza statistica e modelli
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
DettagliMODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza,
MODELLO DI REGRESSIONE LINEARE le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza, teorema di Gauss-Markov, verifica di ipotesi e test di
DettagliCHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
DettagliVariabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.
Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:
DettagliRingraziamenti dell Editore
Indice Elenco dei simboli e delle abbreviazioni in ordine di apparizione Ringraziamenti dell Editore XI XVII 1 Introduzione FAQ e qualcos altro, da leggere prima 1 1.1 QuestoèunlibrodiStatistica....................
DettagliSommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51
Sommario 1 I dati...15 1.1 Classificazione delle rilevazioni...17 1.1.1 Esperimenti ripetibili (controllabili)...17 1.1.2 Rilevazioni su fenomeni non ripetibili...18 1.1.3 Censimenti...19 1.1.4 Campioni...19
DettagliEsercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
DettagliGiorno n. clienti di attesa
Esercizio 1 Un aspetto cruciale per la qualità del servizio ai clienti in un supermercato è il cosiddetto checkout (ovvero il tempo che il cliente impiega dal momento in cui si mette in fila alla cassa
DettagliRegressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo
Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo 1 Controllo di ipotesi sui parametri In questo contesto risulta necessario avvalersi dell assunzione di normalita
DettagliSTATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:
esercitazione 7 p. 1/13 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: 20-05-2004 Luca Monno Università degli studi di Pavia luca.monno@unipv.it http://www.lucamonno.it
DettagliZIBALDONE DEL CORSO DI STATISTICA A Di
ZIBALDONE DEL CORSO DI STATISTICA A Di Mario Romanazzi 1 Argomenti non compresi in Ross, Introductory Statistics 1.1 Definizione di outlier secondo Tukey Il punto di partenza di Tukey è la regola empirica
DettagliEsame di Statistica A-Di Prof. M. Romanazzi
1 Università di Venezia Esame di Statistica A-Di Prof. M. Romanazzi 22 Gennaio 2016 Cognome e Nome..................................... N. Matricola.......... Valutazione Il punteggio massimo teorico di
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
DettagliFasi del modello di regressione
Fasi del modello di regressione Specificazione del modello: scelta del tipo di funzione da utilizzare per descrivere un fenomeno; definizione delle ipotesi di base Stima dei parametri: uso di stimatori
DettagliPROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
DettagliStatistica descrittiva in due variabili
Statistica descrittiva in due variabili 1 / 65 Statistica descrittiva in due variabili 1 / 65 Supponiamo di misurare su un campione statistico due diverse variabili X e Y. Indichiamo come al solito con
DettagliRegressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007
Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il costo mensile Y di produzione e il corrispondente volume produttivo X per uno dei propri stabilimenti. Volume
DettagliTest F per la significatività del modello
Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno
DettagliTest delle Ipotesi Parte I
Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test
DettagliTest per la correlazione lineare
10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche
DettagliStatistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati
ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona
DettagliREGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori
REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE
DettagliCognome e Nome:... Corso di laurea:...
Statistica - corso base Prof. B. Liseo Prova di esame dell 8 gennaio 201 Cognome e Nome:................................................................... Corso di laurea:.......................................................................
Dettaglilezione 7 AA Paolo Brunori
AA 2016-2017 Paolo Brunori dove siamo arrivati? - se siamo interessati a studiare l andamento congiunto di due fenomeni economici - possiamo provare a misurare i due fenomeni e poi usare la lineare semplice
DettagliSettimana 3. G. M. Marchetti. Marzo 2017
Settimana 3 G. M. Marchetti Marzo 2017 1 / 26 Prima parte Relazioni tra variabili e regressione lineare 2 / 26 Una legge fisica approssimata Il fisico scozzese Forbes 3 / 26 L esperimento di Forbes Sulla
DettagliEsercizio 2: voto e ore dedicate allo studio
La seguente tabella riporta il voto riportato da 10 studenti all esame di Statistica Sociale e il numero di ore di lezione non seguite dallo studente (il corso prevede 30 ore di lezione). Ci si chiede
DettagliContenuti: Capitolo 14 del libro di testo
Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DettagliEsercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017
Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017 Contents 1 Inferenza sulla regressione semplice 1 1.1 Test sulla pendenza della retta................................... 1 1.2 Test sull
DettagliLEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi
Dettaglilezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1
lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,
DettagliConfronto tra due popolazioni Lezione 6
Last updated May 9, 06 Confronto tra due popolazioni Lezione 6 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura I anno, II semestre Concetti visti nell ultima lezione Le media
Dettagliobbligatorio - n. iscrizione sulla lista
02.09.2015 - appello di STATISTICA per studenti ENE - docente: E. Piazza obbligatorio - n. iscrizione sulla lista il presente elaborato si compone di 5 (cinque) pagine se non ve lo ricordate siete fritti;
DettagliData Mining. Prova parziale del 20 aprile 2017: SOLUZIONE
Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova
Dettagli1.4. Siano X B(1, 1/2) e Y B(1, 1/2) variabili aleatorie indipendenti. Quale delle seguenti affermazioni é falsa? E(X + Y ) = 1 V ar(x + Y ) = 1/2
Statistica N. Crediti: Cognome: Laurea Triennale in Biologia Nome: 4 settembre 2012 Matricola: 1. Parte A 1.1. Siano x 1, x 2,..., x 10 i dati relativi al peso di 10 neonati espressi in chilogrammi e y
DettagliCorso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010 Statistica Esercitazione 4 12 maggio 2010 Dipendenza in media. Covarianza e
DettagliStatistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza
DettagliN.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.
N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume
DettagliAnalisi della regressione multipla
Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,
Dettaglii dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente
TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2
DettagliTRACCIA DI STUDIO. Test di confronto per misure qualitative. Verifica di ipotesi
TRACCIA DI STUDIO Verifica di ipotesi Nelle analisi statistiche di dati sperimentali riguardanti più gruppi di studio (talvolta più variabili) si pone come ipotesi da verificare la cosiddetta ipotesi zero:
DettagliSTATISTICA ESERCITAZIONE 13
STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla
DettagliTema d esame del 15/02/12
Tema d esame del 15/0/1 Volendo aprire un nuovo locale, una catena di ristoranti chiede ad un consulente di valutare la posizione geografica ideale all interno di un centro abitato. A questo scopo, avvalendosi
DettagliEsame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).
Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1
DettagliEsercitazione 9 del corso di Statistica (parte seconda)
Esercitazione 9 del corso di Statistica (parte seconda) Dott.ssa Paola Costantini 17 Marzo 9 Esercizio 1 Esercizio Un economista del Ministero degli Esteri desidera verificare se gli accordi di negoziazione
DettagliStatistica multivariata Donata Rodi 08/11/2016
Statistica multivariata Donata Rodi 08/11/2016 MANOVA: Multivariate Analysis of Variance Due o più variabili dipendenti quantitative Una o più variabili indipendenti categoriali (con più livelli) Residui
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione
DettagliEsercitazione 5 Sta/s/ca Aziendale
Esercitazione 5 Sta/s/ca Aziendale David Aristei 12 maggio 2015 Si è interessa/ ad analizzare le determinan/ a livello aziendale della produ>vità del lavoro (PL, in migliaia di euro per dipendente) di
DettagliSommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25
Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità
DettagliIl modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.
DettagliRegressione multipla
Regressione multipla L obiettivo è costruire un modello probabilistico per spiegare la variabile y tramite più di una variabile indipendente x 1, x 2,..., x k. Esempio: Per un efficiente progettazione
DettagliΣ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica
13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in
DettagliLaboratorio di Statistica 1 con R Esercizi per la Relazione. I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati
Laboratorio di Statistica 1 con R Esercizi per la Relazione I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati nel corso. Esercizio 1. 1. Facendo uso dei comandi
Dettaglix, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni
DettagliPROBABILITÀ ELEMENTARE
Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti
DettagliCognome e Nome:... Matricola e corso di laurea:...
Statistica - corso base Prof. B. Liseo Prova di esame dell 8 gennaio 2014 Cognome e Nome:................................................................... Matricola e corso di laurea:...................................................
Dettaglilezione 5 AA Paolo Brunori
AA 2016-2017 Paolo Brunori dove eravamo arrivati - le stime OLS ci consentono di approssimare linearmente la relazione fra una variabile dipendente (Y) e una indipendente (X) - i parametri stimati su un
DettagliEsercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)
Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale) Esercizio 1: Un indagine su 10.000 famiglie ha dato luogo, fra le altre, alle osservazioni riportate nella
DettagliStatistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
DettagliModelli Log-lineari Bivariati
Modelli Log-lineari Bivariati Luca Stefanutti Università di Padova Dipartimento di Psicologia Applicata Via Venezia 8, 35131 Padova L.Stefanutti (Università di Padova) Modelli Log-lineari 1 / 71 Contenuti
DettagliUniversità degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1
Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Lezione 1 - Mercoledì 28 Settembre 2016 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,
DettagliEsercizi di Probabilità e Statistica
Esercizi di Probabilità e Statistica Samuel Rota Bulò 6 giugno 26 Statistica Esercizio Sia {X n } n una famiglia di v.a. di media µ e varianza σ 2. Verificare che X = n n X i σ 2 = n (X i µ) 2 S 2 = n
DettagliMetodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale
DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie
DettagliCorso di Statistica Esercitazione 1.8
Corso di Statistica Esercitazione.8 Test su medie e proporzioni Prof.ssa T. Laureti a.a. 202-203 Esercizio Un produttore vuole monitorare i valori dei livelli di impurità contenute nella merce che gli
Dettagli11.2. Introduzione alla statistica 2/ed. Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici
CAPITOLO 11 L ANALISI DI REGRESSIONE SOLUZIONI 11.1 a) una relazione lineare potrebbe essere appropriata b)l equazione di regressione è y cappello=0,96+0,00006 x c)olanda: y cappello=0,96+0,00006 (53560)=4,57
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 24 Outline 1 () Statistica 2 / 24 Outline 1 2 () Statistica 2 / 24 Outline 1 2 3 () Statistica 2 /
DettagliCasa dello Studente. Casa dello Studente
Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino
DettagliCorso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza
Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 16/06/2016 NOME: COGNOME: MATRICOLA: Esercizio 1 Cinque lettere
DettagliEsercizi riassuntivi di Inferenza
Esercizi riassuntivi di Inferenza Esercizio 1 Un economista vuole stimare il reddito medio degli abitanti di una cittadina mediante un intervallo al livello di confidenza del 95%. La distribuzione del
DettagliESERCITAZIONE IV - Soluzioni
umero di omicidi ESERCITAZIOE IV - Soluzioni Esercizio I. a),00 12,00 10,00 8,00 6,00 4,00 2,00 0,00 0 5 10 15 20 25 Popolazione povera (%) b) Poiché i due caratteri in analisi sono quantitativi per calcolare
DettagliRichiami di statistica
Richiami di statistica Eduardo Rossi 2 2 Università di Pavia (Italy) Marzo 2014 Rossi Statistica Econometria - 2014 1 / 61 Indice 1 Esempio 2 Elementi di probabilità 3 Stima 4 Verifica di ipotesi Rossi
DettagliLa regressione lineare multipla
13 La regressione lineare multipla Introduzione 2 13.1 Il modello di regressione multipla 2 13.2 L analisi dei residui nel modello di regressione multipla 9 13.3 Il test per la verifica della significatività
DettagliModelli lineari generalizzati
Modelli lineari generalizzati Estensione del modello lineare generale Servono allo studio della dipendenza in media di una variabile risposta da una o più variabili antecedenti Vengono attenuate alcune
DettagliTest d ipotesi: confronto fra medie
Test d ipotesi: confronto fra medie Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona CONFRONTO FRA MEDIE 1) confronto fra una media campionaria e una media di popolazione
DettagliStatistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2011/2012 Statistica Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate.
DettagliMetodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione
Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze
DettagliIl modello di regressione
Il modello di regressione Capitolo e 3 A M D Marcello Gallucci Milano-Bicocca Lezione: II Concentti fondamentali Consideriamo ora questa ipotetica ricerca: siamo andati in un pub ed abbiamo contato quanti
DettagliFACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011
FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 1/9/11 ESERCIZIO 1 (+3++3) La seguente tabella riporta la distribuzione di frequenza dei valori di emoglobina nel sangue (espressi
DettagliEsercitazione 8 maggio 2014
Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un
Dettagli