Regressione Lineare Semplice e Correlazione
|
|
- Rosa Arena
- 6 anni fa
- Visualizzazioni
Transcript
1 Regressione Lineare Semplice e Correlazione 1
2 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y) di una variabile dipendente, in funzione del valore di un altra variabile indipendente (x 1, x, x k.) La funzione di regressione che viene individuata esprime la relazione di dipendenza in media della variabile Y dalla variabile X
3 Il modello Il modello lineare y b0 b1x y = variabile dipendente x = variabile indipendente b 0 = y-intercetta b 1 = coefficiente angolare = variabile errore y b 0 b 0 e b 1 non sono conosciuti, quindi devono essere stimati dai dati. variazione incremento b 1 = incremento/variazione x 3
4 Stima dei Coefficienti Le stime sono determinate da: Estrazione del campione dalla popolazione di riferimento Calcolo delle statistiche semplici Ricerca della migliore retta di interpolazione dei dati y La domanda è: Quale retta interpola meglio i dati? x 4
5 La retta di regressione è quella che minimizza la somma dei quadrati delle differenze tra le osservazioni e la retta Somma quadrati delle diff. = ( - 1) (4 - ) (1.5-3) (3. - 4) = 6.89 Somma quadrati delle diff. = ( -.5) (4 -.5) ( ) (3. -.5) = (1,) (,4) (3,1.5) Confrontiamo due rette La seconda è orizzontale (4,3.) La retta che interpola meglio i dati è quella a cui corrisponde la più piccola somma dei quadrati delle differenze
6 h i ih 0 1x h y ( b b ) min Derivando rispetto a b 0 e b 1 e ponendo le derivate parziali uguali a zero, otteniamo la formula L equazione di regressione che stima l equazione del modello lineare è b b 1 0 cov(x,y) s x y b 1 x ŷ b0 b1x 6
7 Esercizio 1 Esempio Relazione tra i Km effettuati e il prezzo di un auto usata Esercizio Esercizio 3 Esercizio 4 Esercizio 5 Esercizio 6 Un venditore di auto usate vuole capire la relazione tra i Km effettuati e il prezzo della macchina usata Un campione casuale di 100 auto è selezionato e i dati Trovare la retta di regressione. Esercizio 7 Auto Km. Prezzo Variabile indipendente x Variabile dipendente y 7
8 Soluzione Per calcolare b 0 and b 1 abbiamo bisogno di calcolare: Esempio 7.1 x 36,009.45; y 5,411.41; dove n = 100. cov(x,y) b1 s b 0 x y b 1 s x (x cov(x,y) n 1 x) (x 1,356, ,58,688 43,58,688 x)(y n 1 x (.031)(36,009.45) 6,533 i i i y) 1,356,56 ŷ 1 b0 b x 6, x 8
9 Prezzo No dati Km. ŷ 6, x L intercetta è b 0 = Questo è il coefficiente angolare. Per ogni chilometro addizionale, il prezzo decresce in media di L intercetta può essere interpretata come: Il prezzo delle auto che non sono mai state guidate 9
10 La variabile Errore Le ipotesi alla base del modello L errore è una parte critica del modello di regressione Devono essere soddisfatte quattro ipotesi forti sulla variabile casuale : si distribuisce in modo normale Il valore atteso di è zero ovvero E( i ) = 0 La deviazione standard di è s per tutti i valori di x ovvero E( i )= s I set di errori associati a differenti valori di y sono tutti tra loro indipendenti ovvero Cov ( i, j )=0 10
11 Per le prime tre ipotesi alla base del modello: y si distribuisce in modo normale con valore atteso E(y) = b 0 b 1 x, e deviazione standard s La deviazione standard è costante, E(y x 3 ) b 0 b 1 x 3 E(y x ) m 3 b 0 b 1 x ma il valore atteso varia con x b 0 b 1 x 1 E(y x 1 ) m 1 m x 1 x x 3 11
12 Valutazione del modello Il metodo dei minimi quadrati produce una regressione lineare anche quando non ci sia una relazione lineare tra x ed y. E importante, perciò, valutare la bontà di adattamento del modello lineare Numerosi metodi sono utilizzati per fare ciò: Test dei coefficienti Indici sintetici 1
13 Somma dei quadrati degli errori La somma dei quadrati degli scarti tra i punti e la retta di regressione è una misura di come la retta approssimi bene la nube dei punti. SSE n i1 ( y i yˆ i ) SSE (n 1)s Y cov(x,y) s x 13
14 L errore standard delle stime Il valore atteso di è uguale a 0 Se s è piccolo, gli errori tendono a concentrarsi attorno alla media (=0). Dunque il modello approssima bene i dati Così, possiamo usare s come una misura di adattabilità del modello lineare Uno stimatore non distorto di s è dato da s Errore Standard delle Stime s SSE n 14
15 Esempio. Calcolare l errore standard delle stime Esempio 7.1 Soluzione ( y ˆ ) i yi 6,434,890 sy 64,999 n 1 99 cov( X, Y ) SSE ( n 1) sy 99(64,999) s Dunque, s SSE n x,51, ( 1,356,56) 43,58,688 Calcolati prima,5,363 Il modello approssima bene i dati, soprattutto se confrontiamo s con il valore medio di y. s 151.6, y 5,
16 Test della pendenza della retta Quando non esiste una relazione lineare tra le due variabili la retta di regressione è orizzontale q qq q q q q q q q q q Relazione lineare La pendenza non è uguale a zero Relazione non lineare La pendenza è uguale a zero 16
17 Possiamo fare inferenza su b 1 partendo da b 1, facendo il seguente test di ipotesi: H 0 : b 1 = 0 H 1 : b 1 = 0 (< 0; > 0) La statistica test è t b 1 s b b 1 1 dove sb 1 s (n 1)s x Errore standard di b 1. Se la variabile casuale errore si distribuisce in modo normale la statistica è una t di Student con n- g.d. 17
18 Soluzione dell esempio Per calcolare t abbiamo bisogno dei valori di b 1 e di s b1 Esempio 7.1 b s 1 b 1 t.31 b 1 s b s (n 1)s b 1 1 x (99)(43,58, P-value= 4.4 4E-4 C è una schiacciante evidenza della dipendenza lineare del prezzo dell auto usata, dal numero di Km effettuati 18
19 Coefficiente di determinazione Quando vogliamo misurare la forza della relazione lineare, usiamo l indice di Determinazione lineare R R [cov( X, Y)] SSE o R 1 s s ( y y) x y i 19
20 Per capire tale coefficiente bisogna ricordare che : Tutta la variabilità di y Modello di Regressione L errore 0
21 Consideriamo due punti (x 1,y 1 ) e (x,y ) di un campione y y y 1 x 1 x Variazione Totale in y = Variazione espressa dalla Variazione dell errore retta di regressione (y1 y) (y y) 1 y) (ŷ y) ( ŷ ( y 1 ŷ1) (y ŷ ) 1
22 Variazione in y = SSR SSE R misura la proporzione di variabilità di y espressa dalla variabilità di x R 1 SSE (y i y) (y i y) (y i y) SSE SSR (y i y) R varia tra 0 e 1 - Quando è uguale ad 1 (R = 1), i punti giacciono sulla retta di regressione - Quando è uguale ad 0 (R = 0), non c è relazione lineare tra x e y
23 Esempio. Trovare il coefficiente di determinazione Esempio 7.1 Soluzione [cov(x,y)] [ 1,356,56 ] R (43,58,688)(64,999) sxsy.6501 Il 65% della varianza del prezzo è spiegata dalla variazione dei Km segnati dal tachimetro. Il restante 35% non viene spiegato dal modello 3
24 Uso del modello di Regressione lineare Esempio 7.1 Se siamo soddisfatti della bontà di adattamento della retta di regressione, possiamo utilizzare l equazione stimata per predire valori di y Esempio Prevedere il prezzo una una macchina con 40,000 Km ŷ x (40,000) 5,85 Esempio 7.6 4
25 Intervallo di confidenza Due sono gli intervalli importanti per le previsioni di y. Intervallo di previsione per un valore particolare di y Intervallo di confidenza per il valore atteso di y Intervallo di previsione Intervallo di confidenza ŷ t s 1 1 (x g x) n (xi x) ŷ t s 1 (x g x) n (xi x) L intervallo di previsione è più ampio dell intervallo di confidenza 5
26 Esempio Calcolare un intervallo di previsione per una macchina con 40,000 Km Soluzione L intervallo di previsione al 95% = ŷ t s 1 1 (x g x) n (xi x) Esempio 7.5 t.05,98 [ (40000)] 1.984(151.6) (40,000 36,009) 4,309,340,160 5,
27 Il venditore di auto vuole prendere un lotto di 40,000 KM. Calcolare l intervallo di confidenza per y al 95% Soluzione ŷ t s 1 n (x g x) (x i x) [ (40000)] 1.984(151.6) (40,000 36,009) 4,309,340,160 5,
28 L effetto di un valore dato di x nell intervallo Appena x g si allontana da x l intervallo diventa più grande. Il più piccolo intervallo è trovato per x. ŷ(x g x 1) ŷ(x g x 1) ŷ b 0 b1x g Intervallo 1 (xg x) ŷ t di s confidenza con x g = nx (x i x) ŷ t 1 1 s Intervallo n di confidenza (xi x) con x g = x 1 x x 1 x 1 x x ( x( x ) 1) xx 1 ( x 1) ) x 1 Intervallo di confidenza 1 ŷ t s con x g = xn (xi x) 8
29 Coefficiente di correlazione Il coefficiente di correlazione è utilizzato per misurare il legame tra due variabili. Assume un valore tra -1 e 1 Se r = -1 (associazione negativa) o r = 1 (associazione positiva) ogni punto giace sulla retta di regressione. Se r = 0 non c è legame lineare. Il coefficiente di correlazione può essere utilizzato per testare una relazione lineare tra due variabili. 9
30 Test del coefficiente di correlazione dove Quando non c è relazione lineare r = 0. Le ipotesi sono: H 0 : r = 0 H 1 : r = 0 La statistica test è: r èil calcolato n t r 1 r coefficien te di correlazione nel da r cov( X, Y ) s s x y X La statistica è una t di Student co n g.d.l. campione Y 30
31 Esempio Test di relazione lineare Effettuare un test sul coefficiente di correlazione dell esempio 7.1 per vedere se c è relazione lineare Soluzione H 0 : r = 0 H 1 : r 0 La zona di rifiuto è t > t /,n- = t.05,98 = Nel campione il coefficiente di correlazione è r=cov(x,y)/s x s y =-.806 Il valore della statistica t è n t r 1 r Conclusione: Esempio 7.1 C è sufficiente evidenza ad un livello di significatività = 5% per dire che c è un legame lineare tra le due variabili. 31
32 La Diagnostica di Regressione Prima di utilizzare un modello di regressione per fare inferenza, bisogna verificare che le ipotesi alla base del modello siano rispettate che non ci siano dati anomali che possano inficiare i risultati Come vedere se le ipotesi forti: si distribuisce in modo normale La varianza di è costante per tutti i valori di x: E( i )= s Gli errori sono tra loro indipendenti: Cov ( i, j )=0 sono rispettate? 3
33 Analisi dei residui Esempio 7.1 Analizzando i residui (o i residui standardizzati), si può vedere se ci sono violazioni alle ipotesi poste alla base del modello Non normalità Esempio Sui dati dell Esempio costruiamo gli istogrammi dei residui standardizzati Esaminiamo gli istogrammi e guardiamo alla forma della distribuzione centrata attorno allo zero 33
34 RESIDUI OUTPUT Lista praziale Osservazioni Residui Residui Standardizzati 1-50, , , , , , , , , , Per ogni residuo calcoliamo: sr i h i s 1 n 1 h i dove (xi x) (x j x) Possiamo inoltre fare il test c di normalità More 34
35 Eteroschedasticità Quando la varianza di non è costante per tutti i valori di x, allora si ha eteroschedasticità i ^ L intervallo cresce con y y^ ^y 35
36 36 y^ Residui ^y L intervallo non cresce Quando la varianza di è costante per tutti i valori di x, allora c è omoschedasticità
37 37 y^ Residui ^y E questa è una situazione migliore Quando la varianza di è costante per tutti i valori di x, allora c è omoschedasticità
38 Non indipendenza delle variabili errore Quando le variabili errore non sono indipendenti si parla di autocorrelazione dei residui (soprattutto per le Serie Storiche) Residui Esempi di autocorrelazione dei residui Residui 0 0 Tempo Tempo Andamento positivo dei residui alternato con un andamento negativo Oscillazione dei residui attorno allo zero 38
39 Outliers Un outlier è un valore o troppo piccolo o troppo grande, che può influenzare la retta di regressione e per questo deve essere identificato con un scatter-plot Un outlier Un osservazione influente ma, può influenzare ancora di più l analisi!! Gli outliers portano uno spostamento della retta di regressione 39
Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
DettagliStatistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
DettagliR - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre
R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria
DettagliStatistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
Dettaglilezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1
lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
DettagliIl modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione
DettagliLezione 18. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 18. A. Iodice
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 45 Outline 1 2 3 4 5 () Statistica 2 / 45 Modello di In molte applicazioni il ruolo delle variabili
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
DettagliRegressione lineare semplice
Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro
DettagliEsercitazione 9 del corso di Statistica (parte seconda)
Esercitazione 9 del corso di Statistica (parte seconda) Dott.ssa Paola Costantini 17 Marzo 9 Esercizio 1 Esercizio Un economista del Ministero degli Esteri desidera verificare se gli accordi di negoziazione
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DettagliREGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori
REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE
DettagliStatistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice
Esercitazione 16 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 24 Studio della relazione tra due variabili Commonly Asked Questions Qual è la relazione tra la spesa
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta
DettagliLa multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative.
Lezione 14 (a cura di Ludovica Peccia) MULTICOLLINEARITA La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative. In un modello di regressione Y= X 1, X 2, X 3
DettagliLa media e la mediana sono indicatori di centralità, che indicano un centro dei dati.
La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,
DettagliCAPITOLO 11 ANALISI DI REGRESSIONE
VERO FALSO CAPITOLO 11 ANALISI DI REGRESSIONE 1. V F Se c è una relazione deterministica tra due variabili,x e y, ogni valore dato di x,determinerà un unico valore di y. 2. V F Quando si cerca di scoprire
DettagliSommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25
Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità
DettagliStatistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali /e S Borra, A Di Ciaccio - McGraw Hill Es 6 Soluzione degli esercizi del capitolo 6 In base agli arrotondamenti effettuati nei calcoli, si possono
DettagliRegressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007
Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il costo mensile Y di produzione e il corrispondente volume produttivo X per uno dei propri stabilimenti. Volume
Dettaglii dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente
TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2
DettagliDispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
DettagliESERCITAZIONE IV - Soluzioni
umero di omicidi ESERCITAZIOE IV - Soluzioni Esercizio I. a),00 12,00 10,00 8,00 6,00 4,00 2,00 0,00 0 5 10 15 20 25 Popolazione povera (%) b) Poiché i due caratteri in analisi sono quantitativi per calcolare
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
Dettaglilezione 7 AA Paolo Brunori
AA 2016-2017 Paolo Brunori dove siamo arrivati? - se siamo interessati a studiare l andamento congiunto di due fenomeni economici - possiamo provare a misurare i due fenomeni e poi usare la lineare semplice
DettagliUniversità del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare
DettagliLezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria
Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Il concetto di interpolazione In matematica, e in particolare in
DettagliIl modello di regressione
Il modello di regressione Capitolo e 3 A M D Marcello Gallucci Milano-Bicocca Lezione: II Concentti fondamentali Consideriamo ora questa ipotetica ricerca: siamo andati in un pub ed abbiamo contato quanti
DettagliAssunzioni (Parte I)
Assunzioni (Parte I) A M D Marcello Gallucci marcello.gallucci@unimib.it Lezione 10 Modello Lineare Generale La regressione semplice e multipla e l'anova sono sottocasi del modello lineare generale (GLM)
Dettagli11.2. Introduzione alla statistica 2/ed. Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici
CAPITOLO 11 L ANALISI DI REGRESSIONE SOLUZIONI 11.1 a) una relazione lineare potrebbe essere appropriata b)l equazione di regressione è y cappello=0,96+0,00006 x c)olanda: y cappello=0,96+0,00006 (53560)=4,57
DettagliEsercizio 2: voto e ore dedicate allo studio
La seguente tabella riporta il voto riportato da 10 studenti all esame di Statistica Sociale e il numero di ore di lezione non seguite dallo studente (il corso prevede 30 ore di lezione). Ci si chiede
DettagliAnalisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:
Obiettivi: Esplicitare la correlazione esistente tra l altezza di un individuo adulto e la lunghezza del suo piede e del suo avambraccio. Idea del progetto: Il progetto nasce dall idea di acquistare scarpe
DettagliLa regressione lineare multipla
13 La regressione lineare multipla Introduzione 2 13.1 Il modello di regressione multipla 2 13.2 L analisi dei residui nel modello di regressione multipla 9 13.3 Il test per la verifica della significatività
DettagliRegressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo
Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo 1 Controllo di ipotesi sui parametri In questo contesto risulta necessario avvalersi dell assunzione di normalita
DettagliRegressione lineare con un solo regressore
Regressione lineare con un solo regressore La regressione lineare è uno strumento che ci permette di stimare e di fare inferenza sui coefficienti incogniti di una retta. Lo scopo principale è di stimare
DettagliPROBABILITÀ ELEMENTARE
Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti
DettagliAnalisi Multivariata dei Dati. Regressione Multipla
Analisi Multivariata dei Dati Regressione Multipla A M D Marcello Gallucci Milano-Bicocca Lezione: III Effetti multipli Consideriamo ora il caso in cui la variabile dipendente possa essere spiegata da
DettagliFasi del modello di regressione
Fasi del modello di regressione Specificazione del modello: scelta del tipo di funzione da utilizzare per descrivere un fenomeno; definizione delle ipotesi di base Stima dei parametri: uso di stimatori
DettagliTest delle Ipotesi Parte I
Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test
DettagliIl modello di regressione lineare multipla. Il modello di regressione lineare multipla
Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa
DettagliRingraziamenti dell Editore
Indice Elenco dei simboli e delle abbreviazioni in ordine di apparizione Ringraziamenti dell Editore XI XVII 1 Introduzione FAQ e qualcos altro, da leggere prima 1 1.1 QuestoèunlibrodiStatistica....................
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
DettagliCasa dello Studente. Casa dello Studente
Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino
DettagliREGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
DettagliSommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51
Sommario 1 I dati...15 1.1 Classificazione delle rilevazioni...17 1.1.1 Esperimenti ripetibili (controllabili)...17 1.1.2 Rilevazioni su fenomeni non ripetibili...18 1.1.3 Censimenti...19 1.1.4 Campioni...19
DettagliStatistica Applicata all edilizia: il modello di regressione
Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione
DettagliCorso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica
Corso di Laurea in Economia Aziendale Docente: Marta Nai Ruscone Statistica a.a. 2015/2016 1 Lezione 3 1) Grafico a dispersione 2) La correlazione lineare -la covarianza funzione di excel: covarianza()
DettagliVariabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.
Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:
DettagliEsercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017
Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017 Contents 1 Inferenza sulla regressione semplice 1 1.1 Test sulla pendenza della retta................................... 1 1.2 Test sull
DettagliCorso di Statistica Industriale
Corso di Statistica Industriale Corsi di Laurea Specialistica in Ingegneria Gestionale e Ingegneria Meccanica Docente: Ilia Negri Orario del corso: Martedì: dalle 14.00 alle 16.00 Venerdì: dalle 10.30
DettagliTest F per la significatività del modello
Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno
DettagliStatistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)
Statistica La statistica può essere vista come la scienza che organizza ed analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva:
DettagliPrefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura
INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI
DettagliSTATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
DettagliMODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza,
MODELLO DI REGRESSIONE LINEARE le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza, teorema di Gauss-Markov, verifica di ipotesi e test di
DettagliTest per la correlazione lineare
10 Test per la correlazione lineare Istituzioni di Matematica e Statistica 2015/16 E. Priola 1 Introduzione alla correlazione lineare Problema: In base ai dati che abbiamo possiamo dire che c è una qualche
DettagliLEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi
DettagliPROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
DettagliEsercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
DettagliStatistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati
ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona
DettagliPresentazione dell edizione italiana
1 Indice generale Presentazione dell edizione italiana Prefazione xi xiii Capitolo 1 Una introduzione alla statistica 1 1.1 Raccolta dei dati e statistica descrittiva... 1 1.2 Inferenza statistica e modelli
Dettaglilezione 9 AA Paolo Brunori
AA 2016-2017 Paolo Brunori Dove siamo arrivati? - la regressione lineare multipla ci permette di stimare l effetto della variabile X sulla Y tenendo ferme tutte le altre variabili osservabili che hanno
DettagliIntroduzione all Analisi della Varianza (ANOVA)
Introduzione all Analisi della Varianza (ANOVA) AMD Marcello Gallucci marcello.gallucci@unimib.it Variabili nella Regressione Nella regressione, la viariabile dipendente è sempre quantitativa e, per quello
DettagliTeoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
DettagliESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo
Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova Docenti: Prof. L. Salmaso, Dott. L. Corain ESERCIZI Regressione lineare semplice
Dettagli0 altimenti 1 soggetto trova lavoroentro 6 mesi}
Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta
DettagliStatistica. Matematica con Elementi di Statistica a.a. 2015/16
Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati
DettagliStatistica descrittiva in due variabili
Statistica descrittiva in due variabili 1 / 65 Statistica descrittiva in due variabili 1 / 65 Supponiamo di misurare su un campione statistico due diverse variabili X e Y. Indichiamo come al solito con
DettagliMetodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale
DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie
DettagliRegressione e Correlazione (cap. 11) Importazione dati da file di testo
Regressione e Correlazione (cap. 11) Importazione dati da file di testo Introduzione Nella statistica applicata si osserva la relazione (dipendenza) tra due o più grandezze. Esigenza: determinare una funzione
Dettaglilezione 6 AA Paolo Brunori
AA 2016-2017 Paolo Brunori consumo di tabacco in Turchia 1960-1988 fonte: Tansel, 1993, pubblicato su Applied Economics consumo di tabacco in Turchia fra il 1960 al 1988 year = anno Q = quantità pro capite
DettagliANALISI MULTIVARIATA
ANALISI MULTIVARIATA Marcella Montico Servizio di epidemiologia e biostatistica... ancora sulla relazione tra due variabili: la regressione lineare semplice VD: quantitativa VI: quantitativa Misura la
DettagliData Mining. Prova parziale del 20 aprile 2017: SOLUZIONE
Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova
DettagliIntervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da:
Analisi chimica strumentale Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da: (31.4) dove s y è la varianza dei valori
DettagliAnalisi di Regressione Multivariata. β matrice incognita dei coeff. di regressione (regr. lineare in β)
Analisi di Regressione Multivariata Regressione: metodologia per dedurre info e per anticipare risposte di una variabile dip. Modello classico di regressione lineare: Y {z} n k = {z} X β + ρ {z} {z} n
DettagliTipi di variabili. Indici di tendenza centrale e di dispersione
Tipi di variabili. Indici di tendenza centrale e di dispersione L. Boni Variabile casuale In teoria della probabilità, una variabile casuale (o variabile aleatoria o variabile stocastica o random variable)
DettagliRICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE
RICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE 1 La verifica di ipotesi Finora abbiamo visto come si utilizza una statistica campionaria per stimare
DettagliCovarianza, correlazione e retta di regressione. Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2
Covarianza, correlazione e retta di regressione Paola Lecca, CIBIO UNITN Corso di Matematica e Statistica 2 Questa presentazione è stata preparata attingendo dai seguenti testi S. M. Iacus, Statistica,
DettagliSTATISTICA. Esercizi vari
STATISTICA Esercizi vari Esercizio 5.6 p. 205 Variabile Coeff. Dev. std. Statistica t p-value Intercetta 23.384 1.592 14.691 0 Profondità -1.435 0.213-6.726 0 = 0.850 Esercizio 5.6 p. 205 Variabile Coeff.
DettagliEsercitazione 5 Sta/s/ca Aziendale
Esercitazione 5 Sta/s/ca Aziendale David Aristei 12 maggio 2015 Si è interessa/ ad analizzare le determinan/ a livello aziendale della produ>vità del lavoro (PL, in migliaia di euro per dipendente) di
DettagliEsplorazione dei dati. Lucidi e dataset tratti da Turini - Analisi dei Dati, Dip. Inf. Unipi
Esplorazione dei dati Lucidi e dataset tratti da Turini - Analisi dei Dati, Dip. Inf. Unipi Analisi mono e bivariata Si utilizzano indicatori sintetici che individuano, con un singolo valore, proprieta`
DettagliStatistica 1 A.A. 2015/2016
Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 35 Il modello di regressione
DettagliMatricola: Corso: 1. (4 Punti) Stimare la variazione del reddito quando il prezzo del prodotto finale raddoppia.
Facoltà di Economia Statistica Esame 3-12/04/2010: A Cognome, Nome: Matricola: Corso: Problema 1. Per 5 imprese imprese è stato rilevato il reddito quinquennale medio (in milioni di euro), y, e il corrispondente
Dettagliviii Indice generale
Indice generale 1 Introduzione al processo di ricerca 1 Sommario 1 Il processo di ricerca 3 Concetti e variabili 5 Scale di misura 8 Test di ipotesi 10 Evidenza empirica 10 Disegni di ricerca 11 Sintesi
DettagliIL MODELLO DI REGRESSIONE LINEARE SEMPLICE E MULTIPLA* La violazione delle ipotesi. Statistica Economica A.A. 2011/2012. Prof.ssa Tiziana Laureti
IL MODELLO DI REGRESSIONE LINEARE SEMPLICE E MULTIPLA* La violazione delle ipotesi Statistica Economica A.A. 2011/2012 Prof.ssa Tiziana Laureti *Libro di testo: Stock J.H. e Watson, M.W. Introduzione all
Dettaglilezione 8 AA Paolo Brunori
AA 2016-2017 Paolo Brunori regressione multipla con n = k Immaginate di voler studiare i determinanti del voto all esame di econometria Y = β 1 X 1 + u Y i = β 1 H i + u i H=ore studiate alla settimana
DettagliEconometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA 2014-2015 Paolo Brunori
AA 2014-2015 Paolo Brunori popolazione studiata e popolazione di interesse - popolazione studiata: popolazione da cui è stato estratto il campione - popolazione di interesse: popolazione per la quale ci
DettagliEsercitazioni di statistica
Esercitazioni di statistica Intervalli di confidenza Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 10 Dicembre 2014 Stefania Spina Esercitazioni di statistica 1/43 Stefania Spina
DettagliEsercitazione di Statistica Indici di associazione
Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza
DettagliSettimana 2. G. M. Marchetti. 4 Marzo 2017
Settimana 2 G. M. Marchetti 4 Marzo 2017 1 / 54 Mediana Un indice di posizione alternativo alla media e molto usato è la mediana È basato sull ordinamento dei dati La mediana è il valore Me tale che la
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 24 Outline 1 () Statistica 2 / 24 Outline 1 2 () Statistica 2 / 24 Outline 1 2 3 () Statistica 2 /
DettagliRegressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141
Regressione Semplice Analisi Per avere una prima idea della struttura di dipendenza fra le variabili in esame, possiamo cominciare col costruire la matrice di correlazione delle variabili presenti nel
DettagliStatistica per le ricerche di mercato. 12. Violazione delle ipotesi nel modello di regressione lineare
Statistica per le ricerche di mercato A.A. 2012/13 Dr. Luca Secondi 12. Violazione delle ipotesi nel modello di regressione lineare La violazione delle ipotesi Fino ad ora le assunzioni ipotizzate per
DettagliLEZIONE N. 11 ( a cura di MADDALENA BEI)
LEZIONE N. 11 ( a cura di MADDALENA BEI) F- test Assumiamo l ipotesi nulla H 0 :β 1,...,Β k =0 E diverso dal verificare che H 0 :B J =0 In realtà F - test è più generale H 0 :Aβ=0 H 1 :Aβ 0 A è una matrice
DettagliIndice. Prefazione all edizione italiana, di Piero Veronese » XI. Prefazione
Indice Prefazione all edizione italiana, di Piero Veronese pag. IX Prefazione 1. EE: un introduzione alle distribuzioni di probabilità e ai metodi di stima statistica 1.1. EE: incertezza e probabilità
Dettagli