STATISTICA A D (72 ore)
|
|
- Faustino Caselli
- 5 anni fa
- Visualizzazioni
Transcript
1 STATISTICA A D (72 ore) Marco Riani mriani@unipr.it Richiami sulla regressione Marco Riani, Univ. di Parma 1
2 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta una retta: a = ordinata all origine intercetta b = coeff. angolare coeff. di regressione e i è un termine di errore (accidentale) RETTA DI REGRESSIONE i = 1,, n = valore teorico (valore stimato) di y i funzione lineare di i = 1,, n Residui Marco Riani, Univ. di Parma 2
3 Come si calcolano i parametri a e b? METODO DEI MINIMI QUADRATI Le incognite sono i parametri della retta Visualizzazione grafica dei residui Marco Riani, Univ. di Parma 3
4 Sistema di equazioni normali Formule per il calcolo di a e b a e b sono funzioni lineari delle osservazioni y i Marco Riani, Univ. di Parma 4
5 ESEMPIO (7 supermercati) N. dipendenti (X) Fatturato in milioni di (Y) A 10 1,9 B 18 3,1 C 20 3,2 D 8 1,5 E 30 6,2 F 12 2,8 G 14 2,3 Scatter con retta di regressione Come variano le vendite in funzione del numero di dipendenti? Marco Riani, Univ. di Parma 5
6 Calcolo di a e b x i y i x 2 i y 2 i x i y i A 10 1, ,61 19 B 18 3, ,61 55,8 C 20 3, ,24 64 D 8 1,5 E 30 6,2 F 12 2,8 G 14 2,3 Tot ,28 402,6 Calcolo di a e b x i y i x 2 i y 2 i x i y i A 10 1, ,61 19 B 18 3, ,61 55,8 C 20 3, ,24 64 D 8 1,5 E 30 6,2 F 12 2,8 G 14 2,3 Tot ,28 402,6 Marco Riani, Univ. di Parma 6
7 BONTA DI ADATTAMENTO Retta di regressione: DEVIANZA TOTALE DEVIANZA DI REGRESSIONE DEVIANZA RESIDUA Indice di determinazione lineare (R 2 ) δ =1 δ =0 se se Marco Riani, Univ. di Parma 7
8 Grafico dei residui Modello soddisfacente: distribuzione casuale dei residui componente erratica ESTRAPOLAZIONE Si tenta di valutare in maniera attendibile il valore che assumerà la variabile dipendente in corrispondenza di un valore noto della variabile esplicativa. CONDIZIONI Validità della retta di regressione (δ prossimo ad 1) valore noto della variabile esplicativa non lontano dai valori utilizzati nel calcolo della retta Marco Riani, Univ. di Parma 8
9 Regressione inferenziale Introduzione agli elementi aleatori Introduzione agli elementi aleatori N. dipendent i (X) Vendite in milioni di (Y) A 10 1,9 B 18 3,1 C 20 3,2 D 8 1,5 E 30 6,2 F 12 2,8 G 14 2,3 Prezzi in Euro (x) Vendite (Y) A B C D E F G H Marco Riani, Univ. di Parma 9
10 Introduzione agli elementi aleatori Le vendite sono dovute in parte ai prezzi e in parte a fattori di natura aleatoria e perciò sono esse stesse delle v.c. Al contrario i dipendenti e/o i prezzi non sono v.c. poiché sono del tutto prevedibili dalla compagnia che li stabilisce Introduzione agli elementi aleatori Una successione di valori fissi x 1, x 2, x n a cui sono associate n v.c. indipendenti Y 1, Y 2, Y n Il punto cruciale consiste nel descrivere in modo appropriato tali v.c. E(Y i )? var(y i )? Distribuzione di Y i? Marco Riani, Univ. di Parma 10
11 Assunzioni su Y i Tutte le osservazioni sono caratterizzate dallo stesso grado di incertezza var(y i ) = σ 2 i=1, 2,, n σ 2 è un parametro incognito da stimare cov(y i, Y j )=0 i j Assunzioni su Y i E(Y i ) = µ i i=1, 2,, n i valori osservati della variabili dipendente provengono da n distribuzioni di probabilità con medie incognite Ip. le medie delle distribuzioni variano linearmente con la variabili indipendente µ i = E(Y i ) = α+β x i Marco Riani, Univ. di Parma 11
12 Assunzioni su Y i (continua) Ip: µ i = E(Y i ) = α+β x i Questa ipotesi equivale ad affermare che i punti (x 1, µ 1 ), (x 2, µ 2 ),, (x n, µ n ) stiano tutti su una retta con parametri α, β Oss: questa assunzione non implica che tutti i punti (x i, y i ) stiano sulla retta ma che i valori medi delle distribuzioni da cui i punti provengono verificano l equazione della retta Interpretazione di α e β I parametri α e β rappresentano l intercetta ed il coeff. angolare della retta sulla quale giacciono le medie incognite delle distribuzioni Y 1,, Y n Marco Riani, Univ. di Parma 12
13 Interpretazione di α e β E(Y 3 )=α+βx 3 E(Y 2 )=α+βx 2 E(Y 1 )=α+βx 1 Osservazione sulla notazione In queste slide utilizziamo la notazione α per indicare l intercetta nella popolazione β per indicare la pendenza nella popolazione per indicare lo stimatore e la stima di α per indicare lo stimatore e la stima di β Marco Riani, Univ. di Parma 13
14 Notazione utilizzata nel testo Nel testo si usa la notazione β 0 per indicare l intercetta nella popolazione B 0 per indicare lo stimatore dell intercetta e b 0 per indicare la stima dell intercetta Nel testo si usa la notazione β 1 per indicare la pendenza nella popolazione B 1 per indicare lo stimatore della pendenza e b 1 per indicare la stima della pendenza Osservazione Dato il modello di regressione Y i = α +β x i +ε i L ip: µ i = E(Y i ) = α+β x i equivale ad affermare che E(ε i )=0 Marco Riani, Univ. di Parma 14
15 Stima dei parametri I parametri da stimare sono α, β, µ 1, µ 2,, µ n,σ 2 La conoscenza diα, β consente di ricostruire tutte le medie incognite µ 1, µ 2,, µ n µ i = E(Y i ) = α+β x i Riepilogo ipotesi Y i = α +β x i +ε i µ i = E(Y i ) = α+β x i var(y i ) = σ 2 cov(y i, Y j )=0 var(ε i )=? var(ε i )= σ 2 (Dato che var(y+k)=var(y) con k costante) cov(ε i, ε j )=? cov(ε i, ε j )=0 (Dato che cov(y i +k, Y j +c)= cov(y i, Y j ) con k e c costanti) Marco Riani, Univ. di Parma 15
16 Stime di α e β Pensando di ripetere più volte l esperimento che ha generato le osservazioni y 1,, y n, per valori fissi di x 1,, x n si ottiene una distribuzione campionaria di valori Coeff. di regressione campionari e nella popolazione Marco Riani, Univ. di Parma 16
17 Coeff. di regressione campionari e nella popolazione Stima di σ 2 var(y i )=var(ε i )=σ 2 = dispersione verticale attorno alla retta che unisce i valori medi delle popolazioni Dato che σ 2 =E(ε i2 )-[E(ε i )] 2 = E(ε i2 ) Dato che e i è una stima di ε i sembra naturale utilizzare come stimatore di σ 2 la seguente espressione Marco Riani, Univ. di Parma 17
18 Stima di σ s= errore standard nella stima di Y Ip. aggiuntiva Le distribuzioni Y i sono normali y 1 è una realizzazione di Y 1 ~ N(µ 1, σ 2 ) y 2 è una realizzazione di Y 2 ~ N(µ 2, σ 2 ) y n è una realizzazione di Y n ~ N(µ n, σ 2 ) Y 1, Y 2,, Y n sono indipendenti Marco Riani, Univ. di Parma 18
19 Obiettivo Costruire intervalli di confidenza e test di verifica d ipotesi sul coeff. angolare Studio della distribuzione di Marco Riani, Univ. di Parma 19
20 Studio della distribuzione di Varianza di beta cappello Marco Riani, Univ. di Parma 20
21 Varianza di beta cappello Al posto di σ 2 sostituiamo il suo stimatore La radice quadrata della stima della varianza di uno stimatore è l errore standard (standard error, SE) dello stimatore Marco Riani, Univ. di Parma 21
22 Interpretazione dello standard error di beta cappello Rappresenta l errore quadratico medio che si commette quando si stima il coefficiente di regressione con le formule dei minimi quadrati Studio della distribuzione di Marco Riani, Univ. di Parma 22
23 Esercizio: nell esempio dei 7 supermercati calcolare lo standard error di beta cappello e alpha cappello Sol. Costruzione di intervalli di confidenza dei parametri Marco Riani, Univ. di Parma 23
24 Punto di partenza beta cappello è funzione lineare di v.c. Normali e quindi è distribuito in maniera normale Lo scostamento standardizzato di beta capello ha una distribuzione N(0,1) Se il livello di confidenza 1-α=0.95 Marco Riani, Univ. di Parma 24
25 Problema: σ 2 è ignoto (occorre sostituire il suo stimatore s 2 ) Sostituendo al posto di σ 2 il suo stimatore Marco Riani, Univ. di Parma 25
26 Costruzione di un intervallo di confidenza per il coeff. angolare Dove t(α/2) è valore critico associato alla distribuzione T di student con n-2 gradi di libertà (T(n-2)) tale che F(-t(α/2))= P(T<-t(α/2))=α/2 Costruzione di intervalli di confidenza dei parametri Marco Riani, Univ. di Parma 26
27 Esercizio: nell esempio dei 7 supermercati costruire un intervallo di confidenza al 95% per β ed interpretare i risultati ottenuti ESEMPIO (7 supermercati) N. dipendenti (X) Fatturato in milioni di (Y) A 10 1,9 B 18 3,1 C 20 3,2 D 8 1,5 E 30 6,2 F 12 2,8 G 14 2,3 Marco Riani, Univ. di Parma 27
28 Costruzione di un intervallo di confidenza al 95% per il coeff. angolare t(0.025)= (=INV.T(0.05;5) (Oss: Pr.(T>2.5706)=0.025) Costruzione di un intervallo di confidenza al 95% per il coeff. angolare Pr( <β< )=0.95 Pr(0.133<β< 0.263)=0.95 Marco Riani, Univ. di Parma 28
29 Interpretazione L'intervallo di confidenza del coefficiente di regressione, con probabilità uguale a 0.95, va da 0,133 a 0,263. Questo significa che nell'universo di riferimento, all'aumento di un dipendente può corrispondere un aumento delle vendite compreso tra 133 mila Euro e 263 mila Euro circa (con probabilità del 95%). Oss: l'intervallo è piuttosto ampio e questo dipende dalla ridotta numerosità campionaria (solo 7 supermercati). Intervallo di confidenza per l intercetta Marco Riani, Univ. di Parma 29
30 Costruzione di un intervallo di confidenza al 95% per l intercetta t(0.05)= (=INV.T(0.05;5) (Oss: Pr.(T>2.5706)=0.025) Pr(-1.31<α< 0.96)=0.95 Costruzione di test di ipotesi per α e β Marco Riani, Univ. di Parma 30
31 Dato che Sotto H 0 : β =0 Esercizio: nell esempio dei 7 supermercati testare H 0 :β=0 (H 1 :β 0), trovare il relativo p- value ed interpretare il risultato del test t β =0.1982/ =7.82 p-value <0.001 (dalle tavole) DISTRIB.T(7.82;5;2)= Interpretazione : rifiuto decisamente l ipotesi nulla Marco Riani, Univ. di Parma 31
32 Esercizio: nell esempio dei 7 supermercati testare H 0 :α=0, (H 1 :α 0), trovare il relativo p- value ed interpretare il risultato del test t α =0.39 p-value = >0.1 (dalle tavole) DISTRIB.T(0.39;5;2)=0.714 Interpretazione : non posso rifiutare l ipotesi nulla Approccio inferenziale al δ (coefficiente di determinazione lineare) H 0 :δ=0 (non vi è alcuna relazione tra X e Y) La statistica test da utilizzare è la seguente: Nel modello di regressione lineare semplice Marco Riani, Univ. di Parma 32
33 Le quantità necessarie per il calcolo della statistica F sono riportate nella Tabella di analisi della varianza v. p. 142 Tutti i precedenti calcoli sono stati implementati in Excel Pagina Indirizzo del file da scaricare Marco Riani, Univ. di Parma 33
34 Esercizi di calcolo delle probabilità Esercizio Si consideri un dado a 20 facce tutte uguali Qual è il valore atteso? Quante volte è necessario lanciarlo affinché la probabilità di ottenere almeno un 20 sia maggiore o uguale a 0.5? Lanciandolo 20 volte, qual è il numero medio di 20 ottenuti? Pr di ottenere almeno una volta la faccia 20 in 20 lanci? Marco Riani, Univ. di Parma 34
35 Soluzione Valori assunti da X i= 1, 2,, 20 P(X=i)=1/20 E(X)? Quante volte è necessario lanciarlo affinché la probabilità di ottenere almeno un 20 sia maggiore o uguale a 0.5? Pr(almeno un 20 in n lanci) = 1-Pr(nessun 20 in n lanci)= 1-(19/20) n = n Vincolo 1-(19/20) n >0.5 n >ln(0.5)/ln(19/20)=log = Marco Riani, Univ. di Parma 35
36 Lanciandolo 20 volte, qual e il numero medio di 20 ottenuti? Y i v.c. associata all ottenimento del numero 20 Y i ~ Bernoulliana π= 1/20 S 20 = Y Y 20 ~ B(20, 1/20) E(S 20 ) = 20 π = 20 (1/20) =1 Pr di ottenere almeno una volta la faccia 20 in 20 lanci? Pr(almeno un 20 in 20 lanci) = 1-Pr(nessun 20 in 20 lanci)= 1-(1-1/20) 20 = Marco Riani, Univ. di Parma 36
37 Esercizio Nel gioco del lotto un numero ha una probabilità p di uscire ad ogni estrazione. Si scriva la densità della v.c. che descrive il tempo di attesa dell uscita del numero all estrazione k-esima (v. casuale geometrica), k=1, 2, 3,. Si dimostri che la somma delle probabilità è 1 Si calcoli il valore atteso Si calcoli l espressione che definisce P(X>k) Soluzione Dato che le estrazioni sono indipendenti la prob. che il numero esca alla k-esima estrazione è P(X=k) =? k=1, 2,., P(X=k) = (1-p) k-1 p k=1, 2,., P(X=k) = q k-1 p k=1, 2,., Marco Riani, Univ. di Parma 37
38 Si dimostri che la somma delle probabilità è 1 Valore atteso q=1-p P(X=k) = q k-1 p k=1, 2, Marco Riani, Univ. di Parma 38
39 Varianza= E(X 2 )-[E(X)] 2 Cominciamo a calcolare E(X(X-1)) q=1-p P(X=k) = q k-1 p k=1, 2, Calcolare P(X>k) P(X=k) = q k-1 p k=1, 2, 3, P(X>k) si può scrivere come Marco Riani, Univ. di Parma 39
40 Esercizio Dimostrare che nel gioco del lotto la probabilità che siano necessari i+j tentativi prima di ottenere il primo successo, dato che ci sono già stati i insuccessi consecutivi, è uguale alla probabilità non condizionata che almeno j tentativi siano necessari prima del primo successo. Morale: il fatto di avere già osservato i insuccessi consecutivi non cambia la distribuzione del numero di tentativi necessari per ottenere il primo successo Soluzione X = numero di tentativi prima di ottenere il primo successo. p = prob di successo Dobbiamo dimostrare che P(X>i+j X>j) = P(X>i) P(X>i+j X>j) = P(X>i+j X>j) / P(X>j) = P(X>i+j) / P(X>j) = q i+j /q j =q i =P(X>i) Marco Riani, Univ. di Parma 40
41 Esercizio Un gioco a premi ha un montepremi di 512 Euro. Vengono poste ad un concorrente 10 domande. Ad ogni risposta errata il montepremi viene dimezzato. Alla prima risposta esatta il concorrente vince il montepremi rimasto. Se non si fornisce alcuna risposta esatta non si vince nulla. Un certo concorrente risponde esattamente ad una domanda con probabilità p, indipendentemente dalle risposte alle altre domande. Richieste Sia X la vincita di questo concorrente. Scrivere la legge di X in forma compatta e determinare la sua densità p(x) Verificare che la somma delle probabilità sia 1 Calcolare il valore atteso della vincita Marco Riani, Univ. di Parma 41
42 Soluzione Tempo in cui avviene la vincita (t) Ammontare vinto X(t) P vincere p /2 (1-p) p /2 2 (1-p) 2 p /2 9 (1-p) 9 p 1 >10 0 (1-p) 10 0 Ammontare vinto X(t) v.c. X(t) = montepremi vinto? P(t)? Verificare che la somma delle probabilità sia 1 (oss. q=1-p) La somma delle probabilità è data da Marco Riani, Univ. di Parma 42
43 Valore atteso della vincita E(X(t)) Marco Riani, Univ. di Parma 43
STATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta
DettagliSTATISTICA A K (63 ore) Marco Riani
STATISTICA A K (63 ore) Marco Riani mriani@unipr.it http://www.riani.it Esercizio Un partito politico ha commissionato un indagine sull orientamento della popolazione al prossimo referendum. Al partito
DettagliSTATISTICA A D (72 ore) Verifica d ipotesi. H 0 e H 1 16/04/2013. Marco Riani, Univ. di Parma 1. Formalizzazione di un test
STATISTICA A D (72 ore) Marco Riani mriani@unipr.it http://www.riani.it Verifica d ipotesi Formalizzazione di un test = parametro ignoto dell universo (ad es.:, ) (=probabilità di rispondere rettamente
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
Dettaglilezione 4 AA Paolo Brunori
AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente
DettagliStatistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
Dettaglilezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1
lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,
DettagliSTATISTICA A K (63 ore) Marco Riani
STATISTICA A K (63 ore) Marco Riani mriani@unipr.it http://www.riani.it Verifica d ipotesi Esempio di logica di un test statistico Prova d esame con 10 quesiti a quiz 4 possibili risposte per ogni quesito
DettagliUniversità di Pavia Econometria. Richiami di Statistica. Eduardo Rossi
Università di Pavia Econometria Richiami di Statistica Eduardo Rossi Università di Pavia Campione casuale Siano (Y 1, Y 2,..., Y N ) variabili casuali tali che le y i siano realizzazioni mutuamente indipendenti
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Esercizio Il contenuto di nicotina di una certa marca di sigarette è 0,25 milligrammi con una deviazione standard di 0,015. Un associazione
DettagliNel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.
Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive
DettagliDATA MINING PER IL MARKETING (63 ore)
DATA MINING PER IL MARKETING (63 ore) Marco Riani mriani@unipr.it Sito web del corso http://www.riani.it/dmm Studio della distribuzione di ˆ E( ˆ) var( ˆ) 2 ( X ' X ) 1 Teorema di Gauss Markov (efficienza
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Esercizio In una prova sul carico di rottura di due tipi di corda si dispone di 2 campioni di ampiezza 26 e 35 rispettivamente. Nel
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DettagliR - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre
R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria
DettagliPROVA SCRITTA DI STATISTICA (COD COD ) 7 luglio 2005 APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE SOLUZIONI MODALITÀ A
PROVA SCRITTA DI STATISTICA (COD. 047 - COD. 403-37-377) 7 luglio 200 APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE SOLUZIONI MODALITÀ A Esercizio (9 punti) Supponiamo di aver osservato la seguente
DettagliRegressione lineare. Lucio Demeio Dipartimento di Ingegneria Industriale e Scienze Matematiche Università Politecnica delle Marche.
Regressione lineare Lucio Demeio Dipartimento di Ingegneria Industriale e Scienze Matematiche Università Politecnica delle Marche Siano x ed y due variabili legate tra loro da una forma funzionale del
DettagliDestagionalizzazione, detrendizzazione delle serie storiche
DATA MINING PER IL MARKETING (63 ore) Marco Riani mriani@unipr.it Sito web del corso http://www.riani.it/dmm Destagionalizzazione, detrendizzazione delle serie storiche 1 Serie storica della vendita di
DettagliStatistica 1 A.A. 2015/2016
Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 35 Il modello di regressione
DettagliLezione 18. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 18. A. Iodice
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 45 Outline 1 2 3 4 5 () Statistica 2 / 45 Modello di In molte applicazioni il ruolo delle variabili
DettagliIl campionamento e l inferenza. Il campionamento e l inferenza
Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento
DettagliOccorre trovare la distribuzione di DM
Esercizio In una prova sul carico di rottura di due tipi di corda si dispone di 2 campioni di ampiezza 26 e 35 rispettivamente. Nel primo campione la media è 185,3Kg, nel secondo campione la media è 175,2Kg.
DettagliECONOMETRIA: Laboratorio I
ECONOMETRIA: Laboratorio I Luca De Angelis CLASS - Università di Bologna Programma Laboratorio I Valori attesi e varianze Test di ipotesi Stima di un modello lineare attraverso OLS Valore atteso Data una
DettagliStatistica Applicata all edilizia: il modello di regressione
Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione
DettagliContenuti: Capitolo 14 del libro di testo
Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4
DettagliProva d'esame di Statistica I - Corso Prof.ssa S. Terzi
Prova d'esame di Statistica I - Corso Prof.ssa S. Terzi Esercizio 1 Data la variabile casuale X con funzione di densità f(x) = 2x, per 0 x 1; f(x) = 0 per x [0, 1], determinare: a) P( - 0,5 < X< 0,7) b)
DettagliDispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
DettagliEsercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
DettagliTest delle Ipotesi Parte I
Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test
DettagliMetodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello
Metodi Quantitativi per Economia, Finanza e Management Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello 1. Introduzione ai modelli di regressione 2. Obiettivi 3. Le
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
DettagliCorso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali. Esercitazione E
Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali A.A 2009-2010 Esercitazione E Scopo dell esercitazione Applicazioni del teorema del limite centrale. Rappresentazione delle incertezze
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
DettagliStatistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
DettagliRelazioni tra variabili (fenomeni) aziendali
Relazioni tra variabili (fenomeni) aziendali - giornate di assenza dal lavoro è collegato a qualifica professionale, anzianità, sesso, dei dipendenti? - incidenti sul lavoro sono collegati a orario di
DettagliSTATISTICA. Regressione-3 L inferenza per il modello lineare semplice
STATISTICA Regressione-3 L inferenza per il modello lineare semplice Regressione lineare: GRAFICO DI DISPERSIONE & & analisi residui A. Valutazione preliminare se una retta possa essere una buona approssimazione
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it STIMA PUNTUALE (p. 55) Il parametro è stimato con un unico valore Esempio: stima della share di un programma TV = % di spettatori
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
DettagliSTATISTICA A D (72 ore)
STATISTICA A D (72 ore) Marco Riani mriani@unipr.it http://www.riani.it Tipologia di v.a. v.a. discreta numero finito di valori (infinità numerabile) x 1 x 2,, x k con probabilità p 1 p 2, p k Esempio:
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliEsercitazioneII. In questa esercitazione faremi un ripasso generale: rappresentazioni grafiche, medie e varianze;
EsercitazioneII In questa esercitazione faremi un ripasso generale: rappresentazioni grafiche, medie e varianze; la correlazione; la regressione; introduzione alla probabilità. 1 Esercizio 1 Gli stipendi
DettagliSTATISTICA A K (63 ore) Marco Riani
STATISTICA A K (63 ore) Marco Ran mran@unpr.t http://www.ran.t Rcham sulla regressone MODELLO DI REGRESSIONE y a + b + e dove: 1,, n a + b rappresenta una retta: a ordnata all orgne ntercetta b coeff.
DettagliCorso di Statistica - Prof. Fabio Zucca IV Appello - 5 febbraio Esercizio 1
Corso di Statistica - Prof. Fabio Zucca IV Appello - 5 febbraio 2015 Nome e cognome: Matricola: c I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. 8994
DettagliAnalisi di Regressione Multipla
Analisi di Regressione Multipla Stima OLS della relazione Test Score/STR : TestScore! = 698.9.8 STR, R =.05, SER = 18.6 (10.4) (0.5) E una stima credibile dell effetto causale sul rendimento nei test di
DettagliGli intervalli di confidenza. Intervallo di confidenza per la media (σ 2 nota) nel caso di popolazione Gaussiana
Statistica Lez. 1 Gli intervalli di confidenza Intervallo di confidenza per la media (σ nota) nel caso di popolazione Gaussiana Sia X una v.c Gaussiana di media µ e varianza σ. Se X 1, X,..., X n è un
DettagliCostruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini. Lezione 7: Basi di statistica
Costruzione di macchine Modulo di: Progettazione probabilistica e affidabilità Marco Beghini Lezione 7: Basi di statistica Campione e Popolazione Estrazione da una popolazione (virtualmente infinita) di
DettagliStatistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità D
Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità D Cognome Nome: Part time: Numero di matricola: Diurno: ISTRUZIONI: Il punteggio relativo alla prima parte dell esame viene calcolato
DettagliCalcolo delle Probabilità e Statistica Matematica: definizioni prima parte. Cap.1: Probabilità
Calcolo delle Probabilità e Statistica Matematica: definizioni prima parte Cap.1: Probabilità 1. Esperimento aleatorio (definizione informale): è un esperimento che a priori può avere diversi esiti possibili
DettagliRegressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
DettagliESAME. 9 Gennaio 2017 COMPITO B
ESAME 9 Gennaio 2017 COMPITO B Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto
DettagliStatistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B
Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B Cognome Nome: Part time: Numero di matricola: Diurno: ISTRUZIONI: Il punteggio relativo alla prima parte dell esame viene calcolato
DettagliESAME. 9 Gennaio 2017 COMPITO A
ESAME 9 Gennaio 2017 COMPITO A Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto
DettagliIndice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza
XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it In una prova sul carico di rottura di due tipi di corda si dispone di 2 campioni di ampiezza 26 e 35 rispettivamente. Nel primo campione
DettagliUniversità degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1
Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1 Lezione 1 - Martedì 23 Settembre 2014 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,
DettagliUlteriori Conoscenze di Informatica e Statistica. Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie.
Ulteriori Conoscenze di Informatica e Statistica Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 (I piano) tel.: 06 55 17 72 17 meneghini@fis.uniroma3.it I risultati di un esperimento
DettagliPROBABILITÀ ELEMENTARE
Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti
DettagliTecniche di sondaggio
SMID a.a. 2005/2006 Corso di Statistica per la Ricerca Sperimentale Tecniche di sondaggio 24/1/2006 Nomenclatura Indicheremo con P una popolazione, con N la sua numerosità, con k la sua etichetta e con
DettagliSOLUZIONI PROVA SCRITTA DI STATISTICA (cod. 4038, 5047, 371, 377) 8 settembre 2005
SOLUZIONI PROVA SCRITTA DI STATISTICA cod. 4038, 5047, 371, 377) 8 settembre 2005 MODALITÀ B APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE Esercizio 1. 7 punti) Su un collettivo di 13 nuclei
DettagliPROVA SCRITTA DI STATISTICA. CLEA/CLEFIN/CLEMIT (cod. 5047/4038/371/377) 3 Novembre 2004 MOD. A
PROVA SCRITTA DI STATISTICA CLEA/CLEFIN/CLEMIT (cod. 547/438/37/377) 3 Novembre 4 MOD. A Esercizio N. (3 punti). Data la v.s. X avente funzione di densità: / x < 9/4 x < 3 f(x) = / 3 x < 7 / 7 x < 9 altrove
Dettagli1. variabili dicotomiche: 2 sole categorie A e B
Variabile X su scala qualitativa (due categorie) modello di regressione: variabili quantitative misurate almeno su scala intervallo (meglio se Y è di questo tipo e preferibilmente anche le X i ) variabili
DettagliMODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza,
MODELLO DI REGRESSIONE LINEARE le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza, teorema di Gauss-Markov, verifica di ipotesi e test di
DettagliSTATISTICA. Esercitazione 5
STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei
DettagliCOGNOME.NOME...MATR..
STATISTICA 29.01.15 - PROVA GENERALE (CHALLENGE) Modalità A (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità
DettagliUniversità degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1
Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Lezione 1 - Mercoledì 28 Settembre 2016 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,
Dettagli05. Errore campionario e numerosità campionaria
Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,
DettagliCorso in Statistica Medica
Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Intervalli di confidenza Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico
DettagliCorso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano
Corso di STATISTICA EGA - Classe 1 aa 2017-2018 Docenti: Luca Frigau, Claudio Conversano Il corso è organizzato in 36 incontri, per un totale di 72 ore di lezione. Sono previste 18 ore di esercitazione
DettagliEsercizi di Probabilità e Statistica
Esercizi di Probabilità e Statistica Samuel Rota Bulò 6 giugno 26 Statistica Esercizio Sia {X n } n una famiglia di v.a. di media µ e varianza σ 2. Verificare che X = n n X i σ 2 = n (X i µ) 2 S 2 = n
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Stimatore media campionaria Il tempo in minuti necessario a un certo impiegato dell anagrafe
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
DettagliParametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori.
Parametri e statistiche Popolazione Parametri Valori fissi, spesso non noti Campione Statistiche o Stimatori Variabili casuali, le cui determinazioni dipendono dalle particolari osservazioni scelte Parametri
DettagliAnalisi multivariata per osservazioni appaiate. Analisi multivariata per osservazioni appaiate
Introduzione Notazione Modello additivo Verifica d ipotesi Sia X una variabile q-dimensionale, a valori reali, non degenere, osservata in k tempi diversi (τ 1, τ 2,..., τ k ), sulle stesse n unità statistiche
DettagliRegressione lineare semplice
Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro
DettagliModelli descrittivi, statistica e simulazione
Modelli descrittivi, statistica e simulazione Master per Smart Logistics specialist Roberto Cordone (roberto.cordone@unimi.it) Statistica inferenziale Cernusco S.N., giovedì 25 febbraio 2016 (9.00/13.00)
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Esercizio: si consideri una generica popolazione X con media µ e varianza σ 2 Siano T 1 =(X 1 +X 2 +X 3 +X 4 )/4 e T 2 =(3X 1 +4X
DettagliCapitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
DettagliTutorato di Complementi di Analisi Matematica e Statistica 30 maggio 2016
Tutorato di Complementi di Analisi Matematica e Statistica 30 maggio 2016 Esercizi possibili di probabilità e statistica Notazioni: U(a, b) è la distribuzione di probabilità uniforma nell intervallo (a,
DettagliIntervallo di confidenza.
Intervallo di confidenza annarita.vestri@uniroma1.it campione inferenza popolazione Media Riportare sempre anche la deviazione standard Stima puntuale di Media, dev.standard, numerosità Qualche semplice
DettagliIl modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.
DettagliArgomenti della lezione:
Lezione 7 Argomenti della lezione: La regressione semplice Il modello teorico Il calcolo dei parametri Regressione lineare Esamina la relazione lineare tra una o più variabili esplicative (o indipendenti,
DettagliIl modello di regressione lineare multipla. Il modello di regressione lineare multipla
Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa
DettagliDistribuzioni e inferenza statistica
Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione
DettagliCHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
DettagliI modelli probabilistici
e I modelli probabilistici Finora abbiamo visto che esistono modelli probabilistici che possiamo utilizzare per prevedere gli esiti di esperimenti aleatori. Naturalmente la previsione è di tipo probabilistico:
DettagliDipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli
Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 6 1. Si consideri un campione di 69 persone
DettagliESERCITAZIONE N. 7 corso di statistica
ESERCITAZIONE N. 7corso di statistica p. 1/15 ESERCITAZIONE N. 7 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONE N. 7corso di statistica p. 2/15 Introduzione Variabili aleatorie continue
DettagliEsercizi riassuntivi di Inferenza
Esercizi riassuntivi di Inferenza Esercizio 1 Un economista vuole stimare il reddito medio degli abitanti di una cittadina mediante un intervallo al livello di confidenza del 95%. La distribuzione del
DettagliUniversità del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare
DettagliVariabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.
Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:
DettagliOgni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.
Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza. Misure ripetute forniscono dati numerici distribuiti attorno ad un valore centrale indicabile con un indice (indice
DettagliMetodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione
Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze
DettagliUlteriori Conoscenze di Informatica e Statistica
Ulteriori Conoscenze di Informatica e Statistica Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 (I piano) tel.: 06 55 17 72 17 meneghini@fis.uniroma3.it Indici di forma Descrivono le
DettagliCONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI
CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI ipotesi sul confronto tra le medie di due campioni indipendenti Obiettivo: decidere, attraverso il confronto tra le medie dei due campioni indipendenti,
DettagliStatistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice
Esercitazione 16 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 24 Studio della relazione tra due variabili Commonly Asked Questions Qual è la relazione tra la spesa
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
DettagliSTATISTICA A D (72 ore)
STATISTICA A D (72 ore) Marco Riani mriani@unipr.it http://www.riani.it Elementi che fanno variare l ampiezza dell intervallo di confidenza (p. 70) s.q.m. dell universo σ Più σ è elevato, maggiore è la
Dettagli