Statistica per le ricerche di mercato. 16. Il modello di regressione logistica: definizione, specificazione e

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Statistica per le ricerche di mercato. 16. Il modello di regressione logistica: definizione, specificazione e"

Transcript

1 Statistica per le ricerche di mercato A.A. 2011/12 Prof.ssa Tiziana Laureti Dott. Luca Secondi 16. Il modello di regressione logistica: definizione, specificazione e stima

2 L analisi delle variabili dipendenti dicotomiche Un importante area di applicazione dell analisi di regressione riguarda il caso in cui la variabile dipendente è una variabile di tipo qualitativo, ossia dicotomica, nominale o ordinale. Nelle scienze sociali le variabili dipendenti di questo tipo sono molto diffuse in quanto rappresentano in modo appropriato numerosi fenomeni di interesse, ad es. i giovani che conseguono il diploma decidono se iscriversi o meno all università, appartenenza alla forza lavoro (occupazione /disoccupazione) Nell ambito delle analisi di mercato la regressione si può considerare ad esempio la variabile dicotomica che esprime l acquisto o non acquisto di un prodotto in risposta ad esempio ad una diminuzione del prezzo del prodotto oppure l aumento della comunicazione pubblicitaria per una certa gamma di prodotti. Altri esempi: scelta tra marche (A,B) Possesso di un telefono cellulare 2

3 L analisi delle variabili dipendenti dicotomiche L obiettivo è quello di spiegare la variabile risposta sulla base di uno o più regressori. Supponiamo di voler studiare le determinanti dell aver o meno acquistato un determinato modello di smartphone nell ultimo anno. Disponiamo di osservazioni su n individui riferite all acquisto di uno smartphone e a k variabili esplicative x. Problema: utilizzando le variabili considerate (ad es. il reddito, il sesso, età, ecc.) possiamo spiegare la scelta di acquistare o meno uno smartphone? La nostra variabile risposta è una variabile binaria che indichiamo con Y tale che per ogni osservazione i (i=1,,n): y y i i = 1 l'unità i-esima ha acquistato uno smartphone = 0 l'unità i-esima non ha acquistato uno smartphone

4 L analisi delle variabili dipendenti dicotomiche La variabile Y si distribuisce come una v.c. di Bernoulli con parametro : ( = 1 = ) =π ( ) P Y X x x ( = 0 = ) = 1 π ( ) P Y X x x ( Yx) = PY ( = X= x) + PY ( = X= x) =π ( x) E π ( x) ( ) Allo scopo di modellare π x si potrebbe pensare di ricorrere ad uno schema di regressione lineare (comunemente denominato modello di probabilità lineare, MPL), come segue: Il modello π ( x) = PY ( = 1 X= x) = α + βx+ ε lineare non funziona! Problema: dal momento che π(x) è una probabilità deve necessariamente assumere valori nell intervallo [0,1], mentre la funzione lineare al membro di destra può assumere valori nell intervallo (-, + ). violazione dell ipotesi di omoschedasticità Violazione dell ipotesi di normalità dell errore ε

5 L analisi delle variabili dipendenti dicotomiche Al fine di superare i problemi evidenziati in precedenza, sono stati proposti modelli in cui si esprime la probabilità di successo in funzione delle variabili esplicative, secondo una funzione G che assuma valori in [0,1] Si parla di modelli lineari generalizzati. Uno dei più noti modelli all interno di tale classe è il modello di regressione logistica. ( x) = PY ( = 1 X= x) = G( X + X... X ) π β β β 1 1i 2 2i k ki La scelta di G cade in modo naturale sulla Funzione di ripartizione FdR Φ della normale standardizzata si ha il modello probit FdR L di una distribuzione Logistica standardizzata si ha il modello logit (regressione logistica)

6 La distribuzione Logistica è simile alla Normale, con code più pesanti. Scelta tra i due modelli: i risultati di solito sono indistinguibili (piccole differenze per probabilità estreme) il modello logit è interpretabile in termini di odds è difficile giustificare la scelta dell uno o dell altro sulla base di considerazioni teoriche Noi studieremo il modello logit o regressione logistica

7 Assunzioni e specificazione del modello 1/3 Quindi nel modello di regressione logistica la probabilità π(x) è assunta pari al valore della funzione di ripartizione di una variabile casuale logistica calcolata in corrispondenza di x. Nel caso di una sola variabile esplicativa si ha: α + β x e π ( x) = P( Y = 1 X = x) = + ε α+ βx 1+ e La funzione di ripartizione logistica è una funzione crescente di X che assume valori nell intervallo [0,1] e assume la seguente forma 7

8 Assunzioni e specificazione del modello 2/3 Il modello logistico può essere generalizzato al caso di più variabili esplicative come nella seguente espressione: β1x1+ β2x βkxk e π ( x) = PY ( = 1 X2 = x2,..., Xk = xk, ) = + ε β1x1+ β2x βkxk 1+ e dove - in analogia con la notazione usata nel libro di testo per il modello di regressione lineare multipla - la variabile X 1 assume valore 1 Sia nel caso univariato che in quello multivariato la funzione che c lega la probabilità di successo alle sue variabili esplicative è non lineare nei parametri. Essa può tuttavia essere linearizzata attraverso un opportuna trasformazione. 8

9 Assunzioni e specificazione del modello 3/3 Dal momento che la probabilità di successo è data dalla formulazione appena introdotta, la probabilità di insuccesso (complementare) è pari a: ( ) π x = PY= X2 = x2 X p = xp = + β x + β x βkxk 1 ( ) 0,...,, π ( x) Il rapporto tra le due probabilità è quindi dato da: 1 e 1 π ( x) 1 π ( x) = k e β + β + + β x x x k passando al logaritmo naturale per ambo i membri si ottiene la seguente trasformazione - detta logit che produce una funzione lineare nei parametri β 1,, β k π ( x) [ x ] logit π ( ) = log = β + β β 1 π ( ) x x kx x k Nei processi di stima anziché considerare il valore di π(x) si opera attraverso la sua trasformata logit. 9

10 Logit e odds L ODDS è il rapporto tra la probabilità di successo e quella di insuccesso ODDS 1 successo e insuccesso sono equiprobabili π ( x) = = ( 0,1) il successo è meno probabile dell'insuccesso 1 π ( x) ( 1, ) il successo è più probabile dell'insuccesso L'odds corrisponde al rapporto fra il numero di volte in cui l'evento si verifica (o si è verificato) ed il numero di volte in cui l'evento non si verifica (o non si è verificato) Poiché il campo di variazione dell odds non è simmetrico, spesso si preferisce ricorrere alla sua trasf. logaritmica, il LOG ODDS, che risulta uguale alla trasformata logit di π. 0 successo e insuccesso sono equiprobabili π ( x) log( ODDS) = log logit [ π ( )] <0 il successo è meno probabile dell'insuccesso 1 π ( ) = x = x >0 il successo è più probabile dell'insuccesso 10

11 Esempio di odds Gli odds si utilizzano nel mondo delle scommesse perché consentono allo scommettitore di calcolare facilmente la somma da incassare in caso di vittoria. Per esempio si ipotizzi che le probabilità di vittoria per una squadra di calcio al campionato italiano siano date dai bookmakers 4:1 a sfavore. Questo equivale a dire che le probabilità di sconfitta (π) della squadra sono state considerate 4 volte più alte di quelle di una sua vittoria pari a (1-π). Quindi la vittoria della squadra è da pagare 4 volte la cifra scommessa Gli odds si possono trasformare in probabilità: la squadra considerata ha 1 probabilità su 5 (p = 0,2) di vincere e 4 probabilità su 5 di perdere (1-p = 0,8) 11

12 Interpretazione dei parametri del modello Si può dimostrare che il generico parametro β j è il risultato della variazione prodotta sul logit[π(x)] dall incremento unitario della variabile indipendente X j (tenuti costanti i valori degli altri regressori). Quindi il segno del coefficiente di regressione della variabile Xj corrisponde al segno dell effetto da essa esercitato. Per avere una misura dell intensità si utilizza l odds ratio (OR) dato dal rapporto degli odds β1x βjxjb βkxk βjxjb odds π ( x) X jb e e β ( x x ) OR( j) = = = = e = e β1x βjxja βkxk βjxja odds π ( x) X ja e e β j jb ja j Dalla espressione riportata sopra, si deduce pertanto che per variazioni della generica variabile indipendente Xj la misura odds ratio è pari all esponenziale del corrispondente parametro. 12

13 Interpretazione dei parametri del modello 1. Se non sussiste nessuna relazione tra la variabile esplicativa X j e la probabilità che la variabile risposta Y assuma valore 1 il valore dell odds ratio è pari a 1 da cui β j = 0 2. Valori dell odds ratio maggiori di 1 - ai quali corrispondono valori del parametro β j maggiori di 0 - indicano un effetto positivo della variabile esplicativa X j sulla probabilità che la variabile risposta Y assuma il valore Valori dell odds ratio compresi tra 0 e 1 - ai quali corrispondono valori del parametro β j minori di 0 - indicano un effetto negativo della variabile esplicativa X j sulla probabilità che la variabile risposta Y assuma il valore 1. NB. L esistenza di tale asimmetria (nei valori degli odds ratio) richiede cautela quando si confrontano odds ratio caratterizzati da segno diverso. Ad esempio, un OR positivo pari a 2 ha esattamente la stessa intensità di un OR negativo pari a 1/2=0,5 13

14 Cenni alle procedure di stima dei parametri La stima del vettore dei parametri ignoti β è effettuata con il metodo della massima verosimiglianza, che si basa sulla massimizzazione della probabilità di osservare l insieme dei dati relativi al campione estratto in funzione di β. In termini estremamente semplici, si può affermare che la funzione di verosimiglianza, rappresenta la probabilità di osservare prima dell esperimento, quel particolare campione che si è verificato. Data l indipendenza delle osservazioni, la verosimiglianza del campione di n unità - indicata con il simbolo L(β) - è data dal prodotto delle verosimiglianze relative alle unità che lo compongono e - una volta estratto il campione - è funzione dei soli parametri β, come nell espressione seguente: n L( β) = f( yi xi; β) i= 1 Per ottenere la stima di massima verosimiglianza dei parametri, si determina il valore β che massimizza L(β) (o verosimilmente il suo logaritmo considerata la monotonicità della funzione logaritimica), ossia quel valore di β per cui il campione osservato è più plausibile. Ponendo uguali a 0 le derivate parziali fatte rispetto ai k parametri da stimare si ottengono le equazioni di verosimiglianza che - in quanto non lineari nei parametri - richiedono l applicazione di metodi iterativi (implementati nei più comuni pacchetti informatico-statistici). 14

15 Esempio di stima di odds ratio Si ipotizzi di effettuare un analisi di regressione logistica che modelli la probabilità di progresso nella conoscenza dell inglese (Y=1 progresso) in funzione dell esposizione ad un nuovo metodo di studio (X =1 esposizione) ottenendo una stima del relativo parametro β pari a 2. Tale risultato indica un effetto positivo dell esposizione al nuovo metodo sull apprendimento della lingua straniera, che si traduce in una maggiore probabilità di osservare un progresso nella conoscenza della lingua in caso di esposizione al nuovo metodo. Tale maggiore probabilità può essere meglio quantificata tramite la stima dell odds ratio corrispondente al passaggio dallo stato 0 allo stato 1 della variabile X, data da exp(β) = exp(2) = 7,4 Dalla stima dell OR si deduce che la frequenza relativa di coloro che hanno progredito nella conoscenza della lingua è oltre 7 volte superiore nel gruppo degli esposti al nuovo metodo rispetto al gruppo dei non esposti. 15

16 Inferenza nel modello di regressione logistica Bontà del modello nel suo complesso (1/4) Per verificare la significatività di un modello nel suo complesso si calcola la differenza G -detta extradevianza - tra la devianza del modello avente la sola intercetta e la devianza del modello in esame, basata sul rapporto di verosimiglianza, secondo la seguente espressione G = D (modello intercetta) D (modello completo) = 2log L(0) L ( β) dove L(0) rappresenta la massima verosimiglianza in corrispondenza del modello con la sola intercetta, mentre L(β) rappresenta la massima verosimiglianza in corrispondenza del modello completo. La verifica della bontà di un modello sulla base del rapporto di verosimiglianza (Likelihood Ratio, LR) si fonda sull idea che se le variabili considerate aggiungono molta informazione al modello con la sola intercetta, la verosimiglianza relativa al modello completo L(β) sarà molto maggiore di quella che si ottiene considerando il modello con la sola intercetta L(0). In tal caso il rapporto di verosimiglianza tende ad assumere valori molto piccoli, anche prossimi allo zero. 16

17 Inferenza nel modello di regressione logistica Bontà del modello nel suo complesso (2/4) Attraverso la statistica G, basata sul rapporto di verosimiglianza, si sottopone a verifica il seguente sistema di ipotesi: H 0 : β 2 = = β k = 0 H 1 : almeno un β j 0 dove j=2,,k Si può dimostrare che sotto ipotesi nulla G si distribuisce come una χ 2 con k-1 gradi di libertà. Pertanto si respinge l ipotesi nulla se si verifica che: G > k χ 2 1, α 2 È desiderabile che il valore di G sia elevato le variabili esplicative introducono una quantità significativa di informazione rispetto alla sola intercetta 17

18 Inferenza nel modello di regressione logistica Bontà del modello nel suo complesso (3/4) Per la valutazione della bontà di adattamento del modello di regressione logistica ai dati si può ricorrere ad una misura analoga al coefficiente di determinazione multiplo. Cox and Snell (1989) hanno proposto la seguente generalizzazione del coefficiente di determinazione per modelli non lineari chiamato Pseudo-R L(0) Rg = 1 ( ) L β n dove L(0) e L(β) rappresentano rispettivamente la massima verosimiglianza in corrispondenza del modello con la sola intercetta e la massima verosimiglianza in corrispondenza del modello considerato, dove n è la numerosità delle osservazioni. Il coefficiente di determinazione può variare tra 0, corrispondente alla situazione in cui il modello considerato non aggiunge informazione al modello con la sola intercetta per cui, = 1 L(0) vale L(β) = L(0) - e il suo valore massimo, che è: 2 [ ] 2 R gmax n 18

19 Inferenza nel modello di regressione logistica Bontà del modello nel suo complesso (4/4) Poiché R 2 g,max è minore di 1, per poter disporre di una misura che varia tra 0 e 1, dove zero rappresenta assenza di adattamento e 1 adattamento massimo del modello ai dati (come già visto per il modello di regressione lineare), si può far riferimento al coefficiente riscalato (Nagelkerke, 19991): R 2 g = R R 2 g 2 g, MAX 19

20 Inferenza nel modello di regressione logistica Confronto tra due modelli comparabili Una procedura analoga può essere utilizzata per confrontare i modelli annidati: modello completo k-1 variabili esplicative modello ridotto le ultime s variabili del modello completo sono escluse (totale variabili: k-s-1). Il sistema di ipotesi è pertanto il seguente: H 0 : β k-s+1 = β k-s+2 = = β k = 0 H 1 : almeno un uguaglianza in H 0 non è vera Si calcola quindi l extradevianza G s che misura la differenza tra la devianza del modello ridotto e quella del modello completo Si può dimostrare che sotto ipotesi nulla G s si distribuisce come una χ 2 con s gradi di libertà; pertanto si respinge l ipotesi nulla se si verifica che: 2 G > χ s s, α 2 20

21 Inferenza nel modello di regressione logistica Significatività per ogni singolo parametro Per verificare la significatività della stima bj del j-esimo parametro del modello si fa ricorso generalmente al test di Wald, nel caso univariato dato da stima bj W = sb ( ) j Errore standard Talvolta i pacchetti statistici, anziché fornire la statistica W forniscono il suo quadrato (Wald Chi-Square), che si distribuisce come una χ 2 con un grado di libertà Sulla base dell ipotesi nulla del seguente sistema di ipotesi: H 0 : β j = 0 H 1 : β j 0 W si distribuisce come una distribuzione normale standardizzata Se nell effettuazione del test si verifica che si respinge l ipotesi l nulla e si conclude che il parametro è significativamente diverso da 0 la variabile esplicativa corrispondente influisce sulla variabile risposta. W > z α 2 21

22 Stime di modelli di regressione logistica 1/7 Una ricerca di mercato si propone di stimare la probabilità di acquisto di un particolare snack alimentare sulla base di un insieme di variabili esplicative raccolte attraverso un indagine campionaria che ha coinvolto 32 giovani di età compresa tra i 12 e i 29 anni. La ricerca ha rilevato, insieme ad altre variabili di seguito illustrate, l acquisto da parte del rispondente di almeno una snack nel corso dell ultimo mese. Nella codifica di tale variabile è stato attribuito valore 1 nel caso in cui il rispondente ha dichiarato di avere acquistato almeno uno snack nel corso dell ultimo mese e 0 altrimenti. Questa variabile rappresenta la variabile risposta del modello di regressione logistica che si intende stimare. Le altre variabili rilevate sono le seguenti: Numero medio mensile di snack consumati (n_pezzi_medio) calcolato sulla base degli acquisti effettuati negli ultimi 6 mesi; Età del rispondente; Esposizione alla pubblicità relativa al prodotto in questione (tale variabile, di tipo dummy, assume valore 1 nel caso in cui il rispondente dichiari di aver visto almeno una volta alla televisione lo spot pubblicitario del prodotto in questione; 0 altrimenti); 22

23 Stime di modelli di regressione logistica 2/7 Dataset in Stata (prime 20 unità) 23

24 Stime di modelli di regressione logistica 3/7 Iteration 0: log likelihood = Iteration 1: log likelihood = Iteration 2: log likelihood = Iteration 3: log likelihood = Iteration 4: log likelihood = Iteration 5: log likelihood = Logistic regression Number of obs = 32 LR chi2( 3) = Prob > chi2 = Log likelihood = Pseudo R2 = acquisto Coef. Std. Err. z P> z [95% Conf. Interval] n_pezzi_me~o etax espos_pubb _cons logit acquisto n_pezzi_medio etax espos_pubb,or Iteration 0: log likelihood = Iteration 1: log likelihood = Iteration 2: log likelihood = Iteration 3: log likelihood = Iteration 4: log likelihood = Iteration 5: log likelihood = Logistic regression Number of obs = 32 LR chi2( 3) = Prob > chi2 = Log likelihood = Pseudo R2 = acquisto Odds Ratio Std. Err. z P> z [95% Conf. Interval] n_pezzi_me~o etax espos_pubb

25 Stime di modelli di regressione logistica 4/7 Dopo aver stimato il modello in Stata, è possibile calcolare per ogni osservazione campionaria la probabilità prevista di avere un successo (corrispondente in questo specifico caso, alla probabilità di acquistare lo snack), dati i valori assunti dalle variabili indipendenti (la nuova variabile generata è chiamata pr_for). Come per ogni altra variabile nel dataset, è possibile ottenere alcune misure di sintesi attraverso il comando summarize.. sum pr_for Variable Obs Mean Std. Dev. Min Max pr_for E possibile allo stesso tempo (attraverso il comando prvalue) computare, sempre sulla base della relazione stimata, la probabilità di avere un successo e quindi la P(Y=1 x) quando le variabili indipendenti x i assumono particolari e specifici valori. logit: Predictions for acquisto Confidence intervals by delta method 95% Conf. Interval Pr(y=1 x): [ , ] Pr(y=0 x): [ , ] Probabilità di acquistare il prodotto per un individuo che non ha visto lo spot pubblicitario n_pezzi_me~o etax espos_pubb x=

26 Stime di modelli di regressione logistica 5/7. prvalue, x (espos_pubb=1) rest(mean) logit: Predictions for acquisto Confidence intervals by delta method 95% Conf. Interval Pr(y=1 x): [ , ] Pr(y=0 x): [ , ] Probabilità di acquistare il prodotto per un individuo che ha visto lo spot pubblicitario n_pezzi_me~o etax espos_pubb x=

27 Stime di modelli di regressione logistica 6/7 Riprendiamo l esempio introdotto in aula informatica. xi: logit acq_ol redd eta sesso n_fam conness antivir i.istruz i.istruz _Iistruz_1-3 (naturally coded; _Iistruz_1 omitted) Iteration 0: log likelihood = Iteration 1: log likelihood = Iteration 2: log likelihood = Iteration 3: log likelihood = Iteration 4: log likelihood = Iteration 5: log likelihood = Stima di un modello Logit in Stata Logistic regression Number of obs = 100 LR chi2(8) = Prob > chi2 = Log likelihood = Pseudo R2 = acq_ol Coef. Std. Err. z P> z [95% Conf. Interval] redd eta sesso n_fam conness antivir _Iistruz_ _Iistruz_ _cons

28 Stime di modelli di regressione logistica 7/7 Riprendiamo l esempio introdotto in aula informatica. xi: logit acq_ol redd eta sesso n_fam conness antivir i.istruz, or i.istruz _Iistruz_1-3 (naturally coded; _Iistruz_1 omitted) Iteration 0: log likelihood = Iteration 1: log likelihood = Iteration 2: log likelihood = Iteration 3: log likelihood = Iteration 4: log likelihood = Iteration 5: log likelihood = Logistic regression Number of obs = 100 LR chi2(8) = Prob > chi2 = Log likelihood = Pseudo R2 = Stima di un modello Logit in Stata L output del software restituisce gli Odds Ratio (OR) acq_ol Odds Ratio Std. Err. z P> z [95% Conf. Interval] redd eta sesso n_fam conness antivir _Iistruz_ _Iistruz_

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa

Dettagli

Esercitazione. 24 Aprile 2012

Esercitazione. 24 Aprile 2012 Esercitazione 24 Aprile 2012 Il modello di regressione logistica viene utilizzato quando si è interessati a studiare o analizzare la relazione causale tra una variabile dipendente dicotomica e una o più

Dettagli

0 altimenti 1 soggetto trova lavoroentro 6 mesi}

0 altimenti 1 soggetto trova lavoroentro 6 mesi} Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta

Dettagli

Contenuti: Capitolo 14 del libro di testo

Contenuti: Capitolo 14 del libro di testo Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

Introduzione alla Regressione Logistica

Introduzione alla Regressione Logistica Introduzione alla Regressione Logistica Contenuto regressione lineare semplice e multipla regressione logistica lineare semplice La funzione logistica Stima dei parametri Interpretazione dei coefficienti

Dettagli

Test F per la significatività del modello

Test F per la significatività del modello Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno

Dettagli

Statistica economica

Statistica economica Statistica economica a.a. 013/14 Dr. Luca Secondi 10.a. Output tipico di un modello di regressione lineare multipla 1 Le analisi basate sul modello di regressione prevedono la stima dei coefficienti associati

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1 lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria

Dettagli

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Metodi per l Analisi dei Dati Sperimentali AA009/010 IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Sommario Massima Verosimiglianza Introduzione La Massima Verosimiglianza Esempio 1: una sola misura sperimentale

Dettagli

Regressione con una variabile dipendente binaria

Regressione con una variabile dipendente binaria Regressione con una variabile dipendente binaria Fino ad ora abbiamo considerato solo variabili dipendenti countinue: Che succede se Y è binaria? Y = va al college, o no; X = anni di istruzione Y = fumatore,

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi

Dettagli

Analisi della varianza

Analisi della varianza Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

Modelli lineari generalizzati

Modelli lineari generalizzati Modelli lineari generalizzati Estensione del modello lineare generale Servono allo studio della dipendenza in media di una variabile risposta da una o più variabili antecedenti Vengono attenuate alcune

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Dettagli

Test delle Ipotesi Parte I

Test delle Ipotesi Parte I Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test

Dettagli

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: esercitazione 7 p. 1/13 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: 20-05-2004 Luca Monno Università degli studi di Pavia luca.monno@unipv.it http://www.lucamonno.it

Dettagli

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1 Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

Corso di Statistica Esercitazione 1.8

Corso di Statistica Esercitazione 1.8 Corso di Statistica Esercitazione.8 Test su medie e proporzioni Prof.ssa T. Laureti a.a. 202-203 Esercizio Un produttore vuole monitorare i valori dei livelli di impurità contenute nella merce che gli

Dettagli

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA

Dettagli

Analisi della regressione multipla

Analisi della regressione multipla Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,

Dettagli

Obiettivo: confrontare due proporzioni, studiare il legame in presenza di un fattore di stratificazione

Obiettivo: confrontare due proporzioni, studiare il legame in presenza di un fattore di stratificazione Prof.ssa G. Serio, Prof. P. Trerotoli, Cattedra di Statistica Medica, Università di Bari 1/13 Il chi-quadro di Mantel-Haenszel Obiettivo: confrontare due proporzioni, studiare il legame in presenza di

Dettagli

Università della Calabria

Università della Calabria Università della Calabria FACOLTA DI INGEGNERIA Corso di Laurea in Ingegneria Civile CORSO DI IDROLOGIA N.O. Prof. Pasquale Versace SCHEDA DIDATTICA N 3 CURVE DI PROBABILITÀ PLUVIOMETRICA A.A. 00- CURVE

Dettagli

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 10 Test basati su due campioni e ANOVA a una via Insegnamento: Statistica Applicata Corsi di Laurea in "Scienze e tecnologie Alimentari"

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Quiz di verifica Classificazione

Quiz di verifica Classificazione Quiz di verifica Classificazione Strumenti Quantitativi per la gestione Le domande 1 4 si riferiscono al seguente problema: Supponiamo di raccogliere dati per un gruppo di studenti della classe di SQG

Dettagli

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson Levine, Krehbiel, Berenson Statistica II ed. Casa editrice: Pearson Capitolo 10 Test basati su due campioni e ANOVA a una via Insegnamento: Statistica Corsi di Laurea Triennale in Economia Dipartimento

Dettagli

Ulteriori applicazioni del test del Chi-quadrato (χ 2 )

Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y ) Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni

Dettagli

Analisi delle corrispondenze

Analisi delle corrispondenze Capitolo 11 Analisi delle corrispondenze L obiettivo dell analisi delle corrispondenze, i cui primi sviluppi risalgono alla metà degli anni 60 in Francia ad opera di JP Benzécri e la sua equipe, è quello

Dettagli

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova

Dettagli

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici SOLUZIONI ESERCITAZIONE NR. 8 Test statistici ESERCIZIO nr. 1 Un campione casuale di dieci pazienti di sesso maschile in cura per comportamenti aggressivi nell ambito del contesto familiare è stato classificato

Dettagli

Regressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Regressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007 Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il costo mensile Y di produzione e il corrispondente volume produttivo X per uno dei propri stabilimenti. Volume

Dettagli

Statistica 1 A.A. 2015/2016

Statistica 1 A.A. 2015/2016 Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 35 Il modello di regressione

Dettagli

Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a.

Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a. Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a. 2008 PARTE I 1. Si consideri il seguente modello di regressione lineare su dati cross

Dettagli

STATISTICA ESERCITAZIONE 13

STATISTICA ESERCITAZIONE 13 STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla

Dettagli

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI PSICOMETRIA Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI CAMPIONI INDIPENDENTI Campioni estratti casualmente dalla popolazione con caratteristiche omogenee Assegnazione

Dettagli

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali Università degli studi della Tuscia Principi di Statistica dr. Luca Secondi A.A. 014/015 Esercitazione di riepilogo Variabili casuali ESERCIZIO 1 Il peso delle compresse di un determinato medicinale si

Dettagli

MODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza,

MODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza, MODELLO DI REGRESSIONE LINEARE le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza, teorema di Gauss-Markov, verifica di ipotesi e test di

Dettagli

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

Regressioni Non Lineari

Regressioni Non Lineari Regressioni Non Lineari Fino ad ora abbiamo solo considerato realazioni lineari Ma le relazioni lineari non costituiscono sempre le migliori approssimazioni La regressione multipla può anche essere formulata

Dettagli

Minimi quadrati vincolati e test F

Minimi quadrati vincolati e test F Minimi quadrati vincolati e test F Impostazione del problema Spesso, i modelli econometrici che stimiamo hanno dei parametri che sono passibili di interpretazione diretta nella teoria economica. Consideriamo

Dettagli

Modelli per variabili dipendenti limitate. Amedeo Argentiero.

Modelli per variabili dipendenti limitate. Amedeo Argentiero. Modelli per variabili dipendenti limitate Amedeo Argentiero amedeo.argentiero@unipg.it Problema 1. Si desidera stimare la probabilità di accadimento di un evento (essere disoccupato, probabilità di sposarsi,

Dettagli

Statistica per le ricerche di mercato. 14. La regressione lineare multipla

Statistica per le ricerche di mercato. 14. La regressione lineare multipla Statistica per le ricerche di mercato A.A. 2011/12 Prof.ssa Tiziana Laureti Dott. Luca Secondi 14. La regressione lineare multipla 1 Modello di regressione lineare multipla Il modello di regressione multipla

Dettagli

Variabili casuali. - di Massimo Cristallo -

Variabili casuali. - di Massimo Cristallo - Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 16 e 27 maggio 2013 - di Massimo Cristallo - Variabili casuali

Dettagli

lezione 8 AA Paolo Brunori

lezione 8 AA Paolo Brunori AA 2016-2017 Paolo Brunori regressione multipla con n = k Immaginate di voler studiare i determinanti del voto all esame di econometria Y = β 1 X 1 + u Y i = β 1 H i + u i H=ore studiate alla settimana

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi) CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON

Dettagli

La regressione lineare multipla

La regressione lineare multipla 13 La regressione lineare multipla Introduzione 2 13.1 Il modello di regressione multipla 2 13.2 L analisi dei residui nel modello di regressione multipla 9 13.3 Il test per la verifica della significatività

Dettagli

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i BLAND-ALTMAN PLOT Il metodo di J. M. Bland e D. G. Altman è finalizzato alla verifica se due tecniche di misura sono comparabili. Resta da comprendere cosa si intenda con il termine metodi comparabili

Dettagli

Argomenti della lezione:

Argomenti della lezione: Lezione 13 L analisi della Varianza (ANOVA): il modello lineare Argomenti della lezione: Modello lineare Disegni a una via L Analisi della Varianza (ANOVA): Esamina differenze tra le medie di due o più

Dettagli

Esercizi sull associazione di variabili categoriche

Esercizi sull associazione di variabili categoriche Dipartimento di Fisica SMID a.a. 004/005 Esercizi sull associazione di variabili categoriche Prof. Maria Antonietta Penco penco@fisica.unige.it tel. 003536404 7//005 Esercizio Tra i 40 e 50 anni la probabilità

Dettagli

Minimi quadrati ordinari Interpretazione geometrica. Eduardo Rossi

Minimi quadrati ordinari Interpretazione geometrica. Eduardo Rossi Minimi quadrati ordinari Interpretazione geometrica Eduardo Rossi Il MRLM Il modello di regressione lineare multipla è usato per studiare le relazioni tra la variabile dipendente e diverse variabili indipendenti

Dettagli

Esame di Statistica del 14 dicembre 2007 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola

Esame di Statistica del 14 dicembre 2007 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Esame di Statistica del dicembre 2007 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. Es. 2 Es. 3 Es. Somma Voto finale Attenzione: si consegnano

Dettagli

Regressione. Monica Marabelli. 15 Gennaio 2016

Regressione. Monica Marabelli. 15 Gennaio 2016 Regressione Monica Marabelli 15 Gennaio 2016 La regressione L analisi di regressione é una tecnica statistica che serve a studiare la relazione tra variabili. In particolare, nel modello di regressione

Dettagli

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento. N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume

Dettagli

Statistica multivariata

Statistica multivariata Parte 3 : Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 43 I principali test statistici per la verifica di ipotesi: Il test del χ 2 per tavole di contingenza a 2 vie Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia

Dettagli

Principi di analisi causale Lezione 3

Principi di analisi causale Lezione 3 Anno accademico 2007/08 Principi di analisi causale Lezione 3 Docente: prof. Maurizio Pisati Approccio causale Nella maggior parte dei casi i ricercatori sociali utilizzano la regressione per stimare l

Dettagli

Statistica. Lezione 8

Statistica. Lezione 8 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 8 a.a 2011-2012 Dott.ssa Daniela

Dettagli

Statistica per le ricerche di mercato. 11. La regressione lineare multipla

Statistica per le ricerche di mercato. 11. La regressione lineare multipla Statistica per le ricerche di mercato A.A. 2012/13 Dr. L.Secondi 11. La regressione lineare multipla 1 Modello di regressione lineare multipla Il modello di regressione multipla estende il modello di regressione

Dettagli

Modelli Log-lineari Bivariati

Modelli Log-lineari Bivariati Modelli Log-lineari Bivariati Luca Stefanutti Università di Padova Dipartimento di Psicologia Applicata Via Venezia 8, 35131 Padova L.Stefanutti (Università di Padova) Modelli Log-lineari 1 / 71 Contenuti

Dettagli

LEZIONE N. 11 ( a cura di MADDALENA BEI)

LEZIONE N. 11 ( a cura di MADDALENA BEI) LEZIONE N. 11 ( a cura di MADDALENA BEI) F- test Assumiamo l ipotesi nulla H 0 :β 1,...,Β k =0 E diverso dal verificare che H 0 :B J =0 In realtà F - test è più generale H 0 :Aβ=0 H 1 :Aβ 0 A è una matrice

Dettagli

Elementi di matematica - dott. I. GRASSI

Elementi di matematica - dott. I. GRASSI Gli assi cartesiani e la retta. Il concetto di derivata. È ormai d uso comune nei libri, in televisione, nei quotidiani descrivere fenomeni di varia natura per mezzo di rappresentazioni grafiche. Tali

Dettagli

Corso Avanzato di Statistica

Corso Avanzato di Statistica Corso Avanzato di Statistica Test chi-quadrato per la verifica dell indipendenza Posa D, De Iaco S posa@economiaunileit sdeiaco@economiaunileit UNIVERSITÀ del SALENTO DIPTO DI SCIENZE ECONOMICHE E MATEMATICO-STATISTICHE

Dettagli

Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si

Dettagli

Presentazione dell edizione italiana

Presentazione dell edizione italiana 1 Indice generale Presentazione dell edizione italiana Prefazione xi xiii Capitolo 1 Una introduzione alla statistica 1 1.1 Raccolta dei dati e statistica descrittiva... 1 1.2 Inferenza statistica e modelli

Dettagli

Distribuzioni e inferenza statistica

Distribuzioni e inferenza statistica Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione

Dettagli

Test per l omogeneità delle varianze

Test per l omogeneità delle varianze Test per l omogeneità delle varianze Le carte di controllo hanno lo scopo di verificare se i campioni estratti provengono da un processo produttivo caratterizzato da un unico valore dello s.q.m. σ. Una

Dettagli

Matricola: Corso: 1. (4 Punti) Stimare la variazione del reddito quando il prezzo del prodotto finale raddoppia.

Matricola: Corso: 1. (4 Punti) Stimare la variazione del reddito quando il prezzo del prodotto finale raddoppia. Facoltà di Economia Statistica Esame 3-12/04/2010: A Cognome, Nome: Matricola: Corso: Problema 1. Per 5 imprese imprese è stato rilevato il reddito quinquennale medio (in milioni di euro), y, e il corrispondente

Dettagli

04 - Numeri Complessi

04 - Numeri Complessi Università degli Studi di Palermo Facoltà di Economia CdS Statistica per l Analisi dei Dati Appunti del corso di Matematica 04 - Numeri Complessi Anno Accademico 2013/2014 M. Tumminello, V. Lacagnina e

Dettagli

Casa dello Studente. Casa dello Studente

Casa dello Studente. Casa dello Studente Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino

Dettagli

Il campionamento e l inferenza. Il campionamento e l inferenza

Il campionamento e l inferenza. Il campionamento e l inferenza Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

05. Errore campionario e numerosità campionaria

05. Errore campionario e numerosità campionaria Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,

Dettagli

PROBABILITÀ ELEMENTARE

PROBABILITÀ ELEMENTARE Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti

Dettagli

Copyright Esselibri S.p.A.

Copyright Esselibri S.p.A. 70 3000 500 000 1500 1000 500 A B C D (a) Capitolo Terzo A B C D 500 1000 1500 000 5003000 3500 Fig. 1 - Ortogramma a colonne (a) e ortogramma a nastri (b) 4. MISURE DI ASSOCIAZIONE E DI COGRADUAZIONE

Dettagli

SCHEDA DIDATTICA N 7

SCHEDA DIDATTICA N 7 FACOLTA DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA CIVILE CORSO DI IDROLOGIA PROF. PASQUALE VERSACE SCHEDA DIDATTICA N 7 LA DISTRIBUZIONE NORMALE A.A. 01-13 La distribuzione NORMALE Uno dei più importanti

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologie. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità.

Università del Piemonte Orientale. Corso di laurea in biotecnologie. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità. Università del Piemonte Orientale Corso di laurea in biotecnologie Corso di Statistica Medica Le distribuzioni teoriche di probabilità. La distribuzione di probabilità binomiale Corso di laurea in biotecnologie

Dettagli

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE

Dettagli

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 Confronto fra gruppi: il metodo ANOVA Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 1 Nella popolazione, per ciascun gruppo la distribuzione della variabile risposta

Dettagli

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.

Dettagli

CURVE DI DURATA: Introduzione e Rappresentazione analitica

CURVE DI DURATA: Introduzione e Rappresentazione analitica CURVE DI DURATA: Introduzione e Rappresentazione analitica Premesse Si definisce durata di una portata Q riferita ad una sezione di misura, l'intervallo di tempo in cui le portate naturali del corso d

Dettagli

Analisi delle corrispondenze

Analisi delle corrispondenze Analisi delle corrispondenze Obiettivo: analisi delle relazioni tra le modalità di due (o più) caratteri qualitativi Individuazione della struttura dell associazione interna a una tabella di contingenza

Dettagli

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ SCHEDA

Dettagli

Università degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A

Università degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A Università degli Studi di Padova Corso di Laurea in Medicina e Chirurgia - A.A. 015-16 Corso Integrato: Statistica e Metodologia Epidemiologica Disciplina: Statistica e Metodologia Epidemiologica Docenti:

Dettagli

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con

Dettagli