Regressione Logistica: un Modello per Variabili Risposta Categoriali
|
|
- Achille Ferro
- 8 anni fa
- Visualizzazioni
Transcript
1 : un Modello per Variabili Risposta Categoriali Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 1 / 54
2 Introduzione Premessa I modelli di regressione hanno lo scopo di studiare le determinanti di variabili risposta quantitative (continue) Tuttavia è possibile costruire modelli di regressione anche per variabili risposta categoriali e/o discrete Il caso delle variabili discrete è particolarmente complesso Nel caso delle variabili categoriali possiamo distinguere 3 casi: 1 Variabili risposta dicotomiche o binarie (del tipo 0 1, V-F, Sì-No, ecc.); 2 Variabili risposta politomiche o multinomiali ordinali (almeno 3 categorie di risposta ordinate); 3 Variabili risposta politomiche o multinomiali non ordinali o nominali (almeno 3 categorie di risposta ordinate). Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 2 / 54
3 Introduzione Premessa I modelli di regressione hanno lo scopo di studiare le determinanti di variabili risposta quantitative (continue) Tuttavia è possibile costruire modelli di regressione anche per variabili risposta categoriali e/o discrete Il caso delle variabili discrete è particolarmente complesso Nel caso delle variabili categoriali possiamo distinguere 3 casi: 1 Variabili risposta dicotomiche o binarie (del tipo 0 1, V-F, Sì-No, ecc.); 2 Variabili risposta politomiche o multinomiali ordinali (almeno 3 categorie di risposta ordinate); 3 Variabili risposta politomiche o multinomiali non ordinali o nominali (almeno 3 categorie di risposta ordinate). Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 2 / 54
4 Introduzione Premessa I modelli di regressione hanno lo scopo di studiare le determinanti di variabili risposta quantitative (continue) Tuttavia è possibile costruire modelli di regressione anche per variabili risposta categoriali e/o discrete Il caso delle variabili discrete è particolarmente complesso Nel caso delle variabili categoriali possiamo distinguere 3 casi: 1 Variabili risposta dicotomiche o binarie (del tipo 0 1, V-F, Sì-No, ecc.); 2 Variabili risposta politomiche o multinomiali ordinali (almeno 3 categorie di risposta ordinate); 3 Variabili risposta politomiche o multinomiali non ordinali o nominali (almeno 3 categorie di risposta ordinate). Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 2 / 54
5 Introduzione Premessa I modelli di regressione hanno lo scopo di studiare le determinanti di variabili risposta quantitative (continue) Tuttavia è possibile costruire modelli di regressione anche per variabili risposta categoriali e/o discrete Il caso delle variabili discrete è particolarmente complesso Nel caso delle variabili categoriali possiamo distinguere 3 casi: 1 Variabili risposta dicotomiche o binarie (del tipo 0 1, V-F, Sì-No, ecc.); 2 Variabili risposta politomiche o multinomiali ordinali (almeno 3 categorie di risposta ordinate); 3 Variabili risposta politomiche o multinomiali non ordinali o nominali (almeno 3 categorie di risposta ordinate). Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 2 / 54
6 Introduzione Premessa I modelli di regressione hanno lo scopo di studiare le determinanti di variabili risposta quantitative (continue) Tuttavia è possibile costruire modelli di regressione anche per variabili risposta categoriali e/o discrete Il caso delle variabili discrete è particolarmente complesso Nel caso delle variabili categoriali possiamo distinguere 3 casi: 1 Variabili risposta dicotomiche o binarie (del tipo 0 1, V-F, Sì-No, ecc.); 2 Variabili risposta politomiche o multinomiali ordinali (almeno 3 categorie di risposta ordinate); 3 Variabili risposta politomiche o multinomiali non ordinali o nominali (almeno 3 categorie di risposta ordinate). Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 2 / 54
7 Regressione Logistica Si consideri una variabile risposta dicotomica Y. Essa prende valori 0 o 1 Solitamente si parla, rispettivamente, di fallimento e successo Ricordiamo che la µ(y) = E(Y) è pari alla proporzione di soggetti per i quali si osserva il successo (Σ1/n) Quindi i modelli di regressione logistica stimano le proporzioni dei successi in una popolazione Ovviamente P(y = 1) rappresenta la probabilità di osservare un successo per ciascun soggetto della popolazione Nel caso di Y dicotomica, si assumerà che la sua distribuzione sia una v.c. binomiale Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 3 / 54
8 Regressione Logistica Si consideri una variabile risposta dicotomica Y. Essa prende valori 0 o 1 Solitamente si parla, rispettivamente, di fallimento e successo Ricordiamo che la µ(y) = E(Y) è pari alla proporzione di soggetti per i quali si osserva il successo (Σ1/n) Quindi i modelli di regressione logistica stimano le proporzioni dei successi in una popolazione Ovviamente P(y = 1) rappresenta la probabilità di osservare un successo per ciascun soggetto della popolazione Nel caso di Y dicotomica, si assumerà che la sua distribuzione sia una v.c. binomiale Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 3 / 54
9 Regressione Logistica Si consideri una variabile risposta dicotomica Y. Essa prende valori 0 o 1 Solitamente si parla, rispettivamente, di fallimento e successo Ricordiamo che la µ(y) = E(Y) è pari alla proporzione di soggetti per i quali si osserva il successo (Σ1/n) Quindi i modelli di regressione logistica stimano le proporzioni dei successi in una popolazione Ovviamente P(y = 1) rappresenta la probabilità di osservare un successo per ciascun soggetto della popolazione Nel caso di Y dicotomica, si assumerà che la sua distribuzione sia una v.c. binomiale Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 3 / 54
10 Regressione Logistica Si consideri una variabile risposta dicotomica Y. Essa prende valori 0 o 1 Solitamente si parla, rispettivamente, di fallimento e successo Ricordiamo che la µ(y) = E(Y) è pari alla proporzione di soggetti per i quali si osserva il successo (Σ1/n) Quindi i modelli di regressione logistica stimano le proporzioni dei successi in una popolazione Ovviamente P(y = 1) rappresenta la probabilità di osservare un successo per ciascun soggetto della popolazione Nel caso di Y dicotomica, si assumerà che la sua distribuzione sia una v.c. binomiale Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 3 / 54
11 Regressione Logistica Si consideri una variabile risposta dicotomica Y. Essa prende valori 0 o 1 Solitamente si parla, rispettivamente, di fallimento e successo Ricordiamo che la µ(y) = E(Y) è pari alla proporzione di soggetti per i quali si osserva il successo (Σ1/n) Quindi i modelli di regressione logistica stimano le proporzioni dei successi in una popolazione Ovviamente P(y = 1) rappresenta la probabilità di osservare un successo per ciascun soggetto della popolazione Nel caso di Y dicotomica, si assumerà che la sua distribuzione sia una v.c. binomiale Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 3 / 54
12 Regressione Logistica Si consideri una variabile risposta dicotomica Y. Essa prende valori 0 o 1 Solitamente si parla, rispettivamente, di fallimento e successo Ricordiamo che la µ(y) = E(Y) è pari alla proporzione di soggetti per i quali si osserva il successo (Σ1/n) Quindi i modelli di regressione logistica stimano le proporzioni dei successi in una popolazione Ovviamente P(y = 1) rappresenta la probabilità di osservare un successo per ciascun soggetto della popolazione Nel caso di Y dicotomica, si assumerà che la sua distribuzione sia una v.c. binomiale Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 3 / 54
13 La distribuzione binomiale Per dati categoriali, possono verificarsi le seguenti condizioni: 1 Ciascuna osservazione cade in una di due categorie 2 Le probabilità per le due categorie sono le stesse per ciascuna osservazione. Indichiamo le probabilità con π per la categoria 1 e (1 π) per la categoria 2 3 I risultati di osservazioni successive sono indipendenti. Cioè, il risultato per una osservazione non dipende dal risultato delle altre osservazioni Un buon esempio è rappresentato dal lancio di una moneta: due possibili risultati (T o C), probabilità costante ad ogni lancio (π = 0.50) e il risultato ad ogni lancio è indipendente dai precedenti Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 4 / 54
14 La distribuzione binomiale Per dati categoriali, possono verificarsi le seguenti condizioni: 1 Ciascuna osservazione cade in una di due categorie 2 Le probabilità per le due categorie sono le stesse per ciascuna osservazione. Indichiamo le probabilità con π per la categoria 1 e (1 π) per la categoria 2 3 I risultati di osservazioni successive sono indipendenti. Cioè, il risultato per una osservazione non dipende dal risultato delle altre osservazioni Un buon esempio è rappresentato dal lancio di una moneta: due possibili risultati (T o C), probabilità costante ad ogni lancio (π = 0.50) e il risultato ad ogni lancio è indipendente dai precedenti Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 4 / 54
15 La distribuzione binomiale Per dati categoriali, possono verificarsi le seguenti condizioni: 1 Ciascuna osservazione cade in una di due categorie 2 Le probabilità per le due categorie sono le stesse per ciascuna osservazione. Indichiamo le probabilità con π per la categoria 1 e (1 π) per la categoria 2 3 I risultati di osservazioni successive sono indipendenti. Cioè, il risultato per una osservazione non dipende dal risultato delle altre osservazioni Un buon esempio è rappresentato dal lancio di una moneta: due possibili risultati (T o C), probabilità costante ad ogni lancio (π = 0.50) e il risultato ad ogni lancio è indipendente dai precedenti Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 4 / 54
16 La distribuzione binomiale Per dati categoriali, possono verificarsi le seguenti condizioni: 1 Ciascuna osservazione cade in una di due categorie 2 Le probabilità per le due categorie sono le stesse per ciascuna osservazione. Indichiamo le probabilità con π per la categoria 1 e (1 π) per la categoria 2 3 I risultati di osservazioni successive sono indipendenti. Cioè, il risultato per una osservazione non dipende dal risultato delle altre osservazioni Un buon esempio è rappresentato dal lancio di una moneta: due possibili risultati (T o C), probabilità costante ad ogni lancio (π = 0.50) e il risultato ad ogni lancio è indipendente dai precedenti Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 4 / 54
17 La distribuzione binomiale Per dati categoriali, possono verificarsi le seguenti condizioni: 1 Ciascuna osservazione cade in una di due categorie 2 Le probabilità per le due categorie sono le stesse per ciascuna osservazione. Indichiamo le probabilità con π per la categoria 1 e (1 π) per la categoria 2 3 I risultati di osservazioni successive sono indipendenti. Cioè, il risultato per una osservazione non dipende dal risultato delle altre osservazioni Un buon esempio è rappresentato dal lancio di una moneta: due possibili risultati (T o C), probabilità costante ad ogni lancio (π = 0.50) e il risultato ad ogni lancio è indipendente dai precedenti Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 4 / 54
18 Definizione: Probabilità per una Distribuzione Binomiale Sia π la probabilità che un osservazione assuma un valore della categoria 1. Nel caso di n osservazioni indipendenti, la probabilità di x successi per la categoria 1 è P(x) = n! x!(n x)! πx (1 π) n x, x = 0,1,2,...,n. Il simbolo n! è chiamato n fattoriale. Rappresenta n! = n. Ad esempio, 1! = 1, 2! = 1 2 = 2, 3! = = 6, e così via. Per definizione, 0! è pari a 1. Sostituendo ad x il valore del numero di successi desiderato per n e π fissati, si avrà la P(x), cioè la probabilità di avere x successi in n lanci della moneta Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 5 / 54
19 Definizione: Probabilità per una Distribuzione Binomiale Sia π la probabilità che un osservazione assuma un valore della categoria 1. Nel caso di n osservazioni indipendenti, la probabilità di x successi per la categoria 1 è P(x) = n! x!(n x)! πx (1 π) n x, x = 0,1,2,...,n. Il simbolo n! è chiamato n fattoriale. Rappresenta n! = n. Ad esempio, 1! = 1, 2! = 1 2 = 2, 3! = = 6, e così via. Per definizione, 0! è pari a 1. Sostituendo ad x il valore del numero di successi desiderato per n e π fissati, si avrà la P(x), cioè la probabilità di avere x successi in n lanci della moneta Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 5 / 54
20 Definizione: Probabilità per una Distribuzione Binomiale Sia π la probabilità che un osservazione assuma un valore della categoria 1. Nel caso di n osservazioni indipendenti, la probabilità di x successi per la categoria 1 è P(x) = n! x!(n x)! πx (1 π) n x, x = 0,1,2,...,n. Il simbolo n! è chiamato n fattoriale. Rappresenta n! = n. Ad esempio, 1! = 1, 2! = 1 2 = 2, 3! = = 6, e così via. Per definizione, 0! è pari a 1. Sostituendo ad x il valore del numero di successi desiderato per n e π fissati, si avrà la P(x), cioè la probabilità di avere x successi in n lanci della moneta Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 5 / 54
21 Definizione: Probabilità per una Distribuzione Binomiale Sia π la probabilità che un osservazione assuma un valore della categoria 1. Nel caso di n osservazioni indipendenti, la probabilità di x successi per la categoria 1 è P(x) = n! x!(n x)! πx (1 π) n x, x = 0,1,2,...,n. Il simbolo n! è chiamato n fattoriale. Rappresenta n! = n. Ad esempio, 1! = 1, 2! = 1 2 = 2, 3! = = 6, e così via. Per definizione, 0! è pari a 1. Sostituendo ad x il valore del numero di successi desiderato per n e π fissati, si avrà la P(x), cioè la probabilità di avere x successi in n lanci della moneta Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 5 / 54
22 Definizione: Probabilità per una Distribuzione Binomiale Sia π la probabilità che un osservazione assuma un valore della categoria 1. Nel caso di n osservazioni indipendenti, la probabilità di x successi per la categoria 1 è P(x) = n! x!(n x)! πx (1 π) n x, x = 0,1,2,...,n. Il simbolo n! è chiamato n fattoriale. Rappresenta n! = n. Ad esempio, 1! = 1, 2! = 1 2 = 2, 3! = = 6, e così via. Per definizione, 0! è pari a 1. Sostituendo ad x il valore del numero di successi desiderato per n e π fissati, si avrà la P(x), cioè la probabilità di avere x successi in n lanci della moneta Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 5 / 54
23 Definizione: Probabilità per una Distribuzione Binomiale Sia π la probabilità che un osservazione assuma un valore della categoria 1. Nel caso di n osservazioni indipendenti, la probabilità di x successi per la categoria 1 è P(x) = n! x!(n x)! πx (1 π) n x, x = 0,1,2,...,n. Il simbolo n! è chiamato n fattoriale. Rappresenta n! = n. Ad esempio, 1! = 1, 2! = 1 2 = 2, 3! = = 6, e così via. Per definizione, 0! è pari a 1. Sostituendo ad x il valore del numero di successi desiderato per n e π fissati, si avrà la P(x), cioè la probabilità di avere x successi in n lanci della moneta Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 5 / 54
24 Definizione: Probabilità per una Distribuzione Binomiale Sia π la probabilità che un osservazione assuma un valore della categoria 1. Nel caso di n osservazioni indipendenti, la probabilità di x successi per la categoria 1 è P(x) = n! x!(n x)! πx (1 π) n x, x = 0,1,2,...,n. Il simbolo n! è chiamato n fattoriale. Rappresenta n! = n. Ad esempio, 1! = 1, 2! = 1 2 = 2, 3! = = 6, e così via. Per definizione, 0! è pari a 1. Sostituendo ad x il valore del numero di successi desiderato per n e π fissati, si avrà la P(x), cioè la probabilità di avere x successi in n lanci della moneta Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 5 / 54
25 Proprietà di una distribuzione binomiale Proprietà di una distribuzione binomiale La distribuzione binomiale tende alla simmetria per π 0.50 ed è perfettamente simmetrica quando π = 0.50 con µ = nπ, σ = nπ(1 π). Ciò vale anche per la distribuzione campionaria di ˆπ Inoltre tale comportamento si ha anche per valori di π vicini a 0 o a 1, ma molto più lentamente Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 6 / 54
26 Proprietà di una distribuzione binomiale Proprietà di una distribuzione binomiale La distribuzione binomiale tende alla simmetria per π 0.50 ed è perfettamente simmetrica quando π = 0.50 con µ = nπ, σ = nπ(1 π). Ciò vale anche per la distribuzione campionaria di ˆπ Inoltre tale comportamento si ha anche per valori di π vicini a 0 o a 1, ma molto più lentamente Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 6 / 54
27 Proprietà di una distribuzione binomiale Proprietà di una distribuzione binomiale La distribuzione binomiale tende alla simmetria per π 0.50 ed è perfettamente simmetrica quando π = 0.50 con µ = nπ, σ = nπ(1 π). Ciò vale anche per la distribuzione campionaria di ˆπ Inoltre tale comportamento si ha anche per valori di π vicini a 0 o a 1, ma molto più lentamente Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 6 / 54
28 Proprietà di una distribuzione binomiale Proprietà di una distribuzione binomiale La distribuzione binomiale tende alla simmetria per π 0.50 ed è perfettamente simmetrica quando π = 0.50 con µ = nπ, σ = nπ(1 π). Ciò vale anche per la distribuzione campionaria di ˆπ Inoltre tale comportamento si ha anche per valori di π vicini a 0 o a 1, ma molto più lentamente Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 6 / 54
29 Proprietà di una distribuzione binomiale Distribuzione campionaria di ˆπ per vari valori di π e n Probability n 10 Probability p.1 p p.1 Probability pˆ 1.0 n 50 Probability 0 p pˆ p.1 p.5 pˆ p.1 n 100 Probability 0 p.5 Probability pˆ 1.0 p.1 p.5 pˆ p.1 p.5 pˆ 1.0 Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 7 / 54
30 Proprietà di una distribuzione binomiale Distribuzione campionaria di ˆπ per vari valori di π e n Probability n 10 Probability p.1 p p.1 Probability pˆ 1.0 n 50 Probability 0 p pˆ p.1 p.5 pˆ p.1 n 100 Probability 0 p.5 Probability pˆ 1.0 p.1 p.5 pˆ p.1 p.5 pˆ 1.0 Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 7 / 54
31 Proprietà di una distribuzione binomiale Esempio 6.10 Genere e scelta degli allievi per il corso di management Nell Esempio 6.1 avevamo trattato il caso di una popolazione di dipendenti per metà M e metà F Scelti a caso n = 10 dipendenti, sia x il numero di F e π = 0.50 la probabilità di scegliere una F La probabilità di avere x F scegliendo n = 10 dipendenti è P(x) = 10! x!(10 x)! (0.50)x (0.50) 10 x, x = 0,1,...,10. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 8 / 54
32 Proprietà di una distribuzione binomiale Esempio 6.10 Genere e scelta degli allievi per il corso di management Nell Esempio 6.1 avevamo trattato il caso di una popolazione di dipendenti per metà M e metà F Scelti a caso n = 10 dipendenti, sia x il numero di F e π = 0.50 la probabilità di scegliere una F La probabilità di avere x F scegliendo n = 10 dipendenti è P(x) = 10! x!(10 x)! (0.50)x (0.50) 10 x, x = 0,1,...,10. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 8 / 54
33 Proprietà di una distribuzione binomiale Esempio 6.10 Genere e scelta degli allievi per il corso di management Nell Esempio 6.1 avevamo trattato il caso di una popolazione di dipendenti per metà M e metà F Scelti a caso n = 10 dipendenti, sia x il numero di F e π = 0.50 la probabilità di scegliere una F La probabilità di avere x F scegliendo n = 10 dipendenti è P(x) = 10! x!(10 x)! (0.50)x (0.50) 10 x, x = 0,1,...,10. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 8 / 54
34 Proprietà di una distribuzione binomiale Esempio 6.10 Genere e scelta degli allievi per il corso di management Nell Esempio 6.1 avevamo trattato il caso di una popolazione di dipendenti per metà M e metà F Scelti a caso n = 10 dipendenti, sia x il numero di F e π = 0.50 la probabilità di scegliere una F La probabilità di avere x F scegliendo n = 10 dipendenti è P(x) = 10! x!(10 x)! (0.50)x (0.50) 10 x, x = 0,1,...,10. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 8 / 54
35 Proprietà di una distribuzione binomiale Ad esempio, la probabilità di non avere nessuna F (x = 0) è P(0) = 10! 0!10! (0.50)0 (0.50) 10 = (0.50) 10 = La probabilità che sia scelta esattamente una femmina è pari a P(1) = 10! 1!9! (0.50)1 (0.50) 9 = 10(0.50)(0.50) 9 = Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 9 / 54
36 Proprietà di una distribuzione binomiale Ad esempio, la probabilità di non avere nessuna F (x = 0) è P(0) = 10! 0!10! (0.50)0 (0.50) 10 = (0.50) 10 = La probabilità che sia scelta esattamente una femmina è pari a P(1) = 10! 1!9! (0.50)1 (0.50) 9 = 10(0.50)(0.50) 9 = Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 9 / 54
37 Proprietà di una distribuzione binomiale Modello a Probabilità Lineare Nel caso di un modello con una sola variabile esplicativa (che sarà continua) avremo P(y = 1) = α+βx In questo caso si suppone che la probabilità di successo sia in funzione lineare con X Per questa ragione prende il nome di Modello a Probabilità Lineare Tuttavia è facile mostrare come tale modello sia inadeguato per prevedere la P(y = 1) Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 10 / 54
38 Proprietà di una distribuzione binomiale Modello a Probabilità Lineare Nel caso di un modello con una sola variabile esplicativa (che sarà continua) avremo P(y = 1) = α+βx In questo caso si suppone che la probabilità di successo sia in funzione lineare con X Per questa ragione prende il nome di Modello a Probabilità Lineare Tuttavia è facile mostrare come tale modello sia inadeguato per prevedere la P(y = 1) Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 10 / 54
39 Proprietà di una distribuzione binomiale Modello a Probabilità Lineare Nel caso di un modello con una sola variabile esplicativa (che sarà continua) avremo P(y = 1) = α+βx In questo caso si suppone che la probabilità di successo sia in funzione lineare con X Per questa ragione prende il nome di Modello a Probabilità Lineare Tuttavia è facile mostrare come tale modello sia inadeguato per prevedere la P(y = 1) Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 10 / 54
40 Proprietà di una distribuzione binomiale Modello a Probabilità Lineare Nel caso di un modello con una sola variabile esplicativa (che sarà continua) avremo P(y = 1) = α+βx In questo caso si suppone che la probabilità di successo sia in funzione lineare con X Per questa ragione prende il nome di Modello a Probabilità Lineare Tuttavia è facile mostrare come tale modello sia inadeguato per prevedere la P(y = 1) Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 10 / 54
41 Proprietà di una distribuzione binomiale Sappiamo che la P(y = 1) è un valore dell intevallo [0,1] e non eccede tale intervallo La figura mostra che il Modello a Probabilità Lineare non rispetta questa condizione P(y 1) 1 Logistic (1) Linear Logistic (2) 0 x Al contrario, la funzione logistica (casi 1 e 2), si dimostra adatta allo scopo A questo punto il problema è: come faccio a linearizzare una funzione logistica? Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 11 / 54
42 Proprietà di una distribuzione binomiale Sappiamo che la P(y = 1) è un valore dell intevallo [0,1] e non eccede tale intervallo La figura mostra che il Modello a Probabilità Lineare non rispetta questa condizione P(y 1) 1 Logistic (1) Linear Logistic (2) 0 x Al contrario, la funzione logistica (casi 1 e 2), si dimostra adatta allo scopo A questo punto il problema è: come faccio a linearizzare una funzione logistica? Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 11 / 54
43 Proprietà di una distribuzione binomiale Sappiamo che la P(y = 1) è un valore dell intevallo [0,1] e non eccede tale intervallo La figura mostra che il Modello a Probabilità Lineare non rispetta questa condizione P(y 1) 1 Logistic (1) Linear Logistic (2) 0 x Al contrario, la funzione logistica (casi 1 e 2), si dimostra adatta allo scopo A questo punto il problema è: come faccio a linearizzare una funzione logistica? Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 11 / 54
44 Il Modello di Regressione Logistica per Risposte Binarie Il Modello di Regressione Logistica per Risposte Binarie In primo luogo scriviamo l equazione di regressione di Y su X, utilizzando la funzione logistica P(y = 1) = eα+βx 1+e α+βx. In seguito riprenderemo questa formulazione. Per ora ci basti osservare come la relazione tra Y e X non sia lineare, bensì logistica Per semplificare la notazione e ottenere risultati più semplici, linearizziamo questa espressione Il modo più semplice è passare al logaritmo naturale (base e) ambo i membri dell equazione e otteniamo log[p(y = 1)] = log(e α+βx ) log(1+e α+βx ) = = log(e α+βx ) 0 log(e α+βx ) = 0 Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 12 / 54
45 Il Modello di Regressione Logistica per Risposte Binarie Il Modello di Regressione Logistica per Risposte Binarie In primo luogo scriviamo l equazione di regressione di Y su X, utilizzando la funzione logistica P(y = 1) = eα+βx 1+e α+βx. In seguito riprenderemo questa formulazione. Per ora ci basti osservare come la relazione tra Y e X non sia lineare, bensì logistica Per semplificare la notazione e ottenere risultati più semplici, linearizziamo questa espressione Il modo più semplice è passare al logaritmo naturale (base e) ambo i membri dell equazione e otteniamo log[p(y = 1)] = log(e α+βx ) log(1+e α+βx ) = = log(e α+βx ) 0 log(e α+βx ) = 0 Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 12 / 54
46 Il Modello di Regressione Logistica per Risposte Binarie Il Modello di Regressione Logistica per Risposte Binarie In primo luogo scriviamo l equazione di regressione di Y su X, utilizzando la funzione logistica P(y = 1) = eα+βx 1+e α+βx. In seguito riprenderemo questa formulazione. Per ora ci basti osservare come la relazione tra Y e X non sia lineare, bensì logistica Per semplificare la notazione e ottenere risultati più semplici, linearizziamo questa espressione Il modo più semplice è passare al logaritmo naturale (base e) ambo i membri dell equazione e otteniamo log[p(y = 1)] = log(e α+βx ) log(1+e α+βx ) = = log(e α+βx ) 0 log(e α+βx ) = 0 Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 12 / 54
47 Il Modello di Regressione Logistica per Risposte Binarie Il Modello di Regressione Logistica per Risposte Binarie In primo luogo scriviamo l equazione di regressione di Y su X, utilizzando la funzione logistica P(y = 1) = eα+βx 1+e α+βx. In seguito riprenderemo questa formulazione. Per ora ci basti osservare come la relazione tra Y e X non sia lineare, bensì logistica Per semplificare la notazione e ottenere risultati più semplici, linearizziamo questa espressione Il modo più semplice è passare al logaritmo naturale (base e) ambo i membri dell equazione e otteniamo log[p(y = 1)] = log(e α+βx ) log(1+e α+βx ) = = log(e α+βx ) 0 log(e α+βx ) = 0 Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 12 / 54
48 Il Modello di Regressione Logistica per Risposte Binarie Per risolvere il problema, si costruisce il rapporto tra la probabilità di successo e la probabilità di insuccesso e lo si passa al logaritmo [ ] P(y = 1) log = α+βx. 1 P(y = 1) Il rapporto di probabilità P(y = 1)/[1 P(y = 1)] è definito odds o rapporto tra quote Ad es., se P(y = 1) = 0.75, l odds vale 0.75/0.25= 3.0, cioè la probabilità del successo è 3 volte il valore di quella dell insuccesso La quantità log [P(y = 1)/(1 P(y = 1))] trasformazione logistica o logit In tal modo si avrà il modello di regressione logistica logit[p(y = 1)] = α+βx. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 13 / 54
49 Il Modello di Regressione Logistica per Risposte Binarie Per risolvere il problema, si costruisce il rapporto tra la probabilità di successo e la probabilità di insuccesso e lo si passa al logaritmo [ ] P(y = 1) log = α+βx. 1 P(y = 1) Il rapporto di probabilità P(y = 1)/[1 P(y = 1)] è definito odds o rapporto tra quote Ad es., se P(y = 1) = 0.75, l odds vale 0.75/0.25= 3.0, cioè la probabilità del successo è 3 volte il valore di quella dell insuccesso La quantità log [P(y = 1)/(1 P(y = 1))] trasformazione logistica o logit In tal modo si avrà il modello di regressione logistica logit[p(y = 1)] = α+βx. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 13 / 54
50 Il Modello di Regressione Logistica per Risposte Binarie Per risolvere il problema, si costruisce il rapporto tra la probabilità di successo e la probabilità di insuccesso e lo si passa al logaritmo [ ] P(y = 1) log = α+βx. 1 P(y = 1) Il rapporto di probabilità P(y = 1)/[1 P(y = 1)] è definito odds o rapporto tra quote Ad es., se P(y = 1) = 0.75, l odds vale 0.75/0.25= 3.0, cioè la probabilità del successo è 3 volte il valore di quella dell insuccesso La quantità log [P(y = 1)/(1 P(y = 1))] trasformazione logistica o logit In tal modo si avrà il modello di regressione logistica logit[p(y = 1)] = α+βx. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 13 / 54
51 Il Modello di Regressione Logistica per Risposte Binarie Per risolvere il problema, si costruisce il rapporto tra la probabilità di successo e la probabilità di insuccesso e lo si passa al logaritmo [ ] P(y = 1) log = α+βx. 1 P(y = 1) Il rapporto di probabilità P(y = 1)/[1 P(y = 1)] è definito odds o rapporto tra quote Ad es., se P(y = 1) = 0.75, l odds vale 0.75/0.25= 3.0, cioè la probabilità del successo è 3 volte il valore di quella dell insuccesso La quantità log [P(y = 1)/(1 P(y = 1))] trasformazione logistica o logit In tal modo si avrà il modello di regressione logistica logit[p(y = 1)] = α+βx. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 13 / 54
52 Il Modello di Regressione Logistica per Risposte Binarie Per risolvere il problema, si costruisce il rapporto tra la probabilità di successo e la probabilità di insuccesso e lo si passa al logaritmo [ ] P(y = 1) log = α+βx. 1 P(y = 1) Il rapporto di probabilità P(y = 1)/[1 P(y = 1)] è definito odds o rapporto tra quote Ad es., se P(y = 1) = 0.75, l odds vale 0.75/0.25= 3.0, cioè la probabilità del successo è 3 volte il valore di quella dell insuccesso La quantità log [P(y = 1)/(1 P(y = 1))] trasformazione logistica o logit In tal modo si avrà il modello di regressione logistica logit[p(y = 1)] = α+βx. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 13 / 54
53 Il Modello di Regressione Logistica per Risposte Binarie Interpretazione del parametro β Il logit[p(y = 1)] varia linearmente in funzione di X oltre l intervallo [0, 1], mentre la [P(y = 1)] varia seguendo la funzione logistica entro l intervallo [0,1] Il valore di β indica se la [P(y = 1)] cresce (β > 0) o decresce (β < 0) al crescere di X Nelle due curve del grafico, la (2) ha un β più grande di quello della curva (1) P(y 1) 1 Logistic (1) Linear Logistic (2) 0 x Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 14 / 54
54 Il Modello di Regressione Logistica per Risposte Binarie Interpretazione del parametro β Il logit[p(y = 1)] varia linearmente in funzione di X oltre l intervallo [0, 1], mentre la [P(y = 1)] varia seguendo la funzione logistica entro l intervallo [0,1] Il valore di β indica se la [P(y = 1)] cresce (β > 0) o decresce (β < 0) al crescere di X Nelle due curve del grafico, la (2) ha un β più grande di quello della curva (1) P(y 1) 1 Logistic (1) Linear Logistic (2) 0 x Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 14 / 54
55 Il Modello di Regressione Logistica per Risposte Binarie Interpretazione del parametro β Il logit[p(y = 1)] varia linearmente in funzione di X oltre l intervallo [0, 1], mentre la [P(y = 1)] varia seguendo la funzione logistica entro l intervallo [0,1] Il valore di β indica se la [P(y = 1)] cresce (β > 0) o decresce (β < 0) al crescere di X Nelle due curve del grafico, la (2) ha un β più grande di quello della curva (1) P(y 1) 1 Logistic (1) Linear Logistic (2) 0 x Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 14 / 54
56 Il Modello di Regressione Logistica per Risposte Binarie Interpretazione del parametro β Quando P(y = 1) = 0.50, l odds P(y = 1)/[1 P(y = 1)] = 1, conseguentemente il log[p(y = 1)/(1 P(y = 1))] = 0 Per determinare il valore di x per il quale P(y = 1) = 0.50, eguagliamo il log(odds) pari a 0 al secondo membro dell equazione del modello α+βx Risolvendo per x otteniamo P(y = 1) = 0.50 quando x = α/β In questo modo siamo in grado di determinare il valore di X per il quale la probabilità di successo eguaglia quella di insuccesso Le stime dei parametri α e β sono ottenute applicando il Metodo della Massima Verosimiglianza e non quello dei Minimi Quadrati Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 15 / 54
57 Il Modello di Regressione Logistica per Risposte Binarie Interpretazione del parametro β Quando P(y = 1) = 0.50, l odds P(y = 1)/[1 P(y = 1)] = 1, conseguentemente il log[p(y = 1)/(1 P(y = 1))] = 0 Per determinare il valore di x per il quale P(y = 1) = 0.50, eguagliamo il log(odds) pari a 0 al secondo membro dell equazione del modello α+βx Risolvendo per x otteniamo P(y = 1) = 0.50 quando x = α/β In questo modo siamo in grado di determinare il valore di X per il quale la probabilità di successo eguaglia quella di insuccesso Le stime dei parametri α e β sono ottenute applicando il Metodo della Massima Verosimiglianza e non quello dei Minimi Quadrati Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 15 / 54
58 Il Modello di Regressione Logistica per Risposte Binarie Interpretazione del parametro β Quando P(y = 1) = 0.50, l odds P(y = 1)/[1 P(y = 1)] = 1, conseguentemente il log[p(y = 1)/(1 P(y = 1))] = 0 Per determinare il valore di x per il quale P(y = 1) = 0.50, eguagliamo il log(odds) pari a 0 al secondo membro dell equazione del modello α+βx Risolvendo per x otteniamo P(y = 1) = 0.50 quando x = α/β In questo modo siamo in grado di determinare il valore di X per il quale la probabilità di successo eguaglia quella di insuccesso Le stime dei parametri α e β sono ottenute applicando il Metodo della Massima Verosimiglianza e non quello dei Minimi Quadrati Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 15 / 54
59 Il Modello di Regressione Logistica per Risposte Binarie Interpretazione del parametro β Quando P(y = 1) = 0.50, l odds P(y = 1)/[1 P(y = 1)] = 1, conseguentemente il log[p(y = 1)/(1 P(y = 1))] = 0 Per determinare il valore di x per il quale P(y = 1) = 0.50, eguagliamo il log(odds) pari a 0 al secondo membro dell equazione del modello α+βx Risolvendo per x otteniamo P(y = 1) = 0.50 quando x = α/β In questo modo siamo in grado di determinare il valore di X per il quale la probabilità di successo eguaglia quella di insuccesso Le stime dei parametri α e β sono ottenute applicando il Metodo della Massima Verosimiglianza e non quello dei Minimi Quadrati Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 15 / 54
60 Il Modello di Regressione Logistica per Risposte Binarie Interpretazione del parametro β Quando P(y = 1) = 0.50, l odds P(y = 1)/[1 P(y = 1)] = 1, conseguentemente il log[p(y = 1)/(1 P(y = 1))] = 0 Per determinare il valore di x per il quale P(y = 1) = 0.50, eguagliamo il log(odds) pari a 0 al secondo membro dell equazione del modello α+βx Risolvendo per x otteniamo P(y = 1) = 0.50 quando x = α/β In questo modo siamo in grado di determinare il valore di X per il quale la probabilità di successo eguaglia quella di insuccesso Le stime dei parametri α e β sono ottenute applicando il Metodo della Massima Verosimiglianza e non quello dei Minimi Quadrati Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 15 / 54
61 Il Modello di Regressione Logistica per Risposte Binarie Esempio 15.1 Reddito e Possesso delle Carte di Credito Si consideri un campione di n = 100 adulti selezionati casualmente in Italia. Si è rilevato il reddito annuale e se possedevano o meno una carta di credito La variabile risposta è dicotomica (possesso CC: 1 = Sì, 0 = No). Il predittore è quantitativo A ciascun livello di X, si può calcolare la probabilità di possedere una CC, attraverso il rapporto tra i soggetti che posseggono una CC e il totale soggetti per quel valore di X Tabella: Reddito Annuale (in Migliaia di Euro) e Possesso di una Carta di Credito. Number Credit Number Credit Number Credit Income Cases Cards Income Cases Cards Income Cases Cards Fonte: Si ringrazia R. Piccarreta, Università Bocconi University, Milano. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 16 / 54
62 Il Modello di Regressione Logistica per Risposte Binarie Esempio 15.1 Reddito e Possesso delle Carte di Credito Si consideri un campione di n = 100 adulti selezionati casualmente in Italia. Si è rilevato il reddito annuale e se possedevano o meno una carta di credito La variabile risposta è dicotomica (possesso CC: 1 = Sì, 0 = No). Il predittore è quantitativo A ciascun livello di X, si può calcolare la probabilità di possedere una CC, attraverso il rapporto tra i soggetti che posseggono una CC e il totale soggetti per quel valore di X Tabella: Reddito Annuale (in Migliaia di Euro) e Possesso di una Carta di Credito. Number Credit Number Credit Number Credit Income Cases Cards Income Cases Cards Income Cases Cards Fonte: Si ringrazia R. Piccarreta, Università Bocconi University, Milano. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 16 / 54
63 Il Modello di Regressione Logistica per Risposte Binarie Esempio 15.1 Reddito e Possesso delle Carte di Credito Si consideri un campione di n = 100 adulti selezionati casualmente in Italia. Si è rilevato il reddito annuale e se possedevano o meno una carta di credito La variabile risposta è dicotomica (possesso CC: 1 = Sì, 0 = No). Il predittore è quantitativo A ciascun livello di X, si può calcolare la probabilità di possedere una CC, attraverso il rapporto tra i soggetti che posseggono una CC e il totale soggetti per quel valore di X Tabella: Reddito Annuale (in Migliaia di Euro) e Possesso di una Carta di Credito. Number Credit Number Credit Number Credit Income Cases Cards Income Cases Cards Income Cases Cards Fonte: Si ringrazia R. Piccarreta, Università Bocconi University, Milano. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 16 / 54
64 Il Modello di Regressione Logistica per Risposte Binarie Il modello stimato è logit[ˆp(y = 1)] = x. Il valore di β = > 0, indica che al crescere del Reddito Annuale cresce la probabilità di possedere una CC Il software fornisce il seguente prospetto Tabella: Modello di Regressione Logistica sul Possesso della Carta di Credito in Italia B S.E. Exp(B) reddito costante Il valore exp(b) = exp(.1054) = consente di calcolare l odds ratio (OR) Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 17 / 54
65 Il Modello di Regressione Logistica per Risposte Binarie Il modello stimato è logit[ˆp(y = 1)] = x. Il valore di β = > 0, indica che al crescere del Reddito Annuale cresce la probabilità di possedere una CC Il software fornisce il seguente prospetto Tabella: Modello di Regressione Logistica sul Possesso della Carta di Credito in Italia B S.E. Exp(B) reddito costante Il valore exp(b) = exp(.1054) = consente di calcolare l odds ratio (OR) Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 17 / 54
66 Il Modello di Regressione Logistica per Risposte Binarie Il modello stimato è logit[ˆp(y = 1)] = x. Il valore di β = > 0, indica che al crescere del Reddito Annuale cresce la probabilità di possedere una CC Il software fornisce il seguente prospetto Tabella: Modello di Regressione Logistica sul Possesso della Carta di Credito in Italia B S.E. Exp(B) reddito costante Il valore exp(b) = exp(.1054) = consente di calcolare l odds ratio (OR) Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 17 / 54
67 Il Modello di Regressione Logistica per Risposte Binarie Il modello stimato è logit[ˆp(y = 1)] = x. Il valore di β = > 0, indica che al crescere del Reddito Annuale cresce la probabilità di possedere una CC Il software fornisce il seguente prospetto Tabella: Modello di Regressione Logistica sul Possesso della Carta di Credito in Italia B S.E. Exp(B) reddito costante Il valore exp(b) = exp(.1054) = consente di calcolare l odds ratio (OR) Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 17 / 54
68 Il Modello di Regressione Logistica per Risposte Binarie Il grafico mostra la funzione di previsione per il logit 1 P(y ˆ 1) 0 Income La probabilità di successo vale 0.50 per x = ˆα/ˆβ = (3.518)/(0.105)= 33.5 Cioè la probabilità stimata di possedere una CC è inferiore a 0.50 per redditi inferiori a 33.5 migliaia di euro, superiore a 0.50 per redditi superiori a quella soglia Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 18 / 54
69 Il Modello di Regressione Logistica per Risposte Binarie Il grafico mostra la funzione di previsione per il logit 1 P(y ˆ 1) 0 Income La probabilità di successo vale 0.50 per x = ˆα/ˆβ = (3.518)/(0.105)= 33.5 Cioè la probabilità stimata di possedere una CC è inferiore a 0.50 per redditi inferiori a 33.5 migliaia di euro, superiore a 0.50 per redditi superiori a quella soglia Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 18 / 54
70 Il Modello di Regressione Logistica per Risposte Binarie Il grafico mostra la funzione di previsione per il logit 1 P(y ˆ 1) 0 Income La probabilità di successo vale 0.50 per x = ˆα/ˆβ = (3.518)/(0.105)= 33.5 Cioè la probabilità stimata di possedere una CC è inferiore a 0.50 per redditi inferiori a 33.5 migliaia di euro, superiore a 0.50 per redditi superiori a quella soglia Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 18 / 54
71 Il Modello di Regressione Logistica per Risposte Binarie Il grafico mostra la funzione di previsione per il logit 1 P(y ˆ 1) 0 Income La probabilità di successo vale 0.50 per x = ˆα/ˆβ = (3.518)/(0.105)= 33.5 Cioè la probabilità stimata di possedere una CC è inferiore a 0.50 per redditi inferiori a 33.5 migliaia di euro, superiore a 0.50 per redditi superiori a quella soglia Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 18 / 54
72 Il Modello di Regressione Logistica per Risposte Binarie Equazione di Regressione Logistica per le Probabilità Abbiamo visto a cosa corrisponde direttamente la P(y = 1) Si può, quindi, costruire un equazione che stimi direttamente tale probabilità e non il suo logit, cioè P(y = 1) = eα+βx 1+eα+βx. (1) In questa equazione la potenza di e rappresenta l antilogaritmo Ricordiamo che il numero di Nepero e rappresenta la base del logaritmo naturale, cioè il numero a cui bisogna elevare la base per avere l argomento. Ad es., log e (1) = 0 in quanto e 0 = 1 Attraverso la formula (1) è possibile determinare la probabilità di successo per qualunque valore di x Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 19 / 54
73 Il Modello di Regressione Logistica per Risposte Binarie Equazione di Regressione Logistica per le Probabilità Abbiamo visto a cosa corrisponde direttamente la P(y = 1) Si può, quindi, costruire un equazione che stimi direttamente tale probabilità e non il suo logit, cioè P(y = 1) = eα+βx 1+eα+βx. (1) In questa equazione la potenza di e rappresenta l antilogaritmo Ricordiamo che il numero di Nepero e rappresenta la base del logaritmo naturale, cioè il numero a cui bisogna elevare la base per avere l argomento. Ad es., log e (1) = 0 in quanto e 0 = 1 Attraverso la formula (1) è possibile determinare la probabilità di successo per qualunque valore di x Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 19 / 54
74 Il Modello di Regressione Logistica per Risposte Binarie Equazione di Regressione Logistica per le Probabilità Abbiamo visto a cosa corrisponde direttamente la P(y = 1) Si può, quindi, costruire un equazione che stimi direttamente tale probabilità e non il suo logit, cioè P(y = 1) = eα+βx 1+eα+βx. (1) In questa equazione la potenza di e rappresenta l antilogaritmo Ricordiamo che il numero di Nepero e rappresenta la base del logaritmo naturale, cioè il numero a cui bisogna elevare la base per avere l argomento. Ad es., log e (1) = 0 in quanto e 0 = 1 Attraverso la formula (1) è possibile determinare la probabilità di successo per qualunque valore di x Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 19 / 54
75 Il Modello di Regressione Logistica per Risposte Binarie Equazione di Regressione Logistica per le Probabilità Abbiamo visto a cosa corrisponde direttamente la P(y = 1) Si può, quindi, costruire un equazione che stimi direttamente tale probabilità e non il suo logit, cioè P(y = 1) = eα+βx 1+eα+βx. (1) In questa equazione la potenza di e rappresenta l antilogaritmo Ricordiamo che il numero di Nepero e rappresenta la base del logaritmo naturale, cioè il numero a cui bisogna elevare la base per avere l argomento. Ad es., log e (1) = 0 in quanto e 0 = 1 Attraverso la formula (1) è possibile determinare la probabilità di successo per qualunque valore di x Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 19 / 54
76 Il Modello di Regressione Logistica per Risposte Binarie Equazione di Regressione Logistica per le Probabilità Abbiamo visto a cosa corrisponde direttamente la P(y = 1) Si può, quindi, costruire un equazione che stimi direttamente tale probabilità e non il suo logit, cioè P(y = 1) = eα+βx 1+eα+βx. (1) In questa equazione la potenza di e rappresenta l antilogaritmo Ricordiamo che il numero di Nepero e rappresenta la base del logaritmo naturale, cioè il numero a cui bisogna elevare la base per avere l argomento. Ad es., log e (1) = 0 in quanto e 0 = 1 Attraverso la formula (1) è possibile determinare la probabilità di successo per qualunque valore di x Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 19 / 54
1. Distribuzioni campionarie
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 9 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 TEST D IPOTESI Partiamo da un esempio presente sul libro di testo.
DettagliProbabilità II Variabili casuali discrete
Probabilità II Variabili casuali discrete Definizioni principali. Valore atteso e Varianza. Teorema di Bienaymé - Čebičev. V.C. Notevoli: Bernoulli e Binomiale. Concetto di variabile casuale Cos'è una
DettagliLE FUNZIONI A DUE VARIABILI
Capitolo I LE FUNZIONI A DUE VARIABILI In questo primo capitolo introduciamo alcune definizioni di base delle funzioni reali a due variabili reali. Nel seguito R denoterà l insieme dei numeri reali mentre
DettagliStatistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.
Analisi multivariata Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Cercare di capire le relazioni
DettagliStatistica inferenziale
Statistica inferenziale Popolazione e campione Molto spesso siamo interessati a trarre delle conclusioni su persone che hanno determinate caratteristiche (pazienti, atleti, bambini, gestanti, ) Osserveremo
DettagliLa distribuzione Normale. La distribuzione Normale
La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una
DettagliStima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una
DettagliLogaritmi ed esponenziali
Logaritmi ed esponenziali definizioni, proprietà ITIS Feltrinelli anno scolastico 2007-2008 A cosa servono i logaritmi I logaritmi rendono possibile trasformare prodotti in somme, quozienti in differenze,
DettagliFunzioni. Parte prima. Daniele Serra
Funzioni Parte prima Daniele Serra Nota: questi appunti non sostituiscono in alcun modo le lezioni del prof. Favilli, né alcun libro di testo. Sono piuttosto da intendersi a integrazione di entrambi. 1
DettagliLa variabile casuale Binomiale
La variabile casuale Binomiale Si costruisce a partire dalla nozione di esperimento casuale Bernoulliano che consiste in un insieme di prove ripetute con le seguenti caratteristiche: i) ad ogni singola
DettagliUniversità del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza
Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica
DettagliViene lanciata una moneta. Se esce testa vinco 100 euro, se esce croce non vinco niente. Quale è il valore della mia vincita?
Viene lanciata una moneta. Se esce testa vinco 00 euro, se esce croce non vinco niente. Quale è il valore della mia vincita? Osserviamo che il valore della vincita dipende dal risultato dell esperimento
DettagliIl concetto di valore medio in generale
Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliRegressione logistica
Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer Metodi di classificazione Tecniche principali Alcuni esempi Data set Default I dati La regressione logistica Esempio Il modello
DettagliRegressione logistica. Strumenti quantitativi per la gestione
Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/4a_rlg.html#(1) 1/25 Metodi di classificazione I metodi usati per analizzare
DettagliLimited Dependent Variable Models
Limited Dependent Variable Models Logit Tobit Probit Modelli Logit e Probit Latent variable models for binary choice Models for descrete dependent variable Traducendo Spesso vogliamo studiare (le determinanti
DettagliLa distribuzione Gaussiana
Università del Piemonte Orientale Corso di Laurea in Biotecnologie Corso di Statistica Medica La distribuzione Normale (o di Gauss) Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione
DettagliPROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE
Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ -
Dettagli1 Serie di Taylor di una funzione
Analisi Matematica 2 CORSO DI STUDI IN SMID CORSO DI ANALISI MATEMATICA 2 CAPITOLO 7 SERIE E POLINOMI DI TAYLOR Serie di Taylor di una funzione. Definizione di serie di Taylor Sia f(x) una funzione definita
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara
Dettaglilezione 18 AA 2015-2016 Paolo Brunori
AA 2015-2016 Paolo Brunori Previsioni - spesso come economisti siamo interessati a prevedere quale sarà il valore di una certa variabile nel futuro - quando osserviamo una variabile nel tempo possiamo
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliProbabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)
Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:
DettagliIntorni Fissato un punto sull' asse reale, si definisce intorno del punto, un intervallo aperto contenente e tutto contenuto in
Intorni Fissato un punto sull' asse reale, si definisce intorno del punto, un intervallo aperto contenente e tutto contenuto in Solitamente si fa riferimento ad intorni simmetrici =, + + Definizione: dato
DettagliProva di autovalutazione Prof. Roberta Siciliano
Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.
DettagliSchemi delle Lezioni di Matematica Generale. Pierpaolo Montana
Schemi delle Lezioni di Matematica Generale Pierpaolo Montana A volte i fenomeni economici che ci interessano non variano con continuitá oppure non possono essere osservati con continuitá, ma solo a intervalli
DettagliE naturale chiedersi alcune cose sulla media campionaria x n
Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile
DettagliBasi di matematica per il corso di micro
Basi di matematica per il corso di micro Microeconomia (anno accademico 2006-2007) Lezione del 21 Marzo 2007 Marianna Belloc 1 Le funzioni 1.1 Definizione Una funzione è una regola che descrive una relazione
DettagliTransitori del primo ordine
Università di Ferrara Corso di Elettrotecnica Transitori del primo ordine Si consideri il circuito in figura, composto da un generatore ideale di tensione, una resistenza ed una capacità. I tre bipoli
DettagliMICROECONOMIA La teoria del consumo: Alcuni Arricchimenti. Enrico Saltari Università di Roma La Sapienza
MICROECONOMIA La teoria del consumo: Alcuni Arricchimenti Enrico Saltari Università di Roma La Sapienza 1 Dotazioni iniziali Il consumatore dispone ora non di un dato reddito monetario ma di un ammontare
DettagliEsercizio 2. 2.1 Scrivi l equazione di equilibrio nel mercato dei beni. Qual è il livello della produzione di equilibrio?
Sergio Vergalli Corso di Economia Politica A-G Università di Brescia Esercizio 2 L economia del principato di Andorra è descritta dalle seguenti equazioni: Md = 6Y -120 i Ms = 5400 T = 400 G = 400 dove,
DettagliAnalisi di scenario File Nr. 10
1 Analisi di scenario File Nr. 10 Giorgio Calcagnini Università di Urbino Dip. Economia, Società, Politica giorgio.calcagnini@uniurb.it http://www.econ.uniurb.it/calcagnini/ http://www.econ.uniurb.it/calcagnini/forecasting.html
DettagliEsercitazione n.1 (v.c. Binomiale, Poisson, Normale)
Esercizio 1. Un azienda produce palline da tennis che hanno probabilità 0,02 di essere difettose, indipendentemente l una dall altra. La confezione di vendita contiene 8 palline prese a caso dalla produzione
DettagliCapitolo 11 Test chi-quadro
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova
DettagliRelazioni statistiche: regressione e correlazione
Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica
DettagliLezione 9: Cambio di base
Lezione 9: Cambio di base In questa lezione vogliamo affrontare uno degli argomenti piu ostici per lo studente e cioè il cambio di base all interno di uno spazio vettoriale, inoltre cercheremo di capire
DettagliPro e contro delle RNA
Pro e contro delle RNA Pro: - flessibilità: le RNA sono approssimatori universali; - aggiornabilità sequenziale: la stima dei pesi della rete può essere aggiornata man mano che arriva nuova informazione;
DettagliFunzioni inverse Simmetrie rispetto alla bisettrice dei quadranti dispari. Consideriamo la trasformazione descritta dalle equazioni : = y
Funzioni inverse Simmetrie rispetto alla bisettrice dei quadranti dispari. Consideriamo la trasformazione descritta dalle equazioni : ' = y y' = Consideriamo il punto P(,5) se eseguiamo tra trasformazione
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Stima puntuale per la proporzione Da un lotto di arance se ne estraggono 400, e di queste 180
DettagliEsercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)
Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso
DettagliCorrispondenze e funzioni
Corrispondenze e funzioni L attività fondamentale della mente umana consiste nello stabilire corrispondenze e relazioni tra oggetti; è anche per questo motivo che il concetto di corrispondenza è uno dei
DettagliLA MASSIMIZZAZIONE DEL PROFITTO ATTRAVERSO LA FISSAZIONE DEL PREZZO IN FUNZIONE DELLE QUANTITÀ
LA MASSIMIZZAZIONE DEL PROFITTO ATTRAVERSO LA FISSAZIONE DEL PREZZO IN FUNZIONE DELLE QUANTITÀ In questa Appendice mostreremo come trovare la tariffa in due parti che massimizza i profitti di Clearvoice,
DettagliStatistica Matematica A - Ing. Meccanica, Aerospaziale I prova in itinere - 19 novembre 2004
Statistica Matematica A - Ing. Meccanica, Aerospaziale I prova in itinere - 19 novembre 200 Esercizio 1 Tre apparecchiature M 1, M 2 e M 3 in un anno si guastano, in maniera indipendente, con probabilità
DettagliUn po di statistica. Christian Ferrari. Laboratorio di Matematica
Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di
DettagliSPC e distribuzione normale con Access
SPC e distribuzione normale con Access In questo articolo esamineremo una applicazione Access per il calcolo e la rappresentazione grafica della distribuzione normale, collegata con tabelle di Clienti,
DettagliProposta di soluzione della prova di matematica Liceo scientifico di Ordinamento - 2014
Proposta di soluzione della prova di matematica Liceo scientifico di Ordinamento - 14 Problema 1 Punto a) Osserviamo che g (x) = f(x) e pertanto g () = f() = in quanto Γ è tangente all asse delle ascisse,
DettagliCapitolo 5. Funzioni. Grafici.
Capitolo 5 Funzioni. Grafici. Definizione: Una funzione f di una variabile reale,, è una corrispondenza che associa ad ogni numero reale appartenente ad un insieme D f R un unico numero reale, y R, denotato
Dettagli3 GRAFICI DI FUNZIONI
3 GRAFICI DI FUNZIONI Particolari sottoinsiemi di R che noi studieremo sono i grafici di funzioni. Il grafico di una funzione f (se non è specificato il dominio di definizione) è dato da {(x, y) : x dom
DettagliProof. Dimostrazione per assurdo. Consideriamo l insieme complementare di P nell insieme
G Pareschi Principio di induzione Il Principio di Induzione (che dovreste anche avere incontrato nel Corso di Analisi I) consente di dimostrare Proposizioni il cui enunciato è in funzione di un numero
Dettaglif(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da
Data una funzione reale f di variabile reale x, definita su un sottoinsieme proprio D f di R (con questo voglio dire che il dominio di f è un sottoinsieme di R che non coincide con tutto R), ci si chiede
DettagliMatematica generale CTF
Equazioni differenziali 9 dicembre 2015 Si chiamano equazioni differenziali quelle equazioni le cui incognite non sono variabili reali ma funzioni di una o più variabili. Le equazioni differenziali possono
DettagliCAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI
VERO FALSO CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI 1. V F Un ipotesi statistica è un assunzione sulle caratteristiche di una o più variabili in una o più popolazioni 2. V F L ipotesi nulla unita
DettagliBlanchard, Macroeconomia Una prospettiva europea, Il Mulino 2011 Capitolo IV. I mercati finanziari. Capitolo IV. I mercati finanziari
Capitolo IV. I mercati finanziari 1. La domanda di moneta La moneta può essere usata per transazioni, ma non paga interessi. In realtà ci sono due tipi di moneta: il circolante, la moneta metallica e cartacea,
DettagliCOEFFICIENTI BINOMIALI
COEFFICIENTI BINOMIALI Michele Impedovo micheleimpedovo@uni-bocconiit Una definizione insiemistica Se n è un numero naturale e è un numero naturale compreso tra e n, si indica con il simbolo il coefficiente
DettagliLA CORRELAZIONE LINEARE
LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione
DettagliRelazioni tra variabili
Università degli Studi di Padova Facoltà di Medicina e Chirurgia Corso di Laurea in Medicina e Chirurgia - A.A. 009-10 Scuole di specializzazione in: Medicina Legale, Medicina del Lavoro, Igiene e Medicina
DettagliScelte in condizioni di rischio e incertezza
CAPITOLO 5 Scelte in condizioni di rischio e incertezza Esercizio 5.1. Tizio ha risparmiato nel corso dell anno 500 euro; può investirli in obbligazioni che rendono, in modo certo, il 10% oppure in azioni
DettagliProbabilità discreta
Probabilità discreta Daniele A. Gewurz 1 Che probabilità c è che succeda...? Una delle applicazioni della combinatoria è nel calcolo di probabilità discrete. Quando abbiamo a che fare con un fenomeno che
DettagliVerifica di ipotesi e intervalli di confidenza nella regressione multipla
Verifica di ipotesi e intervalli di confidenza nella regressione multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2014 Rossi MRLM Econometria - 2014 1 / 23 Sommario Variabili di controllo
DettagliSTRATEGIA DI TRADING. Turning Points
STRATEGIA DI TRADING Turning Points ANALISI E OBIETTIVI DA RAGGIUNGERE Studiare l andamento dei prezzi dei mercati finanziari con una certa previsione su tendenze future Analisi Tecnica: studio dell andamento
DettagliFunzioni funzione dominio codominio legge argomento variabile indipendente variabile dipendente
Funzioni In matematica, una funzione f da X in Y consiste in: 1. un insieme X detto dominio di f 2. un insieme Y detto codominio di f 3. una legge che ad ogni elemento x in X associa uno ed un solo elemento
DettagliESAME DI STATISTICA Nome: Cognome: Matricola:
ESAME DI STATISTICA Nome: Cognome: Matricola: ISTRUZIONI: Per la prova è consentito esclusivamente l uso di una calcolatrice tascabile, delle tavole della normale e della t di Student. I risultati degli
DettagliAnno 5 4 Funzioni reali. elementari
Anno 5 4 Funzioni reali elementari 1 Introduzione In questa lezione studieremo alcune funzioni molto comuni, dette per questo funzioni elementari. Al termine di questa lezione sarai in grado di definire
DettagliIl confronto fra proporzioni
L. Boni Il rapporto Un rapporto (ratio), attribuendo un ampio significato al termine, è il risultato della divisione di una certa quantità a per un altra quantità b Il rapporto Spesso, in maniera più specifica,
DettagliMatematica Finanziaria Soluzione della prova scritta del 15/05/09
Matematica Finanziaria Soluzione della prova scritta del 15/05/09 ESERCIZIO 1 Il valore in t = 60 semestri dei versamenti effettuati dall individuo è W (m) = R(1 + i 2 ) m + R(1 + i 2 ) m 1 +... R(1 +
DettagliFunzione logaritmo con. funzione inversa della funzione di
FUNZIONE LOGARITMO a è la base della funzione logaritmo ed è una costante positiva fissata e diversa da 1 x è l argomento della funzione logaritmo e varia nel dominio Funzione logaritmo con funzione inversa
DettagliStatistica. Lezione 6
Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante
DettagliFACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE SIMULAZIONE della PROVA SCRITTA di STATISTICA 23/03/2011
FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE SIMULAZIONE della PROVA SCRITTA di STATISTICA 23/3/2 ESERCIZIO (2+2+2+2) La seguente tabella riporta la distribuzione della variabile "Stato Civile"
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato
DettagliEsercizi riassuntivi di probabilità
Esercizi riassuntivi di probabilità Esercizio 1 Una ditta produttrice di fotocopiatrici sa che la durata di una macchina (in migliaia di copie) si distribuisce come una normale con µ = 1600 e 2 = 3600.
DettagliFacciamo qualche precisazione
Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione
DettagliLa categoria «ES» presenta (di solito) gli stessi comandi
Utilizzo delle calcolatrici FX 991 ES+ Parte II PARMA, 11 Marzo 2014 Prof. Francesco Bologna bolfra@gmail.com ARGOMENTI DELLA LEZIONE 1. Richiami lezione precedente 2.Calcolo delle statistiche di regressione:
DettagliLezione 14. Risparmio e investimento. Leonardo Bargigli
Lezione 14. Risparmio e investimento Leonardo Bargigli Risparmio e investimento nella contabilità nazionale Ripartiamo dalla definizione di PIL in termini di spesa finale Y = C + I + G + NX Consideriamo
DettagliCertificati di investimento e strategie di yield enchancement
Certificati di investimento e strategie di yield enchancement Isabella Liso Deutsche Bank Trading Online Expo 2014 Milano - Palazzo Mezzanotte - 24 ottobre 2014 1 INDICE Introduzione. Express Autocallable...
Dettagli( x) ( x) 0. Equazioni irrazionali
Equazioni irrazionali Definizione: si definisce equazione irrazionale un equazione in cui compaiono uno o più radicali contenenti l incognita. Esempio 7 Ricordiamo quanto visto sulle condizioni di esistenza
DettagliCapitolo 10 Z Elasticità della domanda
Capitolo 10 Z Elasticità della domanda Sommario Z 1. L elasticità della domanda rispetto al prezzo. - 2. La misura dell elasticità. - 3. I fattori determinanti l elasticità. - 4. L elasticità rispetto
DettagliSuccessioni di funzioni reali
E-school di Arrigo Amadori Analisi I Successioni di funzioni reali 01 Introduzione. In questo capitolo applicheremo i concetti di successione e di serie alle funzioni numeriche reali. Una successione di
DettagliEconometria. lezione 17. variabili dipendenti binarie. Econometria. lezione 17. AA 2014-2015 Paolo Brunori
AA 2014-2015 Paolo Brunori domande di mutui rigettate - nei dati raccolti a Boston negli anni 90 il tasso di rifiuto è 28% per i neri e 9% per i bianchi - si può parlare di discriminazione? - è possibili
DettagliCorso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza
Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 17/06/2015 NOME: COGNOME: MATRICOLA: Esercizio 1 Un sistema
DettagliEsercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco
Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco Alfonso Iodice D Enza April 26, 2007 1...prima di cominciare Contare, operazione solitamente semplice, può diventare complicata se lo scopo
DettagliEsponenziali elogaritmi
Esponenziali elogaritmi Potenze ad esponente reale Ricordiamo che per un qualsiasi numero razionale m n prendere n>0) si pone a m n = n a m (in cui si può sempre a patto che a sia un numero reale positivo.
DettagliMetodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla
Il metodo della regressione può essere esteso dal caso in cui si considera la variabilità della risposta della y in relazione ad una sola variabile indipendente X ad una situazione più generale in cui
DettagliCapitolo 2. Operazione di limite
Capitolo 2 Operazione di ite In questo capitolo vogliamo occuparci dell operazione di ite, strumento indispensabile per scoprire molte proprietà delle funzioni. D ora in avanti riguarderemo i domini A
DettagliLezione 10: Il problema del consumatore: Preferenze e scelta ottimale
Corso di Scienza Economica (Economia Politica) prof. G. Di Bartolomeo Lezione 10: Il problema del consumatore: Preferenze e scelta ottimale Facoltà di Scienze della Comunicazione Università di Teramo Scelta
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,
DettagliE NECESSARIO RICORRERE ALLE VARIABILI CASUALI
IL CONCETTO DI VARIABILE CASUALE Associare una misura di probabilità al verificarsi di un certo evento (come esito di un esperimento) non sempre è sufficiente a risolvere gran parte dei problemi reali
DettagliStatistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.
Iniziamo con definizione (capiremo fra poco la sua utilità): DEFINIZIONE DI VARIABILE ALEATORIA Una variabile aleatoria (in breve v.a.) X è funzione che ha come dominio Ω e come codominio R. In formule:
DettagliStime sul costo e sugli effetti distributivi di programmi di contrasto alla povertà. Massimo Baldini (CAPP) Daniele Pacifico (CAPP e MLPS)
Stime sul costo e sugli effetti distributivi di programmi di contrasto alla povertà Massimo Baldini (CAPP) Daniele Pacifico (CAPP e MLPS) Il modello di riferimento Per le simulazioni è stato impiegato
DettagliRaccolta degli Scritti d Esame di ANALISI MATEMATICA U.D. 1 assegnati nei Corsi di Laurea di Fisica, Fisica Applicata, Matematica
DIPARTIMENTO DI MATEMATICA Università degli Studi di Trento Via Sommarive - Povo (TRENTO) Raccolta degli Scritti d Esame di ANALISI MATEMATICA U.D. 1 assegnati nei Corsi di Laurea di Fisica, Fisica Applicata,
DettagliTema A. 1.2. Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che
Statistica Cognome: Laurea Triennale in Biologia Nome: 26 luglio 2012 Matricola: Tema A 1. Parte A 1.1. Sia x 1, x 2,..., x n un campione di n dati con media campionaria x e varianza campionaria s 2 x
DettagliPaperone e Rockerduck: a cosa serve l antitrust?
Paperone e Rockerduck: a cosa serve l antitrust? Paperone Anna Torre, Rockerduck Ludovico Pernazza 1-14 giugno 01 Università di Pavia, Dipartimento di Matematica Concorrenza Due imprese Pap e Rock operano
DettagliMatematica Applicata. Probabilità e statistica
Matematica Applicata Probabilità e statistica Fenomeni casuali Fenomeni che si verificano in modi non prevedibili a priori 1. Lancio di una moneta: non sono in grado di prevedere con certezza se il risultato
DettagliSTATISTICA IX lezione
Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri
DettagliCorso di Analisi Matematica. Polinomi e serie di Taylor
a.a. 2013/14 Laurea triennale in Informatica Corso di Analisi Matematica Polinomi e serie di Taylor Avvertenza Questi sono appunti informali delle lezioni, che vengono resi disponibili per comodità degli
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Distribuzione di probabilità, funzione di ripartizione di una v.c. discreta Il tasso di cambio
Dettagli3. Confronto tra medie di due campioni indipendenti o appaiati
BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO
DettagliInferenza statistica I Alcuni esercizi. Stefano Tonellato
Inferenza statistica I Alcuni esercizi Stefano Tonellato Anno Accademico 2006-2007 Avvertenza Una parte del materiale è stato tratto da Grigoletto M. e Ventura L. (1998). Statistica per le scienze economiche,
DettagliUniversità di Napoli Parthenope Facoltà di Ingegneria
Università di Napoli Parthenope Facoltà di Ingegneria Corso di rasmissione Numerica docente: Prof. Vito Pascazio 18 a Lezione: 13/1/4 19 a Lezione: 14/1/4 Sommario rasmissione di segnali PM numerici su
Dettagli