Regressione Logistica: un Modello per Variabili Risposta Categoriali

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Regressione Logistica: un Modello per Variabili Risposta Categoriali"

Transcript

1 : un Modello per Variabili Risposta Categoriali Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 1 / 54

2 Introduzione Premessa I modelli di regressione hanno lo scopo di studiare le determinanti di variabili risposta quantitative (continue) Tuttavia è possibile costruire modelli di regressione anche per variabili risposta categoriali e/o discrete Il caso delle variabili discrete è particolarmente complesso Nel caso delle variabili categoriali possiamo distinguere 3 casi: 1 Variabili risposta dicotomiche o binarie (del tipo 0 1, V-F, Sì-No, ecc.); 2 Variabili risposta politomiche o multinomiali ordinali (almeno 3 categorie di risposta ordinate); 3 Variabili risposta politomiche o multinomiali non ordinali o nominali (almeno 3 categorie di risposta ordinate). Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 2 / 54

3 Introduzione Premessa I modelli di regressione hanno lo scopo di studiare le determinanti di variabili risposta quantitative (continue) Tuttavia è possibile costruire modelli di regressione anche per variabili risposta categoriali e/o discrete Il caso delle variabili discrete è particolarmente complesso Nel caso delle variabili categoriali possiamo distinguere 3 casi: 1 Variabili risposta dicotomiche o binarie (del tipo 0 1, V-F, Sì-No, ecc.); 2 Variabili risposta politomiche o multinomiali ordinali (almeno 3 categorie di risposta ordinate); 3 Variabili risposta politomiche o multinomiali non ordinali o nominali (almeno 3 categorie di risposta ordinate). Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 2 / 54

4 Introduzione Premessa I modelli di regressione hanno lo scopo di studiare le determinanti di variabili risposta quantitative (continue) Tuttavia è possibile costruire modelli di regressione anche per variabili risposta categoriali e/o discrete Il caso delle variabili discrete è particolarmente complesso Nel caso delle variabili categoriali possiamo distinguere 3 casi: 1 Variabili risposta dicotomiche o binarie (del tipo 0 1, V-F, Sì-No, ecc.); 2 Variabili risposta politomiche o multinomiali ordinali (almeno 3 categorie di risposta ordinate); 3 Variabili risposta politomiche o multinomiali non ordinali o nominali (almeno 3 categorie di risposta ordinate). Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 2 / 54

5 Introduzione Premessa I modelli di regressione hanno lo scopo di studiare le determinanti di variabili risposta quantitative (continue) Tuttavia è possibile costruire modelli di regressione anche per variabili risposta categoriali e/o discrete Il caso delle variabili discrete è particolarmente complesso Nel caso delle variabili categoriali possiamo distinguere 3 casi: 1 Variabili risposta dicotomiche o binarie (del tipo 0 1, V-F, Sì-No, ecc.); 2 Variabili risposta politomiche o multinomiali ordinali (almeno 3 categorie di risposta ordinate); 3 Variabili risposta politomiche o multinomiali non ordinali o nominali (almeno 3 categorie di risposta ordinate). Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 2 / 54

6 Introduzione Premessa I modelli di regressione hanno lo scopo di studiare le determinanti di variabili risposta quantitative (continue) Tuttavia è possibile costruire modelli di regressione anche per variabili risposta categoriali e/o discrete Il caso delle variabili discrete è particolarmente complesso Nel caso delle variabili categoriali possiamo distinguere 3 casi: 1 Variabili risposta dicotomiche o binarie (del tipo 0 1, V-F, Sì-No, ecc.); 2 Variabili risposta politomiche o multinomiali ordinali (almeno 3 categorie di risposta ordinate); 3 Variabili risposta politomiche o multinomiali non ordinali o nominali (almeno 3 categorie di risposta ordinate). Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 2 / 54

7 Regressione Logistica Si consideri una variabile risposta dicotomica Y. Essa prende valori 0 o 1 Solitamente si parla, rispettivamente, di fallimento e successo Ricordiamo che la µ(y) = E(Y) è pari alla proporzione di soggetti per i quali si osserva il successo (Σ1/n) Quindi i modelli di regressione logistica stimano le proporzioni dei successi in una popolazione Ovviamente P(y = 1) rappresenta la probabilità di osservare un successo per ciascun soggetto della popolazione Nel caso di Y dicotomica, si assumerà che la sua distribuzione sia una v.c. binomiale Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 3 / 54

8 Regressione Logistica Si consideri una variabile risposta dicotomica Y. Essa prende valori 0 o 1 Solitamente si parla, rispettivamente, di fallimento e successo Ricordiamo che la µ(y) = E(Y) è pari alla proporzione di soggetti per i quali si osserva il successo (Σ1/n) Quindi i modelli di regressione logistica stimano le proporzioni dei successi in una popolazione Ovviamente P(y = 1) rappresenta la probabilità di osservare un successo per ciascun soggetto della popolazione Nel caso di Y dicotomica, si assumerà che la sua distribuzione sia una v.c. binomiale Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 3 / 54

9 Regressione Logistica Si consideri una variabile risposta dicotomica Y. Essa prende valori 0 o 1 Solitamente si parla, rispettivamente, di fallimento e successo Ricordiamo che la µ(y) = E(Y) è pari alla proporzione di soggetti per i quali si osserva il successo (Σ1/n) Quindi i modelli di regressione logistica stimano le proporzioni dei successi in una popolazione Ovviamente P(y = 1) rappresenta la probabilità di osservare un successo per ciascun soggetto della popolazione Nel caso di Y dicotomica, si assumerà che la sua distribuzione sia una v.c. binomiale Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 3 / 54

10 Regressione Logistica Si consideri una variabile risposta dicotomica Y. Essa prende valori 0 o 1 Solitamente si parla, rispettivamente, di fallimento e successo Ricordiamo che la µ(y) = E(Y) è pari alla proporzione di soggetti per i quali si osserva il successo (Σ1/n) Quindi i modelli di regressione logistica stimano le proporzioni dei successi in una popolazione Ovviamente P(y = 1) rappresenta la probabilità di osservare un successo per ciascun soggetto della popolazione Nel caso di Y dicotomica, si assumerà che la sua distribuzione sia una v.c. binomiale Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 3 / 54

11 Regressione Logistica Si consideri una variabile risposta dicotomica Y. Essa prende valori 0 o 1 Solitamente si parla, rispettivamente, di fallimento e successo Ricordiamo che la µ(y) = E(Y) è pari alla proporzione di soggetti per i quali si osserva il successo (Σ1/n) Quindi i modelli di regressione logistica stimano le proporzioni dei successi in una popolazione Ovviamente P(y = 1) rappresenta la probabilità di osservare un successo per ciascun soggetto della popolazione Nel caso di Y dicotomica, si assumerà che la sua distribuzione sia una v.c. binomiale Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 3 / 54

12 Regressione Logistica Si consideri una variabile risposta dicotomica Y. Essa prende valori 0 o 1 Solitamente si parla, rispettivamente, di fallimento e successo Ricordiamo che la µ(y) = E(Y) è pari alla proporzione di soggetti per i quali si osserva il successo (Σ1/n) Quindi i modelli di regressione logistica stimano le proporzioni dei successi in una popolazione Ovviamente P(y = 1) rappresenta la probabilità di osservare un successo per ciascun soggetto della popolazione Nel caso di Y dicotomica, si assumerà che la sua distribuzione sia una v.c. binomiale Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 3 / 54

13 La distribuzione binomiale Per dati categoriali, possono verificarsi le seguenti condizioni: 1 Ciascuna osservazione cade in una di due categorie 2 Le probabilità per le due categorie sono le stesse per ciascuna osservazione. Indichiamo le probabilità con π per la categoria 1 e (1 π) per la categoria 2 3 I risultati di osservazioni successive sono indipendenti. Cioè, il risultato per una osservazione non dipende dal risultato delle altre osservazioni Un buon esempio è rappresentato dal lancio di una moneta: due possibili risultati (T o C), probabilità costante ad ogni lancio (π = 0.50) e il risultato ad ogni lancio è indipendente dai precedenti Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 4 / 54

14 La distribuzione binomiale Per dati categoriali, possono verificarsi le seguenti condizioni: 1 Ciascuna osservazione cade in una di due categorie 2 Le probabilità per le due categorie sono le stesse per ciascuna osservazione. Indichiamo le probabilità con π per la categoria 1 e (1 π) per la categoria 2 3 I risultati di osservazioni successive sono indipendenti. Cioè, il risultato per una osservazione non dipende dal risultato delle altre osservazioni Un buon esempio è rappresentato dal lancio di una moneta: due possibili risultati (T o C), probabilità costante ad ogni lancio (π = 0.50) e il risultato ad ogni lancio è indipendente dai precedenti Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 4 / 54

15 La distribuzione binomiale Per dati categoriali, possono verificarsi le seguenti condizioni: 1 Ciascuna osservazione cade in una di due categorie 2 Le probabilità per le due categorie sono le stesse per ciascuna osservazione. Indichiamo le probabilità con π per la categoria 1 e (1 π) per la categoria 2 3 I risultati di osservazioni successive sono indipendenti. Cioè, il risultato per una osservazione non dipende dal risultato delle altre osservazioni Un buon esempio è rappresentato dal lancio di una moneta: due possibili risultati (T o C), probabilità costante ad ogni lancio (π = 0.50) e il risultato ad ogni lancio è indipendente dai precedenti Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 4 / 54

16 La distribuzione binomiale Per dati categoriali, possono verificarsi le seguenti condizioni: 1 Ciascuna osservazione cade in una di due categorie 2 Le probabilità per le due categorie sono le stesse per ciascuna osservazione. Indichiamo le probabilità con π per la categoria 1 e (1 π) per la categoria 2 3 I risultati di osservazioni successive sono indipendenti. Cioè, il risultato per una osservazione non dipende dal risultato delle altre osservazioni Un buon esempio è rappresentato dal lancio di una moneta: due possibili risultati (T o C), probabilità costante ad ogni lancio (π = 0.50) e il risultato ad ogni lancio è indipendente dai precedenti Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 4 / 54

17 La distribuzione binomiale Per dati categoriali, possono verificarsi le seguenti condizioni: 1 Ciascuna osservazione cade in una di due categorie 2 Le probabilità per le due categorie sono le stesse per ciascuna osservazione. Indichiamo le probabilità con π per la categoria 1 e (1 π) per la categoria 2 3 I risultati di osservazioni successive sono indipendenti. Cioè, il risultato per una osservazione non dipende dal risultato delle altre osservazioni Un buon esempio è rappresentato dal lancio di una moneta: due possibili risultati (T o C), probabilità costante ad ogni lancio (π = 0.50) e il risultato ad ogni lancio è indipendente dai precedenti Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 4 / 54

18 Definizione: Probabilità per una Distribuzione Binomiale Sia π la probabilità che un osservazione assuma un valore della categoria 1. Nel caso di n osservazioni indipendenti, la probabilità di x successi per la categoria 1 è P(x) = n! x!(n x)! πx (1 π) n x, x = 0,1,2,...,n. Il simbolo n! è chiamato n fattoriale. Rappresenta n! = n. Ad esempio, 1! = 1, 2! = 1 2 = 2, 3! = = 6, e così via. Per definizione, 0! è pari a 1. Sostituendo ad x il valore del numero di successi desiderato per n e π fissati, si avrà la P(x), cioè la probabilità di avere x successi in n lanci della moneta Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 5 / 54

19 Definizione: Probabilità per una Distribuzione Binomiale Sia π la probabilità che un osservazione assuma un valore della categoria 1. Nel caso di n osservazioni indipendenti, la probabilità di x successi per la categoria 1 è P(x) = n! x!(n x)! πx (1 π) n x, x = 0,1,2,...,n. Il simbolo n! è chiamato n fattoriale. Rappresenta n! = n. Ad esempio, 1! = 1, 2! = 1 2 = 2, 3! = = 6, e così via. Per definizione, 0! è pari a 1. Sostituendo ad x il valore del numero di successi desiderato per n e π fissati, si avrà la P(x), cioè la probabilità di avere x successi in n lanci della moneta Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 5 / 54

20 Definizione: Probabilità per una Distribuzione Binomiale Sia π la probabilità che un osservazione assuma un valore della categoria 1. Nel caso di n osservazioni indipendenti, la probabilità di x successi per la categoria 1 è P(x) = n! x!(n x)! πx (1 π) n x, x = 0,1,2,...,n. Il simbolo n! è chiamato n fattoriale. Rappresenta n! = n. Ad esempio, 1! = 1, 2! = 1 2 = 2, 3! = = 6, e così via. Per definizione, 0! è pari a 1. Sostituendo ad x il valore del numero di successi desiderato per n e π fissati, si avrà la P(x), cioè la probabilità di avere x successi in n lanci della moneta Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 5 / 54

21 Definizione: Probabilità per una Distribuzione Binomiale Sia π la probabilità che un osservazione assuma un valore della categoria 1. Nel caso di n osservazioni indipendenti, la probabilità di x successi per la categoria 1 è P(x) = n! x!(n x)! πx (1 π) n x, x = 0,1,2,...,n. Il simbolo n! è chiamato n fattoriale. Rappresenta n! = n. Ad esempio, 1! = 1, 2! = 1 2 = 2, 3! = = 6, e così via. Per definizione, 0! è pari a 1. Sostituendo ad x il valore del numero di successi desiderato per n e π fissati, si avrà la P(x), cioè la probabilità di avere x successi in n lanci della moneta Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 5 / 54

22 Definizione: Probabilità per una Distribuzione Binomiale Sia π la probabilità che un osservazione assuma un valore della categoria 1. Nel caso di n osservazioni indipendenti, la probabilità di x successi per la categoria 1 è P(x) = n! x!(n x)! πx (1 π) n x, x = 0,1,2,...,n. Il simbolo n! è chiamato n fattoriale. Rappresenta n! = n. Ad esempio, 1! = 1, 2! = 1 2 = 2, 3! = = 6, e così via. Per definizione, 0! è pari a 1. Sostituendo ad x il valore del numero di successi desiderato per n e π fissati, si avrà la P(x), cioè la probabilità di avere x successi in n lanci della moneta Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 5 / 54

23 Definizione: Probabilità per una Distribuzione Binomiale Sia π la probabilità che un osservazione assuma un valore della categoria 1. Nel caso di n osservazioni indipendenti, la probabilità di x successi per la categoria 1 è P(x) = n! x!(n x)! πx (1 π) n x, x = 0,1,2,...,n. Il simbolo n! è chiamato n fattoriale. Rappresenta n! = n. Ad esempio, 1! = 1, 2! = 1 2 = 2, 3! = = 6, e così via. Per definizione, 0! è pari a 1. Sostituendo ad x il valore del numero di successi desiderato per n e π fissati, si avrà la P(x), cioè la probabilità di avere x successi in n lanci della moneta Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 5 / 54

24 Definizione: Probabilità per una Distribuzione Binomiale Sia π la probabilità che un osservazione assuma un valore della categoria 1. Nel caso di n osservazioni indipendenti, la probabilità di x successi per la categoria 1 è P(x) = n! x!(n x)! πx (1 π) n x, x = 0,1,2,...,n. Il simbolo n! è chiamato n fattoriale. Rappresenta n! = n. Ad esempio, 1! = 1, 2! = 1 2 = 2, 3! = = 6, e così via. Per definizione, 0! è pari a 1. Sostituendo ad x il valore del numero di successi desiderato per n e π fissati, si avrà la P(x), cioè la probabilità di avere x successi in n lanci della moneta Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 5 / 54

25 Proprietà di una distribuzione binomiale Proprietà di una distribuzione binomiale La distribuzione binomiale tende alla simmetria per π 0.50 ed è perfettamente simmetrica quando π = 0.50 con µ = nπ, σ = nπ(1 π). Ciò vale anche per la distribuzione campionaria di ˆπ Inoltre tale comportamento si ha anche per valori di π vicini a 0 o a 1, ma molto più lentamente Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 6 / 54

26 Proprietà di una distribuzione binomiale Proprietà di una distribuzione binomiale La distribuzione binomiale tende alla simmetria per π 0.50 ed è perfettamente simmetrica quando π = 0.50 con µ = nπ, σ = nπ(1 π). Ciò vale anche per la distribuzione campionaria di ˆπ Inoltre tale comportamento si ha anche per valori di π vicini a 0 o a 1, ma molto più lentamente Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 6 / 54

27 Proprietà di una distribuzione binomiale Proprietà di una distribuzione binomiale La distribuzione binomiale tende alla simmetria per π 0.50 ed è perfettamente simmetrica quando π = 0.50 con µ = nπ, σ = nπ(1 π). Ciò vale anche per la distribuzione campionaria di ˆπ Inoltre tale comportamento si ha anche per valori di π vicini a 0 o a 1, ma molto più lentamente Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 6 / 54

28 Proprietà di una distribuzione binomiale Proprietà di una distribuzione binomiale La distribuzione binomiale tende alla simmetria per π 0.50 ed è perfettamente simmetrica quando π = 0.50 con µ = nπ, σ = nπ(1 π). Ciò vale anche per la distribuzione campionaria di ˆπ Inoltre tale comportamento si ha anche per valori di π vicini a 0 o a 1, ma molto più lentamente Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 6 / 54

29 Proprietà di una distribuzione binomiale Distribuzione campionaria di ˆπ per vari valori di π e n Probability n 10 Probability p.1 p p.1 Probability pˆ 1.0 n 50 Probability 0 p pˆ p.1 p.5 pˆ p.1 n 100 Probability 0 p.5 Probability pˆ 1.0 p.1 p.5 pˆ p.1 p.5 pˆ 1.0 Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 7 / 54

30 Proprietà di una distribuzione binomiale Distribuzione campionaria di ˆπ per vari valori di π e n Probability n 10 Probability p.1 p p.1 Probability pˆ 1.0 n 50 Probability 0 p pˆ p.1 p.5 pˆ p.1 n 100 Probability 0 p.5 Probability pˆ 1.0 p.1 p.5 pˆ p.1 p.5 pˆ 1.0 Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 7 / 54

31 Proprietà di una distribuzione binomiale Esempio 6.10 Genere e scelta degli allievi per il corso di management Nell Esempio 6.1 avevamo trattato il caso di una popolazione di dipendenti per metà M e metà F Scelti a caso n = 10 dipendenti, sia x il numero di F e π = 0.50 la probabilità di scegliere una F La probabilità di avere x F scegliendo n = 10 dipendenti è P(x) = 10! x!(10 x)! (0.50)x (0.50) 10 x, x = 0,1,...,10. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 8 / 54

32 Proprietà di una distribuzione binomiale Esempio 6.10 Genere e scelta degli allievi per il corso di management Nell Esempio 6.1 avevamo trattato il caso di una popolazione di dipendenti per metà M e metà F Scelti a caso n = 10 dipendenti, sia x il numero di F e π = 0.50 la probabilità di scegliere una F La probabilità di avere x F scegliendo n = 10 dipendenti è P(x) = 10! x!(10 x)! (0.50)x (0.50) 10 x, x = 0,1,...,10. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 8 / 54

33 Proprietà di una distribuzione binomiale Esempio 6.10 Genere e scelta degli allievi per il corso di management Nell Esempio 6.1 avevamo trattato il caso di una popolazione di dipendenti per metà M e metà F Scelti a caso n = 10 dipendenti, sia x il numero di F e π = 0.50 la probabilità di scegliere una F La probabilità di avere x F scegliendo n = 10 dipendenti è P(x) = 10! x!(10 x)! (0.50)x (0.50) 10 x, x = 0,1,...,10. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 8 / 54

34 Proprietà di una distribuzione binomiale Esempio 6.10 Genere e scelta degli allievi per il corso di management Nell Esempio 6.1 avevamo trattato il caso di una popolazione di dipendenti per metà M e metà F Scelti a caso n = 10 dipendenti, sia x il numero di F e π = 0.50 la probabilità di scegliere una F La probabilità di avere x F scegliendo n = 10 dipendenti è P(x) = 10! x!(10 x)! (0.50)x (0.50) 10 x, x = 0,1,...,10. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 8 / 54

35 Proprietà di una distribuzione binomiale Ad esempio, la probabilità di non avere nessuna F (x = 0) è P(0) = 10! 0!10! (0.50)0 (0.50) 10 = (0.50) 10 = La probabilità che sia scelta esattamente una femmina è pari a P(1) = 10! 1!9! (0.50)1 (0.50) 9 = 10(0.50)(0.50) 9 = Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 9 / 54

36 Proprietà di una distribuzione binomiale Ad esempio, la probabilità di non avere nessuna F (x = 0) è P(0) = 10! 0!10! (0.50)0 (0.50) 10 = (0.50) 10 = La probabilità che sia scelta esattamente una femmina è pari a P(1) = 10! 1!9! (0.50)1 (0.50) 9 = 10(0.50)(0.50) 9 = Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 9 / 54

37 Proprietà di una distribuzione binomiale Modello a Probabilità Lineare Nel caso di un modello con una sola variabile esplicativa (che sarà continua) avremo P(y = 1) = α+βx In questo caso si suppone che la probabilità di successo sia in funzione lineare con X Per questa ragione prende il nome di Modello a Probabilità Lineare Tuttavia è facile mostrare come tale modello sia inadeguato per prevedere la P(y = 1) Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 10 / 54

38 Proprietà di una distribuzione binomiale Modello a Probabilità Lineare Nel caso di un modello con una sola variabile esplicativa (che sarà continua) avremo P(y = 1) = α+βx In questo caso si suppone che la probabilità di successo sia in funzione lineare con X Per questa ragione prende il nome di Modello a Probabilità Lineare Tuttavia è facile mostrare come tale modello sia inadeguato per prevedere la P(y = 1) Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 10 / 54

39 Proprietà di una distribuzione binomiale Modello a Probabilità Lineare Nel caso di un modello con una sola variabile esplicativa (che sarà continua) avremo P(y = 1) = α+βx In questo caso si suppone che la probabilità di successo sia in funzione lineare con X Per questa ragione prende il nome di Modello a Probabilità Lineare Tuttavia è facile mostrare come tale modello sia inadeguato per prevedere la P(y = 1) Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 10 / 54

40 Proprietà di una distribuzione binomiale Modello a Probabilità Lineare Nel caso di un modello con una sola variabile esplicativa (che sarà continua) avremo P(y = 1) = α+βx In questo caso si suppone che la probabilità di successo sia in funzione lineare con X Per questa ragione prende il nome di Modello a Probabilità Lineare Tuttavia è facile mostrare come tale modello sia inadeguato per prevedere la P(y = 1) Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 10 / 54

41 Proprietà di una distribuzione binomiale Sappiamo che la P(y = 1) è un valore dell intevallo [0,1] e non eccede tale intervallo La figura mostra che il Modello a Probabilità Lineare non rispetta questa condizione P(y 1) 1 Logistic (1) Linear Logistic (2) 0 x Al contrario, la funzione logistica (casi 1 e 2), si dimostra adatta allo scopo A questo punto il problema è: come faccio a linearizzare una funzione logistica? Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 11 / 54

42 Proprietà di una distribuzione binomiale Sappiamo che la P(y = 1) è un valore dell intevallo [0,1] e non eccede tale intervallo La figura mostra che il Modello a Probabilità Lineare non rispetta questa condizione P(y 1) 1 Logistic (1) Linear Logistic (2) 0 x Al contrario, la funzione logistica (casi 1 e 2), si dimostra adatta allo scopo A questo punto il problema è: come faccio a linearizzare una funzione logistica? Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 11 / 54

43 Proprietà di una distribuzione binomiale Sappiamo che la P(y = 1) è un valore dell intevallo [0,1] e non eccede tale intervallo La figura mostra che il Modello a Probabilità Lineare non rispetta questa condizione P(y 1) 1 Logistic (1) Linear Logistic (2) 0 x Al contrario, la funzione logistica (casi 1 e 2), si dimostra adatta allo scopo A questo punto il problema è: come faccio a linearizzare una funzione logistica? Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 11 / 54

44 Il Modello di Regressione Logistica per Risposte Binarie Il Modello di Regressione Logistica per Risposte Binarie In primo luogo scriviamo l equazione di regressione di Y su X, utilizzando la funzione logistica P(y = 1) = eα+βx 1+e α+βx. In seguito riprenderemo questa formulazione. Per ora ci basti osservare come la relazione tra Y e X non sia lineare, bensì logistica Per semplificare la notazione e ottenere risultati più semplici, linearizziamo questa espressione Il modo più semplice è passare al logaritmo naturale (base e) ambo i membri dell equazione e otteniamo log[p(y = 1)] = log(e α+βx ) log(1+e α+βx ) = = log(e α+βx ) 0 log(e α+βx ) = 0 Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 12 / 54

45 Il Modello di Regressione Logistica per Risposte Binarie Il Modello di Regressione Logistica per Risposte Binarie In primo luogo scriviamo l equazione di regressione di Y su X, utilizzando la funzione logistica P(y = 1) = eα+βx 1+e α+βx. In seguito riprenderemo questa formulazione. Per ora ci basti osservare come la relazione tra Y e X non sia lineare, bensì logistica Per semplificare la notazione e ottenere risultati più semplici, linearizziamo questa espressione Il modo più semplice è passare al logaritmo naturale (base e) ambo i membri dell equazione e otteniamo log[p(y = 1)] = log(e α+βx ) log(1+e α+βx ) = = log(e α+βx ) 0 log(e α+βx ) = 0 Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 12 / 54

46 Il Modello di Regressione Logistica per Risposte Binarie Il Modello di Regressione Logistica per Risposte Binarie In primo luogo scriviamo l equazione di regressione di Y su X, utilizzando la funzione logistica P(y = 1) = eα+βx 1+e α+βx. In seguito riprenderemo questa formulazione. Per ora ci basti osservare come la relazione tra Y e X non sia lineare, bensì logistica Per semplificare la notazione e ottenere risultati più semplici, linearizziamo questa espressione Il modo più semplice è passare al logaritmo naturale (base e) ambo i membri dell equazione e otteniamo log[p(y = 1)] = log(e α+βx ) log(1+e α+βx ) = = log(e α+βx ) 0 log(e α+βx ) = 0 Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 12 / 54

47 Il Modello di Regressione Logistica per Risposte Binarie Il Modello di Regressione Logistica per Risposte Binarie In primo luogo scriviamo l equazione di regressione di Y su X, utilizzando la funzione logistica P(y = 1) = eα+βx 1+e α+βx. In seguito riprenderemo questa formulazione. Per ora ci basti osservare come la relazione tra Y e X non sia lineare, bensì logistica Per semplificare la notazione e ottenere risultati più semplici, linearizziamo questa espressione Il modo più semplice è passare al logaritmo naturale (base e) ambo i membri dell equazione e otteniamo log[p(y = 1)] = log(e α+βx ) log(1+e α+βx ) = = log(e α+βx ) 0 log(e α+βx ) = 0 Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 12 / 54

48 Il Modello di Regressione Logistica per Risposte Binarie Per risolvere il problema, si costruisce il rapporto tra la probabilità di successo e la probabilità di insuccesso e lo si passa al logaritmo [ ] P(y = 1) log = α+βx. 1 P(y = 1) Il rapporto di probabilità P(y = 1)/[1 P(y = 1)] è definito odds o rapporto tra quote Ad es., se P(y = 1) = 0.75, l odds vale 0.75/0.25= 3.0, cioè la probabilità del successo è 3 volte il valore di quella dell insuccesso La quantità log [P(y = 1)/(1 P(y = 1))] trasformazione logistica o logit In tal modo si avrà il modello di regressione logistica logit[p(y = 1)] = α+βx. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 13 / 54

49 Il Modello di Regressione Logistica per Risposte Binarie Per risolvere il problema, si costruisce il rapporto tra la probabilità di successo e la probabilità di insuccesso e lo si passa al logaritmo [ ] P(y = 1) log = α+βx. 1 P(y = 1) Il rapporto di probabilità P(y = 1)/[1 P(y = 1)] è definito odds o rapporto tra quote Ad es., se P(y = 1) = 0.75, l odds vale 0.75/0.25= 3.0, cioè la probabilità del successo è 3 volte il valore di quella dell insuccesso La quantità log [P(y = 1)/(1 P(y = 1))] trasformazione logistica o logit In tal modo si avrà il modello di regressione logistica logit[p(y = 1)] = α+βx. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 13 / 54

50 Il Modello di Regressione Logistica per Risposte Binarie Per risolvere il problema, si costruisce il rapporto tra la probabilità di successo e la probabilità di insuccesso e lo si passa al logaritmo [ ] P(y = 1) log = α+βx. 1 P(y = 1) Il rapporto di probabilità P(y = 1)/[1 P(y = 1)] è definito odds o rapporto tra quote Ad es., se P(y = 1) = 0.75, l odds vale 0.75/0.25= 3.0, cioè la probabilità del successo è 3 volte il valore di quella dell insuccesso La quantità log [P(y = 1)/(1 P(y = 1))] trasformazione logistica o logit In tal modo si avrà il modello di regressione logistica logit[p(y = 1)] = α+βx. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 13 / 54

51 Il Modello di Regressione Logistica per Risposte Binarie Per risolvere il problema, si costruisce il rapporto tra la probabilità di successo e la probabilità di insuccesso e lo si passa al logaritmo [ ] P(y = 1) log = α+βx. 1 P(y = 1) Il rapporto di probabilità P(y = 1)/[1 P(y = 1)] è definito odds o rapporto tra quote Ad es., se P(y = 1) = 0.75, l odds vale 0.75/0.25= 3.0, cioè la probabilità del successo è 3 volte il valore di quella dell insuccesso La quantità log [P(y = 1)/(1 P(y = 1))] trasformazione logistica o logit In tal modo si avrà il modello di regressione logistica logit[p(y = 1)] = α+βx. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 13 / 54

52 Il Modello di Regressione Logistica per Risposte Binarie Per risolvere il problema, si costruisce il rapporto tra la probabilità di successo e la probabilità di insuccesso e lo si passa al logaritmo [ ] P(y = 1) log = α+βx. 1 P(y = 1) Il rapporto di probabilità P(y = 1)/[1 P(y = 1)] è definito odds o rapporto tra quote Ad es., se P(y = 1) = 0.75, l odds vale 0.75/0.25= 3.0, cioè la probabilità del successo è 3 volte il valore di quella dell insuccesso La quantità log [P(y = 1)/(1 P(y = 1))] trasformazione logistica o logit In tal modo si avrà il modello di regressione logistica logit[p(y = 1)] = α+βx. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 13 / 54

53 Il Modello di Regressione Logistica per Risposte Binarie Interpretazione del parametro β Il logit[p(y = 1)] varia linearmente in funzione di X oltre l intervallo [0, 1], mentre la [P(y = 1)] varia seguendo la funzione logistica entro l intervallo [0,1] Il valore di β indica se la [P(y = 1)] cresce (β > 0) o decresce (β < 0) al crescere di X Nelle due curve del grafico, la (2) ha un β più grande di quello della curva (1) P(y 1) 1 Logistic (1) Linear Logistic (2) 0 x Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 14 / 54

54 Il Modello di Regressione Logistica per Risposte Binarie Interpretazione del parametro β Il logit[p(y = 1)] varia linearmente in funzione di X oltre l intervallo [0, 1], mentre la [P(y = 1)] varia seguendo la funzione logistica entro l intervallo [0,1] Il valore di β indica se la [P(y = 1)] cresce (β > 0) o decresce (β < 0) al crescere di X Nelle due curve del grafico, la (2) ha un β più grande di quello della curva (1) P(y 1) 1 Logistic (1) Linear Logistic (2) 0 x Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 14 / 54

55 Il Modello di Regressione Logistica per Risposte Binarie Interpretazione del parametro β Il logit[p(y = 1)] varia linearmente in funzione di X oltre l intervallo [0, 1], mentre la [P(y = 1)] varia seguendo la funzione logistica entro l intervallo [0,1] Il valore di β indica se la [P(y = 1)] cresce (β > 0) o decresce (β < 0) al crescere di X Nelle due curve del grafico, la (2) ha un β più grande di quello della curva (1) P(y 1) 1 Logistic (1) Linear Logistic (2) 0 x Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 14 / 54

56 Il Modello di Regressione Logistica per Risposte Binarie Interpretazione del parametro β Quando P(y = 1) = 0.50, l odds P(y = 1)/[1 P(y = 1)] = 1, conseguentemente il log[p(y = 1)/(1 P(y = 1))] = 0 Per determinare il valore di x per il quale P(y = 1) = 0.50, eguagliamo il log(odds) pari a 0 al secondo membro dell equazione del modello α+βx Risolvendo per x otteniamo P(y = 1) = 0.50 quando x = α/β In questo modo siamo in grado di determinare il valore di X per il quale la probabilità di successo eguaglia quella di insuccesso Le stime dei parametri α e β sono ottenute applicando il Metodo della Massima Verosimiglianza e non quello dei Minimi Quadrati Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 15 / 54

57 Il Modello di Regressione Logistica per Risposte Binarie Interpretazione del parametro β Quando P(y = 1) = 0.50, l odds P(y = 1)/[1 P(y = 1)] = 1, conseguentemente il log[p(y = 1)/(1 P(y = 1))] = 0 Per determinare il valore di x per il quale P(y = 1) = 0.50, eguagliamo il log(odds) pari a 0 al secondo membro dell equazione del modello α+βx Risolvendo per x otteniamo P(y = 1) = 0.50 quando x = α/β In questo modo siamo in grado di determinare il valore di X per il quale la probabilità di successo eguaglia quella di insuccesso Le stime dei parametri α e β sono ottenute applicando il Metodo della Massima Verosimiglianza e non quello dei Minimi Quadrati Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 15 / 54

58 Il Modello di Regressione Logistica per Risposte Binarie Interpretazione del parametro β Quando P(y = 1) = 0.50, l odds P(y = 1)/[1 P(y = 1)] = 1, conseguentemente il log[p(y = 1)/(1 P(y = 1))] = 0 Per determinare il valore di x per il quale P(y = 1) = 0.50, eguagliamo il log(odds) pari a 0 al secondo membro dell equazione del modello α+βx Risolvendo per x otteniamo P(y = 1) = 0.50 quando x = α/β In questo modo siamo in grado di determinare il valore di X per il quale la probabilità di successo eguaglia quella di insuccesso Le stime dei parametri α e β sono ottenute applicando il Metodo della Massima Verosimiglianza e non quello dei Minimi Quadrati Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 15 / 54

59 Il Modello di Regressione Logistica per Risposte Binarie Interpretazione del parametro β Quando P(y = 1) = 0.50, l odds P(y = 1)/[1 P(y = 1)] = 1, conseguentemente il log[p(y = 1)/(1 P(y = 1))] = 0 Per determinare il valore di x per il quale P(y = 1) = 0.50, eguagliamo il log(odds) pari a 0 al secondo membro dell equazione del modello α+βx Risolvendo per x otteniamo P(y = 1) = 0.50 quando x = α/β In questo modo siamo in grado di determinare il valore di X per il quale la probabilità di successo eguaglia quella di insuccesso Le stime dei parametri α e β sono ottenute applicando il Metodo della Massima Verosimiglianza e non quello dei Minimi Quadrati Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 15 / 54

60 Il Modello di Regressione Logistica per Risposte Binarie Interpretazione del parametro β Quando P(y = 1) = 0.50, l odds P(y = 1)/[1 P(y = 1)] = 1, conseguentemente il log[p(y = 1)/(1 P(y = 1))] = 0 Per determinare il valore di x per il quale P(y = 1) = 0.50, eguagliamo il log(odds) pari a 0 al secondo membro dell equazione del modello α+βx Risolvendo per x otteniamo P(y = 1) = 0.50 quando x = α/β In questo modo siamo in grado di determinare il valore di X per il quale la probabilità di successo eguaglia quella di insuccesso Le stime dei parametri α e β sono ottenute applicando il Metodo della Massima Verosimiglianza e non quello dei Minimi Quadrati Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 15 / 54

61 Il Modello di Regressione Logistica per Risposte Binarie Esempio 15.1 Reddito e Possesso delle Carte di Credito Si consideri un campione di n = 100 adulti selezionati casualmente in Italia. Si è rilevato il reddito annuale e se possedevano o meno una carta di credito La variabile risposta è dicotomica (possesso CC: 1 = Sì, 0 = No). Il predittore è quantitativo A ciascun livello di X, si può calcolare la probabilità di possedere una CC, attraverso il rapporto tra i soggetti che posseggono una CC e il totale soggetti per quel valore di X Tabella: Reddito Annuale (in Migliaia di Euro) e Possesso di una Carta di Credito. Number Credit Number Credit Number Credit Income Cases Cards Income Cases Cards Income Cases Cards Fonte: Si ringrazia R. Piccarreta, Università Bocconi University, Milano. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 16 / 54

62 Il Modello di Regressione Logistica per Risposte Binarie Esempio 15.1 Reddito e Possesso delle Carte di Credito Si consideri un campione di n = 100 adulti selezionati casualmente in Italia. Si è rilevato il reddito annuale e se possedevano o meno una carta di credito La variabile risposta è dicotomica (possesso CC: 1 = Sì, 0 = No). Il predittore è quantitativo A ciascun livello di X, si può calcolare la probabilità di possedere una CC, attraverso il rapporto tra i soggetti che posseggono una CC e il totale soggetti per quel valore di X Tabella: Reddito Annuale (in Migliaia di Euro) e Possesso di una Carta di Credito. Number Credit Number Credit Number Credit Income Cases Cards Income Cases Cards Income Cases Cards Fonte: Si ringrazia R. Piccarreta, Università Bocconi University, Milano. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 16 / 54

63 Il Modello di Regressione Logistica per Risposte Binarie Esempio 15.1 Reddito e Possesso delle Carte di Credito Si consideri un campione di n = 100 adulti selezionati casualmente in Italia. Si è rilevato il reddito annuale e se possedevano o meno una carta di credito La variabile risposta è dicotomica (possesso CC: 1 = Sì, 0 = No). Il predittore è quantitativo A ciascun livello di X, si può calcolare la probabilità di possedere una CC, attraverso il rapporto tra i soggetti che posseggono una CC e il totale soggetti per quel valore di X Tabella: Reddito Annuale (in Migliaia di Euro) e Possesso di una Carta di Credito. Number Credit Number Credit Number Credit Income Cases Cards Income Cases Cards Income Cases Cards Fonte: Si ringrazia R. Piccarreta, Università Bocconi University, Milano. Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 16 / 54

64 Il Modello di Regressione Logistica per Risposte Binarie Il modello stimato è logit[ˆp(y = 1)] = x. Il valore di β = > 0, indica che al crescere del Reddito Annuale cresce la probabilità di possedere una CC Il software fornisce il seguente prospetto Tabella: Modello di Regressione Logistica sul Possesso della Carta di Credito in Italia B S.E. Exp(B) reddito costante Il valore exp(b) = exp(.1054) = consente di calcolare l odds ratio (OR) Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 17 / 54

65 Il Modello di Regressione Logistica per Risposte Binarie Il modello stimato è logit[ˆp(y = 1)] = x. Il valore di β = > 0, indica che al crescere del Reddito Annuale cresce la probabilità di possedere una CC Il software fornisce il seguente prospetto Tabella: Modello di Regressione Logistica sul Possesso della Carta di Credito in Italia B S.E. Exp(B) reddito costante Il valore exp(b) = exp(.1054) = consente di calcolare l odds ratio (OR) Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 17 / 54

66 Il Modello di Regressione Logistica per Risposte Binarie Il modello stimato è logit[ˆp(y = 1)] = x. Il valore di β = > 0, indica che al crescere del Reddito Annuale cresce la probabilità di possedere una CC Il software fornisce il seguente prospetto Tabella: Modello di Regressione Logistica sul Possesso della Carta di Credito in Italia B S.E. Exp(B) reddito costante Il valore exp(b) = exp(.1054) = consente di calcolare l odds ratio (OR) Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 17 / 54

67 Il Modello di Regressione Logistica per Risposte Binarie Il modello stimato è logit[ˆp(y = 1)] = x. Il valore di β = > 0, indica che al crescere del Reddito Annuale cresce la probabilità di possedere una CC Il software fornisce il seguente prospetto Tabella: Modello di Regressione Logistica sul Possesso della Carta di Credito in Italia B S.E. Exp(B) reddito costante Il valore exp(b) = exp(.1054) = consente di calcolare l odds ratio (OR) Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 17 / 54

68 Il Modello di Regressione Logistica per Risposte Binarie Il grafico mostra la funzione di previsione per il logit 1 P(y ˆ 1) 0 Income La probabilità di successo vale 0.50 per x = ˆα/ˆβ = (3.518)/(0.105)= 33.5 Cioè la probabilità stimata di possedere una CC è inferiore a 0.50 per redditi inferiori a 33.5 migliaia di euro, superiore a 0.50 per redditi superiori a quella soglia Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 18 / 54

69 Il Modello di Regressione Logistica per Risposte Binarie Il grafico mostra la funzione di previsione per il logit 1 P(y ˆ 1) 0 Income La probabilità di successo vale 0.50 per x = ˆα/ˆβ = (3.518)/(0.105)= 33.5 Cioè la probabilità stimata di possedere una CC è inferiore a 0.50 per redditi inferiori a 33.5 migliaia di euro, superiore a 0.50 per redditi superiori a quella soglia Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 18 / 54

70 Il Modello di Regressione Logistica per Risposte Binarie Il grafico mostra la funzione di previsione per il logit 1 P(y ˆ 1) 0 Income La probabilità di successo vale 0.50 per x = ˆα/ˆβ = (3.518)/(0.105)= 33.5 Cioè la probabilità stimata di possedere una CC è inferiore a 0.50 per redditi inferiori a 33.5 migliaia di euro, superiore a 0.50 per redditi superiori a quella soglia Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 18 / 54

71 Il Modello di Regressione Logistica per Risposte Binarie Il grafico mostra la funzione di previsione per il logit 1 P(y ˆ 1) 0 Income La probabilità di successo vale 0.50 per x = ˆα/ˆβ = (3.518)/(0.105)= 33.5 Cioè la probabilità stimata di possedere una CC è inferiore a 0.50 per redditi inferiori a 33.5 migliaia di euro, superiore a 0.50 per redditi superiori a quella soglia Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 18 / 54

72 Il Modello di Regressione Logistica per Risposte Binarie Equazione di Regressione Logistica per le Probabilità Abbiamo visto a cosa corrisponde direttamente la P(y = 1) Si può, quindi, costruire un equazione che stimi direttamente tale probabilità e non il suo logit, cioè P(y = 1) = eα+βx 1+eα+βx. (1) In questa equazione la potenza di e rappresenta l antilogaritmo Ricordiamo che il numero di Nepero e rappresenta la base del logaritmo naturale, cioè il numero a cui bisogna elevare la base per avere l argomento. Ad es., log e (1) = 0 in quanto e 0 = 1 Attraverso la formula (1) è possibile determinare la probabilità di successo per qualunque valore di x Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 19 / 54

73 Il Modello di Regressione Logistica per Risposte Binarie Equazione di Regressione Logistica per le Probabilità Abbiamo visto a cosa corrisponde direttamente la P(y = 1) Si può, quindi, costruire un equazione che stimi direttamente tale probabilità e non il suo logit, cioè P(y = 1) = eα+βx 1+eα+βx. (1) In questa equazione la potenza di e rappresenta l antilogaritmo Ricordiamo che il numero di Nepero e rappresenta la base del logaritmo naturale, cioè il numero a cui bisogna elevare la base per avere l argomento. Ad es., log e (1) = 0 in quanto e 0 = 1 Attraverso la formula (1) è possibile determinare la probabilità di successo per qualunque valore di x Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 19 / 54

74 Il Modello di Regressione Logistica per Risposte Binarie Equazione di Regressione Logistica per le Probabilità Abbiamo visto a cosa corrisponde direttamente la P(y = 1) Si può, quindi, costruire un equazione che stimi direttamente tale probabilità e non il suo logit, cioè P(y = 1) = eα+βx 1+eα+βx. (1) In questa equazione la potenza di e rappresenta l antilogaritmo Ricordiamo che il numero di Nepero e rappresenta la base del logaritmo naturale, cioè il numero a cui bisogna elevare la base per avere l argomento. Ad es., log e (1) = 0 in quanto e 0 = 1 Attraverso la formula (1) è possibile determinare la probabilità di successo per qualunque valore di x Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 19 / 54

75 Il Modello di Regressione Logistica per Risposte Binarie Equazione di Regressione Logistica per le Probabilità Abbiamo visto a cosa corrisponde direttamente la P(y = 1) Si può, quindi, costruire un equazione che stimi direttamente tale probabilità e non il suo logit, cioè P(y = 1) = eα+βx 1+eα+βx. (1) In questa equazione la potenza di e rappresenta l antilogaritmo Ricordiamo che il numero di Nepero e rappresenta la base del logaritmo naturale, cioè il numero a cui bisogna elevare la base per avere l argomento. Ad es., log e (1) = 0 in quanto e 0 = 1 Attraverso la formula (1) è possibile determinare la probabilità di successo per qualunque valore di x Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 19 / 54

76 Il Modello di Regressione Logistica per Risposte Binarie Equazione di Regressione Logistica per le Probabilità Abbiamo visto a cosa corrisponde direttamente la P(y = 1) Si può, quindi, costruire un equazione che stimi direttamente tale probabilità e non il suo logit, cioè P(y = 1) = eα+βx 1+eα+βx. (1) In questa equazione la potenza di e rappresenta l antilogaritmo Ricordiamo che il numero di Nepero e rappresenta la base del logaritmo naturale, cioè il numero a cui bisogna elevare la base per avere l argomento. Ad es., log e (1) = 0 in quanto e 0 = 1 Attraverso la formula (1) è possibile determinare la probabilità di successo per qualunque valore di x Nicola Tedesco (Statistica Sociale) Regressione Logistica: un Modello per Variabili Risposta Categoriali 19 / 54

1. Distribuzioni campionarie

1. Distribuzioni campionarie Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 9 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 TEST D IPOTESI Partiamo da un esempio presente sul libro di testo.

Dettagli

Probabilità II Variabili casuali discrete

Probabilità II Variabili casuali discrete Probabilità II Variabili casuali discrete Definizioni principali. Valore atteso e Varianza. Teorema di Bienaymé - Čebičev. V.C. Notevoli: Bernoulli e Binomiale. Concetto di variabile casuale Cos'è una

Dettagli

LE FUNZIONI A DUE VARIABILI

LE FUNZIONI A DUE VARIABILI Capitolo I LE FUNZIONI A DUE VARIABILI In questo primo capitolo introduciamo alcune definizioni di base delle funzioni reali a due variabili reali. Nel seguito R denoterà l insieme dei numeri reali mentre

Dettagli

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2. Analisi multivariata Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Cercare di capire le relazioni

Dettagli

Statistica inferenziale

Statistica inferenziale Statistica inferenziale Popolazione e campione Molto spesso siamo interessati a trarre delle conclusioni su persone che hanno determinate caratteristiche (pazienti, atleti, bambini, gestanti, ) Osserveremo

Dettagli

La distribuzione Normale. La distribuzione Normale

La distribuzione Normale. La distribuzione Normale La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una

Dettagli

Stima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una

Dettagli

Logaritmi ed esponenziali

Logaritmi ed esponenziali Logaritmi ed esponenziali definizioni, proprietà ITIS Feltrinelli anno scolastico 2007-2008 A cosa servono i logaritmi I logaritmi rendono possibile trasformare prodotti in somme, quozienti in differenze,

Dettagli

Funzioni. Parte prima. Daniele Serra

Funzioni. Parte prima. Daniele Serra Funzioni Parte prima Daniele Serra Nota: questi appunti non sostituiscono in alcun modo le lezioni del prof. Favilli, né alcun libro di testo. Sono piuttosto da intendersi a integrazione di entrambi. 1

Dettagli

La variabile casuale Binomiale

La variabile casuale Binomiale La variabile casuale Binomiale Si costruisce a partire dalla nozione di esperimento casuale Bernoulliano che consiste in un insieme di prove ripetute con le seguenti caratteristiche: i) ad ogni singola

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica

Dettagli

Viene lanciata una moneta. Se esce testa vinco 100 euro, se esce croce non vinco niente. Quale è il valore della mia vincita?

Viene lanciata una moneta. Se esce testa vinco 100 euro, se esce croce non vinco niente. Quale è il valore della mia vincita? Viene lanciata una moneta. Se esce testa vinco 00 euro, se esce croce non vinco niente. Quale è il valore della mia vincita? Osserviamo che il valore della vincita dipende dal risultato dell esperimento

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Regressione logistica

Regressione logistica Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer Metodi di classificazione Tecniche principali Alcuni esempi Data set Default I dati La regressione logistica Esempio Il modello

Dettagli

Regressione logistica. Strumenti quantitativi per la gestione

Regressione logistica. Strumenti quantitativi per la gestione Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/4a_rlg.html#(1) 1/25 Metodi di classificazione I metodi usati per analizzare

Dettagli

Limited Dependent Variable Models

Limited Dependent Variable Models Limited Dependent Variable Models Logit Tobit Probit Modelli Logit e Probit Latent variable models for binary choice Models for descrete dependent variable Traducendo Spesso vogliamo studiare (le determinanti

Dettagli

La distribuzione Gaussiana

La distribuzione Gaussiana Università del Piemonte Orientale Corso di Laurea in Biotecnologie Corso di Statistica Medica La distribuzione Normale (o di Gauss) Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione

Dettagli

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ -

Dettagli

1 Serie di Taylor di una funzione

1 Serie di Taylor di una funzione Analisi Matematica 2 CORSO DI STUDI IN SMID CORSO DI ANALISI MATEMATICA 2 CAPITOLO 7 SERIE E POLINOMI DI TAYLOR Serie di Taylor di una funzione. Definizione di serie di Taylor Sia f(x) una funzione definita

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara

Dettagli

lezione 18 AA 2015-2016 Paolo Brunori

lezione 18 AA 2015-2016 Paolo Brunori AA 2015-2016 Paolo Brunori Previsioni - spesso come economisti siamo interessati a prevedere quale sarà il valore di una certa variabile nel futuro - quando osserviamo una variabile nel tempo possiamo

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a) Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:

Dettagli

Intorni Fissato un punto sull' asse reale, si definisce intorno del punto, un intervallo aperto contenente e tutto contenuto in

Intorni Fissato un punto sull' asse reale, si definisce intorno del punto, un intervallo aperto contenente e tutto contenuto in Intorni Fissato un punto sull' asse reale, si definisce intorno del punto, un intervallo aperto contenente e tutto contenuto in Solitamente si fa riferimento ad intorni simmetrici =, + + Definizione: dato

Dettagli

Prova di autovalutazione Prof. Roberta Siciliano

Prova di autovalutazione Prof. Roberta Siciliano Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.

Dettagli

Schemi delle Lezioni di Matematica Generale. Pierpaolo Montana

Schemi delle Lezioni di Matematica Generale. Pierpaolo Montana Schemi delle Lezioni di Matematica Generale Pierpaolo Montana A volte i fenomeni economici che ci interessano non variano con continuitá oppure non possono essere osservati con continuitá, ma solo a intervalli

Dettagli

E naturale chiedersi alcune cose sulla media campionaria x n

E naturale chiedersi alcune cose sulla media campionaria x n Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un automobile elettrica. La durata osservata x i delle i-esima batteria è la realizzazione (valore assunto) di una variabile

Dettagli

Basi di matematica per il corso di micro

Basi di matematica per il corso di micro Basi di matematica per il corso di micro Microeconomia (anno accademico 2006-2007) Lezione del 21 Marzo 2007 Marianna Belloc 1 Le funzioni 1.1 Definizione Una funzione è una regola che descrive una relazione

Dettagli

Transitori del primo ordine

Transitori del primo ordine Università di Ferrara Corso di Elettrotecnica Transitori del primo ordine Si consideri il circuito in figura, composto da un generatore ideale di tensione, una resistenza ed una capacità. I tre bipoli

Dettagli

MICROECONOMIA La teoria del consumo: Alcuni Arricchimenti. Enrico Saltari Università di Roma La Sapienza

MICROECONOMIA La teoria del consumo: Alcuni Arricchimenti. Enrico Saltari Università di Roma La Sapienza MICROECONOMIA La teoria del consumo: Alcuni Arricchimenti Enrico Saltari Università di Roma La Sapienza 1 Dotazioni iniziali Il consumatore dispone ora non di un dato reddito monetario ma di un ammontare

Dettagli

Esercizio 2. 2.1 Scrivi l equazione di equilibrio nel mercato dei beni. Qual è il livello della produzione di equilibrio?

Esercizio 2. 2.1 Scrivi l equazione di equilibrio nel mercato dei beni. Qual è il livello della produzione di equilibrio? Sergio Vergalli Corso di Economia Politica A-G Università di Brescia Esercizio 2 L economia del principato di Andorra è descritta dalle seguenti equazioni: Md = 6Y -120 i Ms = 5400 T = 400 G = 400 dove,

Dettagli

Analisi di scenario File Nr. 10

Analisi di scenario File Nr. 10 1 Analisi di scenario File Nr. 10 Giorgio Calcagnini Università di Urbino Dip. Economia, Società, Politica giorgio.calcagnini@uniurb.it http://www.econ.uniurb.it/calcagnini/ http://www.econ.uniurb.it/calcagnini/forecasting.html

Dettagli

Esercitazione n.1 (v.c. Binomiale, Poisson, Normale)

Esercitazione n.1 (v.c. Binomiale, Poisson, Normale) Esercizio 1. Un azienda produce palline da tennis che hanno probabilità 0,02 di essere difettose, indipendentemente l una dall altra. La confezione di vendita contiene 8 palline prese a caso dalla produzione

Dettagli

Capitolo 11 Test chi-quadro

Capitolo 11 Test chi-quadro Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova

Dettagli

Relazioni statistiche: regressione e correlazione

Relazioni statistiche: regressione e correlazione Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica

Dettagli

Lezione 9: Cambio di base

Lezione 9: Cambio di base Lezione 9: Cambio di base In questa lezione vogliamo affrontare uno degli argomenti piu ostici per lo studente e cioè il cambio di base all interno di uno spazio vettoriale, inoltre cercheremo di capire

Dettagli

Pro e contro delle RNA

Pro e contro delle RNA Pro e contro delle RNA Pro: - flessibilità: le RNA sono approssimatori universali; - aggiornabilità sequenziale: la stima dei pesi della rete può essere aggiornata man mano che arriva nuova informazione;

Dettagli

Funzioni inverse Simmetrie rispetto alla bisettrice dei quadranti dispari. Consideriamo la trasformazione descritta dalle equazioni : = y

Funzioni inverse Simmetrie rispetto alla bisettrice dei quadranti dispari. Consideriamo la trasformazione descritta dalle equazioni : = y Funzioni inverse Simmetrie rispetto alla bisettrice dei quadranti dispari. Consideriamo la trasformazione descritta dalle equazioni : ' = y y' = Consideriamo il punto P(,5) se eseguiamo tra trasformazione

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Stima puntuale per la proporzione Da un lotto di arance se ne estraggono 400, e di queste 180

Dettagli

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione) Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso

Dettagli

Corrispondenze e funzioni

Corrispondenze e funzioni Corrispondenze e funzioni L attività fondamentale della mente umana consiste nello stabilire corrispondenze e relazioni tra oggetti; è anche per questo motivo che il concetto di corrispondenza è uno dei

Dettagli

LA MASSIMIZZAZIONE DEL PROFITTO ATTRAVERSO LA FISSAZIONE DEL PREZZO IN FUNZIONE DELLE QUANTITÀ

LA MASSIMIZZAZIONE DEL PROFITTO ATTRAVERSO LA FISSAZIONE DEL PREZZO IN FUNZIONE DELLE QUANTITÀ LA MASSIMIZZAZIONE DEL PROFITTO ATTRAVERSO LA FISSAZIONE DEL PREZZO IN FUNZIONE DELLE QUANTITÀ In questa Appendice mostreremo come trovare la tariffa in due parti che massimizza i profitti di Clearvoice,

Dettagli

Statistica Matematica A - Ing. Meccanica, Aerospaziale I prova in itinere - 19 novembre 2004

Statistica Matematica A - Ing. Meccanica, Aerospaziale I prova in itinere - 19 novembre 2004 Statistica Matematica A - Ing. Meccanica, Aerospaziale I prova in itinere - 19 novembre 200 Esercizio 1 Tre apparecchiature M 1, M 2 e M 3 in un anno si guastano, in maniera indipendente, con probabilità

Dettagli

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Un po di statistica. Christian Ferrari. Laboratorio di Matematica Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di

Dettagli

SPC e distribuzione normale con Access

SPC e distribuzione normale con Access SPC e distribuzione normale con Access In questo articolo esamineremo una applicazione Access per il calcolo e la rappresentazione grafica della distribuzione normale, collegata con tabelle di Clienti,

Dettagli

Proposta di soluzione della prova di matematica Liceo scientifico di Ordinamento - 2014

Proposta di soluzione della prova di matematica Liceo scientifico di Ordinamento - 2014 Proposta di soluzione della prova di matematica Liceo scientifico di Ordinamento - 14 Problema 1 Punto a) Osserviamo che g (x) = f(x) e pertanto g () = f() = in quanto Γ è tangente all asse delle ascisse,

Dettagli

Capitolo 5. Funzioni. Grafici.

Capitolo 5. Funzioni. Grafici. Capitolo 5 Funzioni. Grafici. Definizione: Una funzione f di una variabile reale,, è una corrispondenza che associa ad ogni numero reale appartenente ad un insieme D f R un unico numero reale, y R, denotato

Dettagli

3 GRAFICI DI FUNZIONI

3 GRAFICI DI FUNZIONI 3 GRAFICI DI FUNZIONI Particolari sottoinsiemi di R che noi studieremo sono i grafici di funzioni. Il grafico di una funzione f (se non è specificato il dominio di definizione) è dato da {(x, y) : x dom

Dettagli

Proof. Dimostrazione per assurdo. Consideriamo l insieme complementare di P nell insieme

Proof. Dimostrazione per assurdo. Consideriamo l insieme complementare di P nell insieme G Pareschi Principio di induzione Il Principio di Induzione (che dovreste anche avere incontrato nel Corso di Analisi I) consente di dimostrare Proposizioni il cui enunciato è in funzione di un numero

Dettagli

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da Data una funzione reale f di variabile reale x, definita su un sottoinsieme proprio D f di R (con questo voglio dire che il dominio di f è un sottoinsieme di R che non coincide con tutto R), ci si chiede

Dettagli

Matematica generale CTF

Matematica generale CTF Equazioni differenziali 9 dicembre 2015 Si chiamano equazioni differenziali quelle equazioni le cui incognite non sono variabili reali ma funzioni di una o più variabili. Le equazioni differenziali possono

Dettagli

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI VERO FALSO CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI 1. V F Un ipotesi statistica è un assunzione sulle caratteristiche di una o più variabili in una o più popolazioni 2. V F L ipotesi nulla unita

Dettagli

Blanchard, Macroeconomia Una prospettiva europea, Il Mulino 2011 Capitolo IV. I mercati finanziari. Capitolo IV. I mercati finanziari

Blanchard, Macroeconomia Una prospettiva europea, Il Mulino 2011 Capitolo IV. I mercati finanziari. Capitolo IV. I mercati finanziari Capitolo IV. I mercati finanziari 1. La domanda di moneta La moneta può essere usata per transazioni, ma non paga interessi. In realtà ci sono due tipi di moneta: il circolante, la moneta metallica e cartacea,

Dettagli

COEFFICIENTI BINOMIALI

COEFFICIENTI BINOMIALI COEFFICIENTI BINOMIALI Michele Impedovo micheleimpedovo@uni-bocconiit Una definizione insiemistica Se n è un numero naturale e è un numero naturale compreso tra e n, si indica con il simbolo il coefficiente

Dettagli

LA CORRELAZIONE LINEARE

LA CORRELAZIONE LINEARE LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione

Dettagli

Relazioni tra variabili

Relazioni tra variabili Università degli Studi di Padova Facoltà di Medicina e Chirurgia Corso di Laurea in Medicina e Chirurgia - A.A. 009-10 Scuole di specializzazione in: Medicina Legale, Medicina del Lavoro, Igiene e Medicina

Dettagli

Scelte in condizioni di rischio e incertezza

Scelte in condizioni di rischio e incertezza CAPITOLO 5 Scelte in condizioni di rischio e incertezza Esercizio 5.1. Tizio ha risparmiato nel corso dell anno 500 euro; può investirli in obbligazioni che rendono, in modo certo, il 10% oppure in azioni

Dettagli

Probabilità discreta

Probabilità discreta Probabilità discreta Daniele A. Gewurz 1 Che probabilità c è che succeda...? Una delle applicazioni della combinatoria è nel calcolo di probabilità discrete. Quando abbiamo a che fare con un fenomeno che

Dettagli

Verifica di ipotesi e intervalli di confidenza nella regressione multipla

Verifica di ipotesi e intervalli di confidenza nella regressione multipla Verifica di ipotesi e intervalli di confidenza nella regressione multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2014 Rossi MRLM Econometria - 2014 1 / 23 Sommario Variabili di controllo

Dettagli

STRATEGIA DI TRADING. Turning Points

STRATEGIA DI TRADING. Turning Points STRATEGIA DI TRADING Turning Points ANALISI E OBIETTIVI DA RAGGIUNGERE Studiare l andamento dei prezzi dei mercati finanziari con una certa previsione su tendenze future Analisi Tecnica: studio dell andamento

Dettagli

Funzioni funzione dominio codominio legge argomento variabile indipendente variabile dipendente

Funzioni funzione dominio codominio legge argomento variabile indipendente variabile dipendente Funzioni In matematica, una funzione f da X in Y consiste in: 1. un insieme X detto dominio di f 2. un insieme Y detto codominio di f 3. una legge che ad ogni elemento x in X associa uno ed un solo elemento

Dettagli

ESAME DI STATISTICA Nome: Cognome: Matricola:

ESAME DI STATISTICA Nome: Cognome: Matricola: ESAME DI STATISTICA Nome: Cognome: Matricola: ISTRUZIONI: Per la prova è consentito esclusivamente l uso di una calcolatrice tascabile, delle tavole della normale e della t di Student. I risultati degli

Dettagli

Anno 5 4 Funzioni reali. elementari

Anno 5 4 Funzioni reali. elementari Anno 5 4 Funzioni reali elementari 1 Introduzione In questa lezione studieremo alcune funzioni molto comuni, dette per questo funzioni elementari. Al termine di questa lezione sarai in grado di definire

Dettagli

Il confronto fra proporzioni

Il confronto fra proporzioni L. Boni Il rapporto Un rapporto (ratio), attribuendo un ampio significato al termine, è il risultato della divisione di una certa quantità a per un altra quantità b Il rapporto Spesso, in maniera più specifica,

Dettagli

Matematica Finanziaria Soluzione della prova scritta del 15/05/09

Matematica Finanziaria Soluzione della prova scritta del 15/05/09 Matematica Finanziaria Soluzione della prova scritta del 15/05/09 ESERCIZIO 1 Il valore in t = 60 semestri dei versamenti effettuati dall individuo è W (m) = R(1 + i 2 ) m + R(1 + i 2 ) m 1 +... R(1 +

Dettagli

Funzione logaritmo con. funzione inversa della funzione di

Funzione logaritmo con. funzione inversa della funzione di FUNZIONE LOGARITMO a è la base della funzione logaritmo ed è una costante positiva fissata e diversa da 1 x è l argomento della funzione logaritmo e varia nel dominio Funzione logaritmo con funzione inversa

Dettagli

Statistica. Lezione 6

Statistica. Lezione 6 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante

Dettagli

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE SIMULAZIONE della PROVA SCRITTA di STATISTICA 23/03/2011

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE SIMULAZIONE della PROVA SCRITTA di STATISTICA 23/03/2011 FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE SIMULAZIONE della PROVA SCRITTA di STATISTICA 23/3/2 ESERCIZIO (2+2+2+2) La seguente tabella riporta la distribuzione della variabile "Stato Civile"

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato

Dettagli

Esercizi riassuntivi di probabilità

Esercizi riassuntivi di probabilità Esercizi riassuntivi di probabilità Esercizio 1 Una ditta produttrice di fotocopiatrici sa che la durata di una macchina (in migliaia di copie) si distribuisce come una normale con µ = 1600 e 2 = 3600.

Dettagli

Facciamo qualche precisazione

Facciamo qualche precisazione Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione

Dettagli

La categoria «ES» presenta (di solito) gli stessi comandi

La categoria «ES» presenta (di solito) gli stessi comandi Utilizzo delle calcolatrici FX 991 ES+ Parte II PARMA, 11 Marzo 2014 Prof. Francesco Bologna bolfra@gmail.com ARGOMENTI DELLA LEZIONE 1. Richiami lezione precedente 2.Calcolo delle statistiche di regressione:

Dettagli

Lezione 14. Risparmio e investimento. Leonardo Bargigli

Lezione 14. Risparmio e investimento. Leonardo Bargigli Lezione 14. Risparmio e investimento Leonardo Bargigli Risparmio e investimento nella contabilità nazionale Ripartiamo dalla definizione di PIL in termini di spesa finale Y = C + I + G + NX Consideriamo

Dettagli

Certificati di investimento e strategie di yield enchancement

Certificati di investimento e strategie di yield enchancement Certificati di investimento e strategie di yield enchancement Isabella Liso Deutsche Bank Trading Online Expo 2014 Milano - Palazzo Mezzanotte - 24 ottobre 2014 1 INDICE Introduzione. Express Autocallable...

Dettagli

( x) ( x) 0. Equazioni irrazionali

( x) ( x) 0. Equazioni irrazionali Equazioni irrazionali Definizione: si definisce equazione irrazionale un equazione in cui compaiono uno o più radicali contenenti l incognita. Esempio 7 Ricordiamo quanto visto sulle condizioni di esistenza

Dettagli

Capitolo 10 Z Elasticità della domanda

Capitolo 10 Z Elasticità della domanda Capitolo 10 Z Elasticità della domanda Sommario Z 1. L elasticità della domanda rispetto al prezzo. - 2. La misura dell elasticità. - 3. I fattori determinanti l elasticità. - 4. L elasticità rispetto

Dettagli

Successioni di funzioni reali

Successioni di funzioni reali E-school di Arrigo Amadori Analisi I Successioni di funzioni reali 01 Introduzione. In questo capitolo applicheremo i concetti di successione e di serie alle funzioni numeriche reali. Una successione di

Dettagli

Econometria. lezione 17. variabili dipendenti binarie. Econometria. lezione 17. AA 2014-2015 Paolo Brunori

Econometria. lezione 17. variabili dipendenti binarie. Econometria. lezione 17. AA 2014-2015 Paolo Brunori AA 2014-2015 Paolo Brunori domande di mutui rigettate - nei dati raccolti a Boston negli anni 90 il tasso di rifiuto è 28% per i neri e 9% per i bianchi - si può parlare di discriminazione? - è possibili

Dettagli

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 17/06/2015 NOME: COGNOME: MATRICOLA: Esercizio 1 Un sistema

Dettagli

Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco

Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco Alfonso Iodice D Enza April 26, 2007 1...prima di cominciare Contare, operazione solitamente semplice, può diventare complicata se lo scopo

Dettagli

Esponenziali elogaritmi

Esponenziali elogaritmi Esponenziali elogaritmi Potenze ad esponente reale Ricordiamo che per un qualsiasi numero razionale m n prendere n>0) si pone a m n = n a m (in cui si può sempre a patto che a sia un numero reale positivo.

Dettagli

Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla

Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla Il metodo della regressione può essere esteso dal caso in cui si considera la variabilità della risposta della y in relazione ad una sola variabile indipendente X ad una situazione più generale in cui

Dettagli

Capitolo 2. Operazione di limite

Capitolo 2. Operazione di limite Capitolo 2 Operazione di ite In questo capitolo vogliamo occuparci dell operazione di ite, strumento indispensabile per scoprire molte proprietà delle funzioni. D ora in avanti riguarderemo i domini A

Dettagli

Lezione 10: Il problema del consumatore: Preferenze e scelta ottimale

Lezione 10: Il problema del consumatore: Preferenze e scelta ottimale Corso di Scienza Economica (Economia Politica) prof. G. Di Bartolomeo Lezione 10: Il problema del consumatore: Preferenze e scelta ottimale Facoltà di Scienze della Comunicazione Università di Teramo Scelta

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

E NECESSARIO RICORRERE ALLE VARIABILI CASUALI

E NECESSARIO RICORRERE ALLE VARIABILI CASUALI IL CONCETTO DI VARIABILE CASUALE Associare una misura di probabilità al verificarsi di un certo evento (come esito di un esperimento) non sempre è sufficiente a risolvere gran parte dei problemi reali

Dettagli

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi. Iniziamo con definizione (capiremo fra poco la sua utilità): DEFINIZIONE DI VARIABILE ALEATORIA Una variabile aleatoria (in breve v.a.) X è funzione che ha come dominio Ω e come codominio R. In formule:

Dettagli

Stime sul costo e sugli effetti distributivi di programmi di contrasto alla povertà. Massimo Baldini (CAPP) Daniele Pacifico (CAPP e MLPS)

Stime sul costo e sugli effetti distributivi di programmi di contrasto alla povertà. Massimo Baldini (CAPP) Daniele Pacifico (CAPP e MLPS) Stime sul costo e sugli effetti distributivi di programmi di contrasto alla povertà Massimo Baldini (CAPP) Daniele Pacifico (CAPP e MLPS) Il modello di riferimento Per le simulazioni è stato impiegato

Dettagli

Raccolta degli Scritti d Esame di ANALISI MATEMATICA U.D. 1 assegnati nei Corsi di Laurea di Fisica, Fisica Applicata, Matematica

Raccolta degli Scritti d Esame di ANALISI MATEMATICA U.D. 1 assegnati nei Corsi di Laurea di Fisica, Fisica Applicata, Matematica DIPARTIMENTO DI MATEMATICA Università degli Studi di Trento Via Sommarive - Povo (TRENTO) Raccolta degli Scritti d Esame di ANALISI MATEMATICA U.D. 1 assegnati nei Corsi di Laurea di Fisica, Fisica Applicata,

Dettagli

Tema A. 1.2. Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che

Tema A. 1.2. Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che Statistica Cognome: Laurea Triennale in Biologia Nome: 26 luglio 2012 Matricola: Tema A 1. Parte A 1.1. Sia x 1, x 2,..., x n un campione di n dati con media campionaria x e varianza campionaria s 2 x

Dettagli

Paperone e Rockerduck: a cosa serve l antitrust?

Paperone e Rockerduck: a cosa serve l antitrust? Paperone e Rockerduck: a cosa serve l antitrust? Paperone Anna Torre, Rockerduck Ludovico Pernazza 1-14 giugno 01 Università di Pavia, Dipartimento di Matematica Concorrenza Due imprese Pap e Rock operano

Dettagli

Matematica Applicata. Probabilità e statistica

Matematica Applicata. Probabilità e statistica Matematica Applicata Probabilità e statistica Fenomeni casuali Fenomeni che si verificano in modi non prevedibili a priori 1. Lancio di una moneta: non sono in grado di prevedere con certezza se il risultato

Dettagli

STATISTICA IX lezione

STATISTICA IX lezione Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri

Dettagli

Corso di Analisi Matematica. Polinomi e serie di Taylor

Corso di Analisi Matematica. Polinomi e serie di Taylor a.a. 2013/14 Laurea triennale in Informatica Corso di Analisi Matematica Polinomi e serie di Taylor Avvertenza Questi sono appunti informali delle lezioni, che vengono resi disponibili per comodità degli

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Distribuzione di probabilità, funzione di ripartizione di una v.c. discreta Il tasso di cambio

Dettagli

3. Confronto tra medie di due campioni indipendenti o appaiati

3. Confronto tra medie di due campioni indipendenti o appaiati BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

Inferenza statistica I Alcuni esercizi. Stefano Tonellato

Inferenza statistica I Alcuni esercizi. Stefano Tonellato Inferenza statistica I Alcuni esercizi Stefano Tonellato Anno Accademico 2006-2007 Avvertenza Una parte del materiale è stato tratto da Grigoletto M. e Ventura L. (1998). Statistica per le scienze economiche,

Dettagli

Università di Napoli Parthenope Facoltà di Ingegneria

Università di Napoli Parthenope Facoltà di Ingegneria Università di Napoli Parthenope Facoltà di Ingegneria Corso di rasmissione Numerica docente: Prof. Vito Pascazio 18 a Lezione: 13/1/4 19 a Lezione: 14/1/4 Sommario rasmissione di segnali PM numerici su

Dettagli