Esercizio Regressione logistica

Похожие документы
Dall Analisi Fattoriale alla Regressione Lineare

Statistica per le ricerche di mercato

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

BENCHMARK LE DIMENSIONI DEL QUESTIONARIO: Cultura e prassi per il diversity. Struttura e composizione della forza lavoro POPOLAZIONE AZIENDALE

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

JMP 10 Student Edition: Guida rapida

Statistica multivariata 27/09/2016. D.Rodi, 2016

Corso di Psicometria Progredito

Statistica per le ricerche di mercato

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010

Esercitazioni di statistica

Statistica multivariata Donata Rodi 17/10/2016

PROBABILITÀ ELEMENTARE

Statistica di base per l analisi socio-economica

CORSO INTEGRATO DI STATISTICA E INFORMATICA MEDICA

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

Metodi di analisi statistica multivariata

Analisi della varianza

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

Università degli Studi di Cassino. Corso di Laurea in Economia Aziendale. Corso di. Statistica. Docente: Simona Balzano.

Esercitazione di Statistica Indici di associazione

viii Indice generale

Dispensa di Statistica

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

Regressione lineare semplice

Applicazioni statistiche e utilizzo del package statistico Spss - 7

LEZIONI DI STATISTICA MEDICA

Istituzioni di Statistica

La regressione lineare multipla

Argomenti della lezione:

Statistica multivariata

Analisi Bivariata: Test Statistici

Esplorazione dei dati. Lucidi e dataset tratti da Turini - Analisi dei Dati, Dip. Inf. Unipi

Lab. 2 - Excel. Prof. De Michele e Farina

DATASET GUIDA ALL USO

dati e la loro significatività statistica con l utilizzo della calcolatrice per l analisi statistica dei dati.

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

Introduzione al software SAS

REGRESSIONE E CORRELAZIONE

Statistica. Alfonso Iodice D Enza

Test per la correlazione lineare

VALUTAZIONE D IMPATTO DELLE POLITICHE REGIONALI PER LA PROMOZIONE DELL APPROPRIATEZZA ORGANIZZATIVA

Compiti tematici dai capitoli 2,3,4

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

I FINANZIAMENTI: IL CAPITALE DI TERZI. o Operazioni di finanziamento a breve termine o Operazioni di finanziamento a lungo termine

ANALISI MULTIVARIATA

«L'INDAGINE STATISTICA»

STATISTICA ESERCITAZIONE 13

Esercitazione del

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento

Regressione e Correlazione (cap. 11) Importazione dati da file di testo

Ruolo del Testosterone su Massa e Forza muscolare nell invecchiamento: risultati dallo studio InCHIANTI

Facoltà di Economia - Università di Pavia Simulazione Prova Scritta di Statistica Sociale 19 dicembre 2012

Facoltà di Psicologia - Corso FSE gennaio febbraio Marco Vicentini info@marcovicentini.it

SCOPO DELL ANALISI DI CORRELAZIONE

Analisi Univariata e Multivariata dei Dati Economici Bruno Ricca (Dipartimento di studi su risorse, impresa, ambiente e metodologie quantitative)

Associazione tra caratteri quantitativi: gli indici di correlazione

Statistica a breve termine: metodo delle onde apparenti

Inferenza statistica II parte

LEZIONE 1.1. corso di statistica. Francesco Lagona Università Roma Tre. LEZIONE 1.1 p. 1/18

. CONVENZIONI BANCA MONTE PARMA - CARISBO. CONVENZIONI BANCO POPOLARE. BANCA POPOLARE DELL EMILIA ROMAGNA. CONVENZIONI CARIPARMA CREDIT AGRICOLE

ll Questionario Metodi Quantitativi per Economia, Finanza e Management Esercitazione n 2

VIII Indice 2.6 Esperimenti Dicotomici Ripetuti: Binomiale ed Ipergeometrica Processi Stocastici: Bernoul

Tra i non fumatori qual è la percentuale di non utilizzatori di sostanze stupefacenti? Scegli un'alternativa: a. 86% b. 10% c. 50% d. 25% e.

STATISTICA AZIENDALE Modulo Controllo di Qualità

Statistica multivariata Donata Rodi 21/11/2016

Транскрипт:

Esercizio Regressione logistica Metodi Quantitativi per Economia, Finanza e Management Esercitazione n 12

Consegna Lavoro di gruppo Scadenza per la consegna del lavoro di gruppo è fissata inderogabilmente per il giorno: Venerdì 13 Gennaio 2017 La consegna va effettuata entro le ore 12 alla Sig.ra Enrica Luezza (Segreteria 4 Piano) Il materiale da consegnare consiste in: stampa cartacea della presentazione in Power Point; Chiavetta USB contenente: questionario; base dati in formato Excel; presentazione Power Point. N.B. Il supporto elettronico (chiavetta USB) non sarà restituito Copyright. All rights reserved. Corso di Metodi Quantitativi per Economia, Finanza e Management - Università Carlo Cattaneo, LIUC.

Metodi Quantitativi per Economia, Finanza e Management Tipo di analisi Strumenti Lavoro di gruppo ANALISI UNIVARIATA - DISTRIBUZIONI DI FREQUENZA - INDICI DI POSIZIONE (MISURE DI TENDENZA CENTRALE E MISURE DI TENDENZA NON CENTRALE) - INDICI DI DISPERSIONE - MISURE DI FORMA DELLA DISTRIBUZIONE Due variabili qualitative o quantitative discrete: TABELLA DI CONTINGENZA E INDICI CHI QUADRO E V DI CRAMER TEST CHI QUADRO PER L'INDIPENDENZA STATISTICA ANALISI BIVARIATA E TEST ANALSI BIVARIATA E TEST STATISTICI Due variabili quantitative continue: PER STATISTICI LO STUDIO PER DELL'ASSOCIAZIONE LO STUDIO INDICE DI CORRELAZIONE DI PEARSON (ρ) E COVARIANZA TRA DELL ASSOCIAZIONE VARIABILI TRA VARIABILI TEST t PER L'INDIPENDENZA LINEARE Una variabile qualitativa e una quantitativa continua: INDICE η 2 TEST F PER L'INDIPENDENZA IN MEDIA ANALISI MULTIVARIATA - ANALISI FATTORIALE - ANALISI FATTORIALE - REGRESSIONE LINEARE - REGRESSIONE LINEARE - REGRESSIONE LOGISTICA - SERIE - REGRESSIONE STORICHE LOGISTICA SCEGLIERE 3 DELLE 4 TECNICHE A SECONDA DEGLI OBIETTIVI DI ANALISI PREFISSATI Copyright. All rights reserved. Corso di Metodi Quantitativi per Economia, Finanza e Management - Università Carlo Cattaneo, LIUC.

Lavoro di gruppo Schema di valutazione Topics 1. Introduzione 1.1. Definizione Obiettivi di Ricerca 1.2. Descrizione del Contesto 1.3. Definizione della Popolazione 1.4. Disegno del Campione 1.5. Fieldwork 2. Analisi Preliminari 2.1. Controllo Rappresentatività del Campione 2.2. Analisi Univariate 2.3. Analisi Connessione 2.6. Analisi Correlazione 2.7. ANOVA 3. Analisi Fattoriale 3.1. Scelta Numero dei fattori 3.2. Interpretazione dei fattori 4. Regressione Lineare 4.1. Definizione obiettivo di analisi 4.2. Scelta variabili di input 4.3. Valutazione bontà del modello 4.4. Analisi Multicollinearità 4.5. Interpretazione del modello 5. Regressione Logistica 5.1. Definizione obiettivo di analisi 5.2. Scelta variabili di input 5.3. Valutazione bontà del modello 5.4. Analisi Multicollinearità 5.5. Interpretazione del modello 6. Conclusioni 7. Layout Copyright. All rights reserved. Corso di Metodi Quantitativi per Economia, Finanza e Management - Università Carlo Cattaneo, LIUC.

Esercizio: Regressione Logistica Il dataset ct_pp_propensity contiene 23 variabili e 145.401 clienti di una banca. Di seguito la descrizione di ogni variabile: # Variable Descrizione Variabili 1 ID CLIENTE Codice identificativo cliente 2 ACQUISTO_PP Acquisto un prestito personale nel periodo considerato 3 FLG_REF_CC Referente di del conto corrente analizzato 4 FLG_DOMICILIAZIONE_UTENZE Domiciliazione utenze 5 FLG_POSSESSO_DEBITO Possesso di Carte di Debito 6 FLG_ACCREDITO_PENSIONE Accredito dello stipendio e/o della pensione 7 FLG_POSSESSO_BT Possesso di Finanziamenti BT (a breve termine) 8 FLG_RID_12M Attivazione di un RID verso un concorrente negli ultimi 12 mesi 9 FLG_CONTO_CORRENTE Possesso di c/c 10 FLG_POSSESSO_CREDITO Possesso Carte di Credito 11 ETA Età in classi 12 N_COINT_POSS_CC Numero di cointestari del Conto Corrente 13 N_NDG_TOTALI Numero di contratti attivi per il cliente 15 CAR_NUM_PREL Numero di prelevementi con carta di credito 16 AFI_IMP_TOT_M6 Afi (Attività Fruttifere d'interessi) medio degli ultimi 6 mesi 17 CS_NUM_CS Numero di classi di famiglie di prodotti 18 MAR_PCT_IMP_FINNZ_IMPGH_BT_M6 Percentuale media Margini Finanziari Impieghi BT sul totale margini nell'ultimo semestre 19 OPR_IMP_PREL_TOT_M6 Importo medio prelevato nell'ultimo semestre 20 OPR_IMP_SPE_CAR_D_TOT_M6 Importo medio speso mediante l'utilizzo del bancomat nell'ultimo semestre 21 OPR_IMP_USC_TOT_M6 Importo medio delle uscite nell'ultimo semestre 23 OPR_PCT_IMP_USC_INT_M6 Percentuale delle uscite sul canale internet

Esercizio: Regressione Logistica 1. Cambiare la directory di lavoro in modo che punti alla cartella in cui si è salvato il dataset. 2. Effettuare una regressione logistica utilizzando come variabile dipendente la variabile ACQUISTO_PP e come potenziali regressori le seguenti variabili: FLG_DOMICILIAZIONE_UTENZE FLG_ACCREDITO_PENSIONE FLG_POSSESSO_BT FLG_RID_12M FLG_CONTO_CORRENTE MAR_PCT_IMP_FINNZ_IMPGH_BT_M6 FLG_POSSESSO_CREDITO N_COINT_POSS_CC N_NDG_TOTALI CAR_NUM_PREL AFI_IMP_TOT_M6 OPR_IMP_PREL_TOT_M6 OPR_IMP_USC_TOT_M6 OPR_PCT_IMP_USC_INT_M6

Esercizio: Regressione Logistica Qual è la percentuale di clienti che ha acquistato un Prestito Personale? Verificare la bontà del modello stimato Esiste un problema di multicollinearità? Quali regressori risultano significativi? Quale regressore è più importante nella spiegazione della variabile risposta? Quali regressori hanno un impatto positivo e negativo sulla variabile risposta? Qual è la loro interpretazione?