Esercizi riepilogativi Analisi Univariata e Bivariata

Documenti analoghi
Esercizio Regressione logistica

Esercizio Regressione logistica

Analisi Bivariata: Test Statistici

Analisi Bivariata: Test Statistici

Analisi Univariata & Esercizi

Istituzioni di Statistica

Analisi Bivariata. Metodi Quantitativi per Economia, Finanza e Management. Esercitazione n 4

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Analisi Bivariata. Metodi Quantitativi per Economia, Finanza e Management. Esercitazione n 4

Statistica di base per l analisi socio-economica

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano

STATISTICA. Regressione-4 ovvero Macron!

Statistica descrittiva

PROBABILITA' E STATISTICA Prova del 24/06/2016 Traccia E

1.1 Obiettivi della statistica Struttura del testo 2

Analisi Univariata & Esercizi

Analisi Univariata & Esercizi

Esplorazione dei dati. Lucidi e dataset tratti da Turini - Analisi dei Dati, Dip. Inf. Unipi

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Analisi univariata Analisi bivariata Analisi multivariata

Metodi Quantitativi per Economia, Finanza e Management. Esempi di Analisi Univariata

Metodi statistici per le ricerche di mercato

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

Dispense Associazione PRELIMINARY DRAFT

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Ringraziamenti dell Editore

3/19/18. Obiettivo: Descrizione di un Istogramma

Dispensa di Statistica

Esercizio Regressione logistica

STATISTICA 1 ESERCITAZIONE 6

Esplorazione dei dati

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Probabilità e Statistica Prova del 29/07/2016 Traccia E TEORIA Università degli Studi di Verona Laurea in Informatica e Bioinformatica A.A.

Corso di Laurea triennale Tecniche della Prevenzione PERCORSO STRAORDINARIO 2007/08. Insegnamento di STATISTICA MEDICA. Modulo II

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

Probabilità e Statistica Prova

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

INDICI DI FORMA: L ASIMMETRIA

LA RAPPRESENTAZIONE E LA SINTESI DEI DATI

STATISTICA AZIENDALE Modulo Controllo di Qualità

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

STATISTICA PER LA DIGITAL ECONOMY Marco Riani

Compiti tematici dai capitoli 2,3,4

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica. a.a. 2015/2016

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Test d Ipotesi

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Analisi Bivariata I Parte

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B

Prova d esame di Statistica - II canale - nuovo ordinamento Dott.ssa C. Conigliani 19/06/2003

Teoria e tecniche dei test. Concetti di base

Esercizi di statistica

PROBABILITA' E STATISTICA Prova del 29/07/2016 Traccia E

Applicazioni statistiche e utilizzo del package statistico Spss - 7

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 4 Analisi Bivariata I Parte

ESERCITAZIONI N. 2 corso di statistica

PROBABILITÀ ELEMENTARE

Indice. Presentazione

Statistica descrittiva II

COGNOME.NOME...MATR..

Analisi bivariata. Il caso di caratteri quantitativi

CORSO INTENSIVO ESTIVO DI ALBA DI CANAZEI STATISTICA. A. A. 2013/2014 (Prof. Marco Minozzo;

Corso di Laurea in Amministrazione Aziendale Complex Learning. Statistica per l azienda (T) SECS-S/01 a. a. 2017/2018

STATISTICA. Esercitazione 5

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

Corso di Laurea in Economia Aziendale Università di Bologna STATISTICA

Data Journalism. Analisi dei dati. Angelica Lo Duca

Introduzione alla statistica con Excel

Probabilità e Statistica Prova del 16/09/2016 Traccia A TEORIA Università degli Studi di Verona Laurea in Informatica e Bioinformatica A.A.

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

La statistica descrittiva

Presentazione dell edizione italiana

Nozioni di statistica

REGISTRO DELLE LEZIONI*

Analisi della varianza

Probabilità e Statistica Prova del 14/09/2018 Traccia A Università degli Studi di Verona Laurea in Informatica e Bioinformatica A.A.

Scale di Misurazione Lezione 2

ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE

Statistica per le le ricerche ricerche di mercato 9.b 9.b Analisi Analisi preliminari preliminari Verifica di ipotesi: test test di indipendenza

Capitolo 3 Sintesi e descrizione dei dati quantitativi

Statistica multivariata 27/09/2016. D.Rodi, 2016

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

Scheda Corso di STATISTICA (D.M. 270 per 9 CFU) Anno Accademico 2014/2015 (versione in Italiano)

Statistica Descrittiva Esercitazione 3. Indici di variabilità

Med. Med. Si determinano il limite inferiore e superiore applicando le seguenti formule

Facoltà di ECONOMIA Università di Pavia 26 Aprile 2006 Prova scritta di Analisi dei dati

Il processo ERM: metodologie, strumenti, strategie di riduzione e controllo dei rischi a cura del Dott.RobertoMuscogiuri 16/06/2016

Transcript:

Esercizi riepilogativi Analisi Univariata e Bivariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n 6

Metodi Quantitativi per Economia, Finanza e Management Obiettivi di questa esercitazione: 1 2 Breve ripasso teorico Esercizi

Metodi Quantitativi per Economia, Finanza e Management Tipo di analisi Strumenti Lavoro di gruppo ANALISI UNIVARIATA - DISTRIBUZIONI DI FREQUENZA - INDICI DI POSIZIONE (MISURE DI TENDENZA CENTRALE E MISURE DI TENDENZA NON CENTRALE) - INDICI DI DISPERSIONE - MISURE DI FORMA DELLA DISTRIBUZIONE OBBLIGATORIO Due variabili qualitative o quantitative discrete: TABELLA DI CONTINGENZA E INDICI CHI QUADRO E V DI CRAMER TEST CHI QUADRO PER L'INDIPENDENZA STATISTICA ANALISI BIVARIATA E TEST ANALSI BIVARIATA E TEST STATISTICI Due variabili quantitative continue: PER STATISTICI LO STUDIO PER DELL'ASSOCIAZIONE LO STUDIO OBBLIGATORIO INDICE DI CORRELAZIONE DI PEARSON (ρ) E COVARIANZA OBBLIGATORIO TRA DELL ASSOCIAZIONE VARIABILI TRA VARIABILI TEST t PER L'INDIPENDENZA LINEARE Una variabile qualitativa e una quantitativa continua: INDICE η 2 TEST F PER L'INDIPENDENZA IN MEDIA ANALISI MULTIVARIATA - ANALISI FATTORIALE - ANALISI FATTORIALE - REGRESSIONE LINEARE - REGRESSIONE LINEARE - REGRESSIONE LOGISTICA - SERIE - REGRESSIONE STORICHE LOGISTICA SCEGLIERE 3 DELLE 4 TECNICHE A SECONDA OBBLIGATORIO DEGLI OBIETTIVI DI ANALISI PREFISSATI

Analisi Univariata: Misure di Sintesi Misure di posizione: Misure di tendenza centrale: Media aritmetica Mediana Moda Misure di tendenza non centrale: Quantili di ordine p (percentili, quartili) Misure di dispersione: Campo di variazione Differenza interquartile Varianza Scarto quadratico medio Coefficiente di variazione Misure di forma della distribuzione: Skewness Kurtosis

Misure di Forma della Distribuzione Kurtosis: indice che permette di verificare se i dati seguono una distribuzione di tipo Normale (simmetrica) β=3 se la distribuzione è Normale β<3 se la distribuzione è iponormale β>3 se la distribuzione è ipernormale ipernormale Normale iponormale Skewness: indice che informa circa il grado di simmetria o asimmetria di una distribuzione γ=0 distribuzione simmetrica γ<0 asimmetria negativa (mediana>media) γ>0 asimmetria positiva (mediana<media)

Analisi Univariata: Procedure R Studio della distribuzione di ogni variabile, singolarmente considerata, all interno della popolazione R TIPO VARIABILE FUNZIONE freq table Variabili qualitative o quantitative discrete Distribuzione di frequenze (frequenze assolute, relative) summary basicstats IQR CV getmode Variabili quantitative Calcolo misure di sintesi di tipo univariato NB: possibilità di analizzare la distribuzione della variabile rispetto ad una variabile di classificazione

Analisi Bivariata: Riepilogo Studio della distribuzione di due variabili congiuntamente considerate e delle relazioni esistenti tra esse TIPO DI VARIABILI TIPO DI RELAZIONE INDAGATA INDICI DI DIPENDENZA FUNZIONI R Due Variabili Qualitative Indipendenza Statistica Chi Quadro, Cramer V CrossTable, CramerV Due Variabili Quantitative Indipendenza Lineare coeff. di correlazione lineare cor.test Una Qualitative e Una Quantitativa continua Indipendenza in media indice eta-quadro etasquared

1) Sistema di Ipotesi 2) Calcolo Statistica test Test d Ipotesi Formulazione ipotesi nulla e ipotesi alternative H0: X e Y sono indipendenti ቊ H1: X e Y dipendenti Impostazione a priori del livello di significatività α Calcolo del valore della statistica test (specifica del test che si sta conducendo) sulla base dei dati campionari 3) Calcolo P-value Calcolo del livello di significatività osservato Se p-value < α Se p-value α sulla base dei dati campionari, la probabilità di rifiutare H0 quando H0 è vera è inferiore alla soglia scelta rifiuto H0 accetto H0

Approccio di analisi Test statistico Valutazione indice 1) Eseguire l opportuno test statistico in dipendenza dalla tipologia delle variabili poste a confronto; 2) Analizzare l esito del test (p-value): a) Indipendenza tra le due variabili verificare se il valore dell indice conferma l esito del test; b) Dipendenza tra le due variabili valutare il valore dell indice per indagare la forza della relazione.

Metodi Quantitativi per Economia, Finanza e Management Obiettivi di questa esercitazione: 1 2 Breve ripasso teorico Esercizi

Dataset Il dataset Banca contiene informazioni relative ai comportamenti di 1000 clienti di una banca. Le variabili presenti nel dataset riguardano informazioni sullo stato economico del cliente (es. saldo CC, importi vari) e informazioni contrattuali (es. utilizzo plastic card, accredito stipendio).

Variabili (1) # Variable Type Len Label 1 UTE Num 8 IMPORTO TOTALE UTENZE DOMICILIATE 2 NUTE Num 8 NUM. OPERAZIONI UTENZE DOMICILIATE 3 CARBCM Num 8 IMPORTO TOTALE PLASTIC CARDS 4 NCARBCM Num 8 NUM. OPERAZIONI PLASTIC CARDS 5 STICONV Num 8 IMPORTO TOTALE ACCREDITO STIPENDIO 6 NSTICONV Num 8 NUM. OPERAZIONI ACCREDITO STIPENDIO 7 TIT Num 8 IMPORTO TOTALE CAUSALE TITOLI 8 NTIT Num 8 NUM. OPERAZIONI CAUSALE TITOLI 9 RIMBAFF Num 8 IMPORTO TOTALE RIMBORSI AFFIDAMENTI 10 NRIMBAFF Num 8 NUM. OPERAZIONI RIMBORSI AFFIDAMENTI 11 LEAS Num 8 IMPORTO TOTALE CAUSALE LEASING 12 NLEAS Num 8 NUM. OPERAZIONI CAUSALE LEASING 13 ASS Num 8 IMPORTO TOTALE ASSEGNI 14 NASS Num 8 NUM. OPERAZIONI ASSEGNI 15 TASSE Num 8 IMPORTO TOTALE CAUSALE TASSE 16 NTASSE Num 8 NUM. OPERAZIONI CAUSALE TASSE 17 ASSIC Num 8 IMPORTO TOTALE POLIZZE ASSICURATIVE 18 NASSIC Num 8 NUM. OPERAZIONI POLIZZE ASSICURATIVE 19 CD Num 8 IMPORTO TOTALE CERTIFICATI DI DEPOSITO 20 NCD Num 8 NUM. OPERAZIONI CERTIFICATI DI DEPOSIT

Variabili (2) # Variable Type Len Label 21 CUSTODIA Num 8 IMPORTO COMMISSIONI TITOLI A CUSTODIA 22 NCUST Num 8 NUM. OPER. COMMISSIONI TITOLI A CUSTODIA 23 IMPA Num 8 IMPORTO OPERAZIONI AVERE 24 IMPAP Num 8 IMPORTO OPERAZIONI AVERE ANNO PRECEDENTE 25 IMPD Num 8 IMPORTO OPERAZIONI DARE 26 IMPDP Num 8 IMPORTO OPERAZIONI DARE ANNO PRECEDENTE 27 NAVEP Num 8 NUM. OPERAZIONI AVERE ANNO PRECEDENTE 28 NAVERE Num 8 NUM. OPERAZIONI AVERE 29 NDARE Num 8 NUM. OPERAZIONI DARE 30 NDARP Num 8 NUM. OPERAZIONI DARE ANNO PRECEDENTE 31 SMEDIO Num 8 SALDO MEDIO DI CONTO CORRENTE 32 S_UTENZE Num 8 DOMICILIAZIONE UTENZE SI/NO 33 S_PLASTI Num 8 UTILIZZO PLASTIC CARD SI/NO 34 S_STIPEN Num 8 ACCREDITO AUTOMATICO STIPENDIO SI/NO 35 S_TITOLI Num 8 POSSESSO TITOLI SI/NO 36 S_RIMBOR Num 8 UTILIZZO AFFIDAMENTI 37 S_LEASIN Num 8 LEASING SI/NO 38 S_ASSICU Num 8 POLIZZE ASSICURATIVE SI/NO 39 S_CERTIF Num 8 POSSESSO CERTIFICATI DI DEPOSITO 40 S_CUSTOD Num 8 POSSESSO TITOLI A CUSTODIA 41 CLIENTE Num 8 CODICE PROGRESSIVO CLIENTE 42 sesso Char 1 SESSO DEL CLIENTE

Modalità di svolgimento Impostare l area di lavoro su C:\corso Importare il file banca.csv, salvarlo in un oggetto a cui attribuire il nome banca Svolgere gli esercizi utilizzando il dataset banca. Riportare i risultati delle analisi svolte (copiando gli output R necessari e commentando adeguatamente) nel file Esercitazione_6.docx contenuto nella cartella C:\corso

Esercizi (1) 1. Qual è la media del saldo medio del conto corrente [SMEDIO]? 2. Si può affermare che la maggior parte dei clienti utilizza la plastic card [S_PLASTI]? 3. E corretto affermare che il 66.67% dei clienti non possiede titoli [S_TITOLI]? 4. E corretto affermare che il saldo medio del conto corrente è una variabile con asimmetria positiva [SMEDIO]? Riportare anche il grafico. 4.Bis Qual è la moda del numero di operazioni delle utenze domiciliate?[nute]

Esercizi (2) 5. Tra coloro che hanno una polizza assicurativa, qual è l importo medio delle polizze assicurative [ASSIC][S_ASSICU]? 6. Chi ha effettuato molte operazioni dare l anno precedente ha effettuato molte operazioni dare nell anno analizzato [NDARE][NDARP]? 6.Bis Esiste una relazione tra le variabili saldo medio in c/c, accredito stipendio, importo commissioni titoli e importo polizze assicurative? [SMEDIO][STICONV][CUSTODIA] [ASSIC] 7. Si può affermare che esiste una relazione tra il numero di operazioni dare e operazioni avere [NDARE][NAVERE]?

Esercizi (3) 8. C è una relazione tra la domiciliazione delle utenze e l utilizzo della plastic card [S_UTENZE][S_PLASTI]? E tra il possesso di certificati di deposito e il possesso di titoli a custodia [S_CERTIF][S_CUSTOD]? 9. Si può affermare che esiste una relazione tra il sesso e l'accredito stipendio [SESSO][STICONV]? 10.Si può affermare che esiste una relazione tra possesso di titoli e saldo medio in conto corrente? [S_TITOLI] [SMEDIO]