ANALISI DEI DATI PER IL MARKETING Marco Riani
|
|
- Giuseppa Orlando
- 5 anni fa
- Visualizzazioni
Transcript
1 ANALISI DEI DATI PER IL MARKETING 2018 Marco Riani
2 INFORMAZIONI SUL CORSO Orario MER (frontale) MER (frontale) VEN (laboratorio) Ricevimento GIO VEN
3 E necessario registrarsi per accedere ai computer del laboratorio!
4 INFORMAZIONI SUL CORSO Conoscenze preliminari conoscenza di base di statistica descrittiva e inferenziale Tutti i lucidi saranno disponibili su
5 Calendario degli esami 18 dicembre 2018 ore gennaio 2019 ore gennaio 2019 ore maggio 2019 ore giugno 2019 ore giugno 2019 ore settembre 2019 ore Primo appello: a computer
6 LIBRO DI TESTO Sergio Zani Andrea Cerioli ANALISI DEI DATI E DATA MINING PER LE DECISIONI AZIENDALI Giuffrè MATERIALE AGGIUNTIVO SU E consentito tenere questo libro durante l esame!
7 SOFTWARE SPSS: Statistical Package for Social Sciences MATLAB R SAS: Statistical Analysis System
8 Software utilizzati nel corso Excel 2016 SPSS ver. 25
9 MODALITÀ DI ESAME (prova scritta tradizionale) Quattro (tre) domande, ciascuna costituita da vari punti: aspetti di calcolo aspetti di commento e di interpretazione dei risultati circa della medesima importanza Commento dei risultati ottenuti da SPSS e/o altro software
10 MODALITÀ DI ESAME (prova al computer) Si parte da un dataset dentro un file Excel: Elaborazione dei dati con Excel Componenti aggiuntivi di Excel per effettuare determinate operazioni statistiche Commento ai risultati
11 Il foglio "dati" contiene le risposte da un questionario riguardante l'attitudine verso la scienza (SCIENZA), il titolo di studio (TITOLO_STUDIO) e la classe di età (ETA). La codifica della variabile SCIENZA è la seguente 1= per niente favorevole 2= poco favorevole 3= indifferente 4= favorevole 5= molto favorevole La codifica della variabile TITOLO_STUDIO è la seguente 1= licenza elementare 2= licenza media 3= diploma di scuola media superiore 4= laurea triennale 5= laurea specialistica 6= dottorato di ricerca La codifica della variabille ETA è la seguente: 1= < 20 anni 2= anni 3= anni 4= anni 5= anni 6= >70 anni
12 1) Calcolare la tabella di contingenza tra le variabili SCIENZA (righe) e TITOLO_STUDIO (colonne) 2) Calcolare la tabella delle frequenze teoriche nell'ipotesi di indipendenza tra le due variabili 3) Calcolare il valore del test chi quadrato ed il relativo p-value. Commentare il risultato ottenuto. Qual è il valore del test chi quadrato che ci attendiamo nell'ipotesi di indipendenza stocastica dei due fenomeni? 4) Calcolare i profili riga. Dire qual è il profilo riga che si discosta di meno dalla media e qual è quello che si discosta maggiormente dalla media. 5) Calcolare l'inerzia totale 6) Discutere la quota di varianza spiegata dalle prime due dimensioni latenti 7) Trovare le coordinate dei punti riga e colonna da rappresentare nel grafico. Commentare il grafico che si ottiene. 8) Con riferimento alle righe, calcolare il contributo di ogni punto riga all'inerzia della prima dimensione e il contributo della prima dimensione all'inerzia dei punti riga. 9) Calcolare e commentare l'indice gamma di Goodman e Kruskall
13 Risoluzione punto 1
14 Risoluzione punto 7
15 Commento al grafico Commento al grafico: chi presenta il titolo di studio "licenza elementare" generalmente non è assolutamente favorevole alla "Scienza". Al contrario, la posizione "molto favorevole alla scienza" si riscontra prevalentemente da parte di coloro che hanno la laurea (oppure il dottorato di ricerca). L'asse x si può interpretare come anni di studio (andando da sinistra verso destra gli anni di studio aumentano) e allo stesso tempo come posizione verso la scienza (andando da sinistra verso destra la posizione verso al scienza tende ad aumentare).
16 Obiettivi del corso Illustrare i metodi statistici per il trattamento delle informazioni d interesse aziendale, considerando contemporaneamente più variabili, sia qualitative sia quantitative. Fornire un supporto conoscitivo razionale per le decisioni
17 EVOLUZIONE DI CONCETTI Statistica (descrittiva e inferenziale) Analisi dei dati multidimensionali Data Mining = «Estrazione da una miniera di dati» (di grandi dimensioni) Scavare in insiemi di dati molto numerosi per estrarre informazioni utili Text mining Web mining
18 PUNTO DI PARTENZA dell analisi dei dati MATRICE DEI DATI: X riferita a n unità e p variabili Ipermercati Sup. addetti vendite Centro Torri Esselunga...
19 Es di matrice dei dati
20 MATRICE DEI DATI X n p = x x x 11 i1 n1 x x x 1s is ns x x x 1p ip np x is = modalità che presenta la variabile s- esima nell unità statistica i-esima Significato dei vettori riga e dei vettori colonna Tipologia delle unità statistiche
21 TIPI DI DATI Qualitativi (categorici) nominali: Esempi: sesso, tipo di laurea, forma giuridica delle imprese BINARI (DICOTOMICI) O CON CATEGORIE MULTIPLE (POLITOMICI) Qualitativi (categorici) ordinali: giudizi: insuff., suff., discreto, buono, ottimo Quantitativi: peso, fatturato, n. dipendenti
22 Tab Home theatre, 7 variabili pag. 8 MARCA PREZZO POTENZA CASSE DVDREC WIREL. DVX RDS 1 Akai Hitachi K Lg DAT Yamaha YHT
23 TIPI DI MATRICI DEI DATI unità x variabili X di dimensioni n x p Individui (questionari) Aziende Prodotti o marche Unità territoriali (province, ) Tempi (serie storiche o temporali)
24 DATI ASSOLUTI E RELATIVI Esempio: n aziende DATI ASSOLUTI: Fatturato, valore aggiunto, n. addetti, DATI RELATIVI: Fatturato per addetto, valore aggiunto sul fatturato, ROE, A PRIORI DEFINISCO LO SCOPO DELLA RICERCA E POI SCELGO IL DATA SET DA ANALIZZARE
25 Es. Banca Marketing strategico Ciclo vitale Next Product Segmentazione comportamentale Rischio di abbandono Sensitività del valore del portafoglio clienti
26 ANALISI DEL CICLO VITALE ETA STATO CIVILE PRODOTTI LAV SESSO
27 Es. Relazione tra classe di età e possesso di cassette 0.03 di sicurezza Cassette di sicurezza p-value= e < >78
28 Es. Relazione tra stato civile e possesso di cassette di sicurezza 0.14 Cassette di sicurezza p-value= e STATO CIVILE 21: CONIUGATO IN SEPARAZIONE LEGALE
29 Output del modello di ciclo vitale Una spezzata che riporta la probabilità stimata di possedere un macroprodotto al variare dell età per ogni combinazione di SESSO STATO CIVILE PROFESSIONE
30 Prob. di possesso: «Assicurazione danni» Maschio, Separato, Dirigente < >78
31 UTILIZZI DEL MODELLO Il modello segnala in automatico le combinazioni di classe età, professione e stato civile con la più elevata probabilità di possedere il prodotto. Es.M, divorziati, infermieri e medici, età anni Il modello segnala i clienti per cui il modello prevede il possesso del prodotto ma in realtà non è presente
32 NEXT PRODUCT (orizzonte di breve) STATO CIVILE ETA LAV SESSO? Var COGE PRODOTTI??
33 OBIETTIVO VARIABILE RISPOSTA Y=1 (sì ASS DANNI ultimi 6 mesi e lo posseggono attualmente) Y=0 (no ass DANNI attualmente) Quali sono i comportamenti finanziari che meglio separano i due gruppi? Quali sono le variabili più importanti (a priori consideriamo un set di variabili esplicative)
34 Riepilogo variabili potenziali sesso stato civile professione classe di età totale prodotti posseduti uso di Internet possesso di Internet Debiti a breve (ammontare) Debiti a lungo (ammontare) Raccolta diretta + Indiretta Impieghi Fondi (importo) Fondi (numero)num Certificati di deposito Depositi a risparmio cc saldo (Italia +Estero) azioni (ammontare) obbligazioni (ammontare)
35 SEGMENTAZIONE COMPORTAMENTALE (cluster analysis)
36 Operazione preliminare Individuazione dei valori anomali (outliers) Gr 2 Gr. 5 Gr. 6 Gr 1 Gr. 7 Gr. 8
37 Centroidi e matrici di covarianze: definiscono la posizione, l orientamento e l ampiezza dei diversi ellissoidi (gruppi)
38 Probabilità di appartenenza di un unità ai diversi gruppi (un unità non appartiene completamente ad un gruppo) Gr. 6 (0) Gr 2 (0.6) Gr. 5 (0) Gr 1 (0.3) Gr. 7 (0) Gr. 8 (0) Ciascun cliente è attribuito ad ogni segmento con una certa probabilità
39 TECNICHE DI ANALISI DEI DATI FORMAZIONE DI GRUPPI OMOGENEI Misure di dissimilarità e di similarità tra oggetti o individui per variabili quantitative, qualitative e miste (cap. VIII) Cluster analysis (cap. IX): metodi gerarchici e non gerarchici Segmentazione dei prodotti e dei consumatori
40 RISCHIO DI ABBANDONO
41 Rischio di abbandono: Analisi preliminari
42 Analisi preliminari
43 OBIETTIVO VARIABILE RISPOSTA Y=1 (sì clienti che hanno abbandonato negli ultimi 6 mesi) Y=0 (clienti che non hanno abbandonato) Quali sono i comportamenti finanziari che meglio separano i due gruppi? Quali sono le variabili più importanti (a priori consideriamo un set di variabili esplicative)
44 SENSITIVITA DEL PORTAFOGLIO CLIENTI
45 MACROPRODOTTO/I FISSATO/I Qual è la redditività aggiuntiva se i clienti con prob > soglia acquistano il prodotto?
46 redditività potenziale richiesta Quanti clienti devo contattare e quali prodotti devo vendere?
47 Numero di clienti di contattare fissato Qual è la redditività attesa?
48 CONCETTO DA RIBADIRE A PRIORI DEFINISCO LO SCOPO DELLA RICERCA E POI SCELGO IL DATA SET DA ANALIZZARE
49 SCHEMA FONDAMENTALE DELLA RICERCA SCIENTIFICA Problema (domanda) Raccolta di dati Analisi dei dati Conclusione provvisoria (risposta) Estensioni, generalizzazioni, nuovi problemi Il vero indicatore d intelligenza non è la conoscenza, ma l immaginazione (A. EINSTEIN)
50 Esempio di questionario INDAGINE SULL ATTEGGIAMENTO DEI GIOVANI NEI CONFRONTI DELLA MODA Sesso maschio 1 femmina 2 Età _ _ Quale scuola frequenti? Liceo classico 1 altra 4 liceo scientifico 2 ragioneria 3 Taglia Quanta importanza attribuisci al modo di vestire? nulla 1 scarsa 2 moltissima 5 media 3 molta 4 Come definiresti il tuo stile di vestire? sportivo 1 elegante-classico 2 casual A quanto ammonta la tua paghetta settimanale?
51 MATRICE DEI DATI: X riferita a n unità e p variabili: X = [ x is ] Visualizzazione delle informazioni e scoperta di eventuali valori anomali Studio delle relazioni tra variabili - Quantitative (correlazione) - Qualitative nominali e ordinali (ASSOCIAZIONE)
52 TECNICHE DI ANALISI DEI DATI TRATTAMENTI PRELIMINARI DEI DATI (cap. III) pulizia dei dati Dati mancanti (missing values) Valori anomali (outliers) VISUALIZZAZIONE DEI DATI (cap. V) RIDUZIONE DELLE DIMENSIONI (cap. VI e VII) Analisi delle componenti principali e Analisi delle corrispondenze
53 TECNICHE DI ANALISI DEI DATI FORMAZIONE DI GRUPPI OMOGENEI Misure di dissimilarità e di similarità tra oggetti o individui per variabili quantitative, qualitative e miste (cap. VIII) Cluster analysis (cap. IX): metodi gerarchici e non gerarchici Segmentazione dei prodotti e dei consumatori
54 Esercizio Aprire il file HOME_THEATRE_ini.sav. Assegnare alle variabili il corretto formato Osservazione: tutti i file di input e di output per ogni esercizio sono scaricabili dalla pagina
55 SPSS Costruzione della matrice dei dati Visualizzazione variabili: Nome, tipo, etichetta, valori Visualizzazione dati Inserimento valori, modalità o codici
56 Obiettivo Confrontare unità statistiche in presenza di fenomeni con diverso ordine di grandezza e diversa scala di misura File di input: HT.sav oppure htss.xls
57 SCOSTAMENTI STANDARDIZZATI MILIOLI, RIANI, ZANI, 2016, pp Definizione: z i = (x i M)/ σ ove M è la media e σ (a volte indicato con s) è la deviazione standard (in SPSS calcolata come s.q.m. CORRETTO) Proprietà: 1. M = O 2. σ = 1 3. puri numeri (confrontabili) MATRICE DEGLI SCOST. STAND. : Z
58 Traccia di soluzione in SPSS
59 Calcolo delle statistiche descrittive Esercizio: calcolare le statistiche descrittive (media, min, max, standard deviation, varianza, asimmetria e curtosi) per le 3 variabili quantitative presenti nel file ht_sd.xls oppure HT.sav. Eseguire i calcoli in Excel e SPSS. In Excel controllare le formule della varianza dell asimmetria e della curtosi tramite l implementazione manuale
60 Formule da utilizzare per gli indici di asimmetria e curtosi Indice di curtosi Indice di asimmetria
61 Traccia di soluzione in SPSS
62 Traccia di soluzione in Excel Dopo aver installato (attivato) il componente aggiuntivo Analisi dei dati
63 Traccia di soluzione in Excel
64 Traccia di soluzione in Excel
65 Output
66 Ponderazione delle unità Unità statistiche: con la stessa importanza con importanza diversa: ponderazione Vettore dei pesi (relativi): w = [w 1,, w i,, w n ] Esempio dei settori dell industria (p. 23 e seg.)
67 Esercizio Aprire il file Ind_ec.xlsx (indicatori economici) oppure Ind_ec.sav. Escludere dall analisi il settore delle raffinerie Calcolare medie e deviazioni standard pesate per le variabili VA/FATT, COSTO DEL LAVORO PER DIPENDENTE, RETRIBUTIONE LORDA PER DIPENDENTE, INVESTIMENTI PER ADDETTO. Utilizzare come variabile peso il numero di addetti
68 Media semplice e media ponderata Caso particolare: w i = 1/n media aritmetica semplice Confronto con media ponderata in distribuzione di frequenze
69 Scostamento quadratico medio ponderato (eq p. 148)
70 Traccia di soluzione in SPSS Dati Seleziona casi
71 Traccia di soluzione in SPSS Dati Pesa casi
72 Traccia di soluzione in SPSS Analizza Statistiche_descrittive Descrittive
73 Output
74 Distribuzioni di frequenza con classi equispaziate e non Tabelle a doppia entrata File di partenza: ex23_de.xls (ex23.sav)
75 Creazione di classi da variabili quantitative SPSS: Trasforma Categorizzazione visuale (Raccolta visuale) EXCEL: se le classi sono equispaziate si può utilizzare la tabella pivot, altrimenti bisogna utilizzare la funzione frequenza oppure preliminarmente la funzione CERCA.VERT e creare la tabella pivot sulla variabile categorizzata
76 Esercizio Aprire il file ex23.xls (ex23.sav) Creare la distribuzione di frequenze della variabile reddito utilizzando prima classi equispaziate e poi le classi che seguono
77 Traccia di soluzione tramite SPSS Partendo dal file ex23 creare la tabella a doppia entrata che segue
78 Creazione delle classi della variabile retribuzione in SPSS (trasforma raccolta visuale)
79
80 Output
81 Creazione della tabella a doppia entrata
82 Output
83 MATRICE PARTIZIONATA Partizione: suddivisione d un insieme in gruppi disgiunti Partizione delle n unità della matrice dei dati: analisi distinta per ciascun gruppo di unità ed analisi complessiva. Esempio: clienti con e senza carta fedeltà
84 SPSS PER MATRICE PARTIZIONATA Comandi: DATI DISTINGUI CONFRONTA Unica tabella suddivisa DATI DISTINGUI DISTINGUI Una tabella per ogni gruppo
85 Esercizio Aprire il file HT.sav oppure htgruppi.xlsx. Calcolare media e standard deviation delle variabili Prezzo e Potenza distinte per la presenza o assenza di RDS.
86 Traccia di soluzione tramite SPSS
87 Traccia di soluzione tramite SPSS
88 Output di SPSS
89 Traccia di soluzione tramite EXCEL Ci sono tre possibilità Utilizzo del menu Dati Subtotali Filtri + funzione subtotale Tabelle pivot
90 ESTRAZIONE DI UN CAMPIONE CASUALE File di input: SondUSA.xls oppure SondUSA.sav
91 ESTRAZIONE DI UN CAMPIONE CASUALE (EXCEL) Funzione casuale.tra o generazione di numeri casuali uniformi dal componente aggiuntivo Analisi dei Dati Utilizzo della funzione INDICE per estrarre i dati
92 ESTRAZIONE DI UN CAMPIONE CASUALE (SPSS) Dati seleziona casi
93 MATRICE DEI DATI A TRE VIE X = [ x ist ] di dimensioni n x p x q n unità statistiche p variabili q tempi
94 ESEMPI Panel di consumatori: Campione costituito dai medesimi individui (famiglie) interrogati più volte in tempi successivi (6.000 famiglie) Misura dell audience televisiva:
95 AUDITEL Dal 1986, Auditel rileva, 24 ore su 24, minuto per minuto, tutta la TV, nazionale e locale, vista attraverso diverse fonti: terrestre, satellitare, analogica e digitale. Perché Auditel? Perché la misurazione degli ascolti è un elemento fondamentale per la pianificazione degli spazi pubblicitari, risorse di cui la TV vive. Perché è necessario un organismo super partes che operi con trasparenza e affidabilità. AUDIWEB
96 ANALISI DI MATRICI A TRE VIE Analisi distinte per ogni tempo: si ripete q volte lo studio consueto della matrice dei dati n x p. Analisi dinamiche: si studia l evoluzione nel tempo di ogni unità con riferimento alle p variabili, oppure l evoluzione temporale dei valori di ogni singola variabile con riferimento alle n unità
ANALISI DEI DATI PER IL MARKETING 2016
ANALISI DEI DATI PER IL MARKETING 2016 Marco Riani mriani@unipr.it http://www.riani.it INFORMAZIONI SUL CORSO Orario MER 9.00-11.00 (frontale) MER 14.00-16.00 (frontale) VEN 9.00-11.00 (laboratorio) Ricevimento
DettagliSTATISTICA PER LA DIGITAL ECONOMY 2017
STATISTICA PER LA DIGITAL ECONOMY 2017 Marco Riani mriani@unipr.it http://www.riani.it INFORMAZIONI SUL CORSO Orario MER 11.00-13.00 (frontale) GIO 9.00-11.00 (frontale) VEN 11.00-13.00 (laboratorio) Ricevimento
DettagliANALISI DEI DATI PER IL MARKETING 2014
ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it INFORMAZIONI SUL CORSO Orario MER 9.00-11.00 GIO 9.00-11.00 VEN 9.00-11.00 Ricevimento MER 11.00-13.00 GIO 11.00-13.00
DettagliSTATISTICA PER LA DIGITAL ECONOMY Marco Riani
STATISTICA PER LA DIGITAL ECONOMY 2018 Marco Riani mriani@unipr.it http://www.riani.it INFORMAZIONI SUL CORSO Orario MER 11.15-12.45 (frontale) GIO 9.15-10.45 (frontale) VEN 11.00-13.00 (laboratorio) Ricevimento
DettagliStatistica per l Impresa
Statistica per l Impresa a.a. 2017/2018 Tecniche di Analisi Multidimensionale Analisi dei Gruppi 23 aprile 2018 Indice 1. Analisi dei Gruppi: Introduzione 2. Misure di distanza e indici di similarità 3.
DettagliANALISI DEI DATI PER IL MARKETING 2014
ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it ANALISI DELLE CORRISPONDENZE (cap. VII) Problema della riduzione delle dimensioni L ANALISI DELLE COMPONENTI PRINCIPALI
DettagliStesso valore medio per distribuzioni diverse
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2018-2019 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliANALISI DEI DATI PER IL MARKETING 2017
ANALISI DEI DATI PER IL MARKETING 2017 Marco Riani mriani@unipr.it http://www.riani.it TRATTAMENTI PRELIMINARI DEI DATI Pulizia dei dati (data cleaning) = processo capace di garantire, con una certa soglia
DettagliSDE Marco Riani
SDE 018 Marco Riani mriani@uniprit http://wwwrianiit ANALISI DELLE CORRISPONDENZE Problema della riduzione delle dimensioni L ANALISI DELLE COMPONENTI PRINCIPALI per una matrice di dati quantitativi L
DettagliIndice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75
00PrPag:I-XIV_prefazione_IAS 8-05-2008 17:56 Pagina V Prefazione XI 1 La rilevazione dei fenomeni statistici 1 1.1 Introduzione 1 1.2 Caratteri, unità statistiche e collettivo 1 1.3 Classificazione dei
DettagliCOGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING novembre 2008.
COGNOME E NOME MATR. ANALISI DEI DATI PER IL MARKETING novembre 2008. ESERCIZIO I Si è applicata l analisi delle componenti principali a 97 modelli di fotocamere digitali, considerando 7 variabili ed ottenendo
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 015-016 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per la
DettagliCOGNOME.NOME...MATR..
STATISTICA 29.01.15 - PROVA GENERALE (CHALLENGE) Modalità A (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità
DettagliLa statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci
La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni
DettagliData set relativo a 40 titolari di esercizi commerciali. Durata del percorso casa lavoro (in minuti) Numero dipendenti che lavorano nel negozio
ESERCITAZIONE 1: VARIABILI E DISTRIBUZIONI 1.TIPOLOGIA DEI DATI 2. CALCOLO DI FREQUENZE 3. RAPPRESENTAZIONE GRAFICA DI UNA VARIABILE A Roma nel 2006 è stata effettuata un indagine, tramite questionario,
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliSTATISTICA 1 ESERCITAZIONE 6
STATISTICA 1 ESERCITAZIONE 6 Dott. Giuseppe Pandolfo 5 Novembre 013 CONCENTRAZIONE Osservando l ammontare di un carattere quantitativo trasferibile su un collettivo statistico può essere interessante sapere
DettagliCompiti tematici dai capitoli 2,3,4
Compiti tematici dai capitoli 2,3,4 a cura di Giovanni M. Marchetti 2016 ver. 0.8 1. In un indagine recente, i rispondenti sono stati classificati rispetto al sesso, lo stato civile e l area geografica
DettagliANALISI DEI DATI PER IL MARKETING Marco Riani
ANALISI DEI DATI PER IL MARKETING 2018 Marco Riani mriani@unipr.it http://www.riani.it TRATTAMENTI PRELIMINARI DEI DATI Pulizia dei dati (data cleaning) = processo capace di garantire, con una certa soglia
DettagliPrefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura
INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI
DettagliIndice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza
XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliSDE Marco Riani
SDE 2017 Marco Riani mriani@unipr.it http://www.riani.it LA CLASSIFICAZIONE Problema generale della scienza (Linneo, ) Analisi discriminante Cluster Analysis (analisi dei gruppi) ANALISI DISCRIMINANTE
DettagliStatistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)
Statistica La statistica può essere vista come la scienza che organizza ed analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva:
DettagliStatistica. Matematica con Elementi di Statistica a.a. 2017/18
Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati
DettagliStatistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)
Statistica La statistica può essere vista come la scienza che organizza ed analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva:
DettagliDipartimento di Fisica a.a. 2003/2004 Fisica Medica 2 Indici statistici 22/4/2005
Dipartimento di Fisica a.a. 23/24 Fisica Medica 2 Indici statistici 22/4/25 Ricerca statistica La ricerca può essere deduttiva (data una legge teorica nota cerco verifica tramite più misure) ovvero induttiva
DettagliSTATISTICA A K (63 ore)
STATISTICA A K (63 ore) Marco Riani mriani@unipr.it http://www.riani.it Es. Distribuzione di frequenze della spesa effettuata in una settimana dai titolari della carta fedeltà di un supermercato CLASSI
DettagliProva finale del 6 giugno 2011
Prova finale del 6 giugno 2011 Esercizio A, da svolgere con carta e penna Si consideri la seguente matrice dei dati relativa a 3 unità statistiche e 3 variabili, X 1 e X 2 quantitative, X 3 dicotomica.
DettagliAnalisi Multivariata Prova finale del 3 giugno 2010
Analisi Multivariata Prova finale del 3 giugno 2010 Esercizi da svolgere con carta e penna Esercizio A A1 Descrivere brevemente qual è l obiettivo principale dell analisi fattoriale. A2 Scrivere il modello
DettagliDistribuzione di Frequenza: Esempio
Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati
DettagliIstituzioni di Statistica
Istituzioni di Statistica CORSO DI LAUREA IN ECONOMIA DEL COMMERCIO INTERNAZIONALE CORSO DI LAUREA IN ECONOMIA E AMMINISTRAZIONE DELLE IMPRESE A.A. 2007/2008 DOCENTE: Marco Minozzo PROGRAMMA - STATISTICA
DettagliLa statistica. Scienza che studia con metodi matematici fenomeni collettivi.
La statistica Scienza che studia con metodi matematici fenomeni collettivi. I dati statistici Popolazione, carattere e frequenza Popolazione: insieme di elementi su cui si effettua l indagine statistica.
DettagliCorso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano
Corso di STATISTICA EGA - Classe 1 aa 2017-2018 Docenti: Luca Frigau, Claudio Conversano Il corso è organizzato in 36 incontri, per un totale di 72 ore di lezione. Sono previste 18 ore di esercitazione
DettagliNota dell editore Presentazione
Autori Nota dell editore Presentazione XI XIII XV 1 Conoscenze preliminari per l osservazione biostatistica 1 Variabilità biologica e implicazioni statistiche 1 Variabili e costanti 2 Concetto di misura
DettagliANALISI DEI DATI PER IL MARKETING 2014
ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it MISURE DI DISTANZA E SIMILARITA 1 SCOPI DEL CALCOLO Problema: misurare la diversità (ovvero la rassomiglianza) tra
DettagliStatistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione
Statistica Esercitazione alessandro polli facoltà di scienze politiche, sociologia, comunicazione Obiettivo Esercizio 1. Questo e alcuni degli esercizi che proporremo nei prossimi giorni si basano sul
DettagliStatistica per le ricerche di mercato
Università degli studi della Tuscia Dipartimento di Economia e Impresa Statistica per le ricerche di mercato a.a. 2012/13 Dr. Luca Secondi 01. Introduzione al corso 1 Statistica per le ricerche di mercato
DettagliEsercizi. Esercizio 1. Date le funzioni f(x) = x 2 3x + 2 e g(x) = 2x 1,
Esercizi Esercizio 1. Date le funzioni f(x) = x 2 3x + 2 e g(x) = 2x 1, (a) dire quanto vale f g e qual è il suo insieme di definizione; (b) dire quanto vale g f e qual è il suo insieme di definizione;
DettagliStatistica. Matematica con Elementi di Statistica a.a. 2015/16
Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati
DettagliANALISI DEI DATI con EXCEL
ANALISI DEI DATI con EXCEL Distribuzione della frequenza per variabili qualitative 1) conteggio del numero delle osservazioni della variabile (funzione CONTA.VALORI) 2) definizione delle CATEGORIE (tramite
DettagliLa gestione dei risultati della valutazione. Claudio Mantovani
La gestione dei risultati della valutazione Claudio Mantovani L obiettivo di questo intervento Descrivere alcune tecniche di analisi di dati dalle più semplici alle più complesse Dare suggerimenti pratici
DettagliStatistica per l Impresa
Statistica per l Impresa a.a. 2017/2018 Tecniche di Analisi Multidimensionale Analisi dei Gruppi 9 maggio 2018 Indice Analisi dei Gruppi: Introduzione Misure di distanza e indici di similarità Metodi gerarchici
DettagliSTATISTICA (I MODULO - STATISTICA DESCRITTIVA) Esercitazione I 23/02/2007
Esercitazione I 23/02/2007 La seguente tabella contiene i dati inerenti le imprese di ristorazione di un dato comune: Unità X 1 X 2 X 3 X 4 X 5 X 6 Unità X 1 X 2 X 3 X 4 X 5 X 6 1 1600 20 4 52 3 3 26 141
DettagliProva scritta di Statistica
Prova scritta di Statistica 5 Febbraio 2016 1. Da un indagine riguardante l utilizzo del telefono cellulare si sono ottenuti i seguenti risultati: Età No.telefonini Chiamate Spesa sett. Bluetooth 20 2
DettagliStatistica per le ricerche di mercato
Università degli studi della Tuscia Dipartimento di Economia e Impresa Statistica per le ricerche di mercato a.a. 2014/15 Prof.ssa Tiziana Laureti 01. Introduzione al corso 1 Statistica per le ricerche
DettagliPROBABILITÀ ELEMENTARE
Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti
DettagliSommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25
Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità
DettagliEsercitazione 1.3. Indici di variabilità ed eterogeneità. Prof.ssa T. Laureti a.a
Corso di Statistica Esercitazione.3 Indici di variabilità ed eterogeneità Concentrazione Asimmetria Prof.ssa T. Laureti a.a. 202-203 Esercizio Si considerino i seguenti dati relativi al numero di addetti
DettagliSDE Marco Riani
SDE 2018 Marco Riani mriani@unipr.it http://www.riani.it MISURE DI DISTANZA E SIMILARITA SCOPI DEL CALCOLO Problema: misurare la diversità (ovvero la rassomiglianza) tra due unità statistiche di cui si
DettagliElementi di Statistica
Università degli Studi di Palermo Dipartimento di Ingegneria Informatica Informatica ed Elementi di Statistica 3 c.f.u. Anno Accademico 2010/2011 Docente: ing. Salvatore Sorce Elementi di Statistica Statistica
DettagliRappresentazioni Tabellari e Grafiche. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica
Rappresentazioni Tabellari e Grafiche Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Vocabolario Essenziale Unità Statistica Unità elementare
DettagliStatistica Aziendale Avanzata
PROGRAMMA del corso, informazioni e fonti bibliografiche Statistica Aziendale Avanzata Modulo A / Modulo B Organizzazione del corso Anno Accademico 2016/17 Codice 91019 Docente responsabile prof.ssa Silvia
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Esercizio Il contenuto di nicotina di una certa marca di sigarette è 0,25 milligrammi con una deviazione standard di 0,015. Un associazione
DettagliCluster Analysis Distanze ed estrazioni Marco Perugini Milano-Bicocca
Cluster Analysis Distanze ed estrazioni M Q Marco Perugini Milano-Bicocca 1 Scopi Lo scopo dell analisi dei Clusters è di raggruppare casi od oggetti sulla base delle loro similarità in una serie di caratteristiche
DettagliAnalisi delle corrispondenze
Capitolo 11 Analisi delle corrispondenze L obiettivo dell analisi delle corrispondenze, i cui primi sviluppi risalgono alla metà degli anni 60 in Francia ad opera di JP Benzécri e la sua equipe, è quello
DettagliProf. Stefano Nobile
Procedure e strumenti di costruzione della base empirica: progettazione, costruzione e gestione di Corso di Metodologia della ricerca sociale Cosa decidere prima di progettare il questionario e la matrice
DettagliStatistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi
ISTITUZIONI DI STATISTICA A A 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona
DettagliIl volume: A. Cerioli M.A. Milioli M. Riani Esercizi di statistica parte I, Uni.nova, Parma, 2006
Il volume: A. Cerioli M.A. Milioli M. Riani Esercizi di statistica parte I, Uni.nova, Parma, 2006 contiene una raccolta di temi d esame di statistica descrittiva, adeguati per la preparazione dell esame
DettagliPedagogia sperimentale
Pedagogia sperimentale Prof. Giovanni Arduini LEZION E N. 7 A.A. 2015/ 1 6 Solo a partire dalla fine del XVII secolo (Inghilterra) e nel XVIII (Francia), si può iniziare a parlare di Statistica. La Statistica
DettagliTeoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
DettagliStatistica Descrittiva Soluzioni 4. Medie lasche
ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona
DettagliStatistica Aziendale Avanzata
PROGRAMMA del corso, informazioni e fonti bibliografiche Statistica Aziendale Avanzata Modulo A / Modulo B Organizzazione del corso Anno Accademico 2017/18 Codice 91019 Docente responsabile prof.ssa Silvia
DettagliProf. Stefano Nobile
Procedure e strumenti di costruzione della base empirica: progettazione, costruzione e gestione di una matrice di dati Prof. Stefano Nobile Corso di Metodologia della ricerca sociale Cosa decidere prima
DettagliINTRODUZIONE ALLA STATISTICA
1 / 31 INTRODUZIONE ALLA STATISTICA A.A.2017/2018 Perchè studiare la statistica 2 / 31 Le decisioni quotidiane sono spesso basate su informazioni incomplete. Perchè studiare la statistica Le decisioni
DettagliAnalisi delle corrispondenze
Analisi delle corrispondenze Obiettivo: analisi delle relazioni tra le modalità di due (o più) caratteri qualitativi Individuazione della struttura dell associazione interna a una tabella di contingenza
DettagliESERCIZI DI STATISTICA SOCIALE
ESERCIZI DI STATISTICA SOCIALE FREQUENZA ASSOLUTA Data una distribuzione semplice di dati, ovvero una serie di microdati, si chiama frequenza assoluta di ogni modalità del carattere studiato il numero
DettagliCapitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari"
Levine, Krehbiel, Berenson Statistica Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari" Unità Integrata Organizzativa
Dettagli3. rappresentare mediante i grafici ritenuti più idonei le distribuzioni di frequenze assolute dei diversi caratteri;
Esercizio 1 Il corso di Statistica è frequentato da 10 studenti che presentano le seguenti caratteristiche Studente Sesso Colore Occhi Voto Soddisfazione Età Stefano M Nero 18 Per niente 21 Francesca F
DettagliAnalisi dei dati per la comunicazione
Analisi dei dati per la comunicazione La costruzione e l uso di misure relative semplici e complesse Prof.ssa Isabella Mingo A.A. 2014-2015 La costruzione di indici complessi: fasi In definitiva, la costruzione
DettagliRisultato di una rilevazione statistica effettuata su n unità statistiche con riferimento a p fenomeni (detti anche caratteri, variabili)
LA MATRICE DEI DATI Risultato di una rilevazione statistica effettuata su n unità statistiche con riferimento a p fenomeni (detti anche caratteri, variabili) Esempi di: unità variabili individui Reddito,
DettagliLa Statistica: introduzione e approfondimenti
La Statistica: introduzione e approfondimenti Definizione di statistica Che cosa è la statistica? La statistica è una disciplina scientifica che trae i suoi risultati dalla raccolta, dall elaborazione
DettagliStatistica. Esercitazione 3 9 maggio 2012 Coefficiente di variazione. Serie storiche. Connessione e indipendenza statistica
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 20/202 Statistica Esercitazione 3 9 maggio 202 Coefficiente di variazione. Serie storiche.
DettagliMatematica Lezione 22
Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,
DettagliSTATISTICA (I modulo - Statistica Descrittiva) Esercitazione I 24/02/2006
STATISTICA (I modulo - Statistica Descrittiva) Esercitazione I 24/02/2006 La seguente tabella contiene i dati inerenti le unità del settore della ristorazione in un dato comune: Unità X 1 X 2 X 3 X 4 X
DettagliStatistica Elementare
Statistica Elementare 1. Frequenza assoluta Per popolazione si intende l insieme degli elementi che sono oggetto di una indagine statistica, ovvero l insieme delle unità, dette unità statistiche o individui
DettagliI Componenti del processo decisionale 7
Indice Introduzione 1 I Componenti del processo decisionale 7 1 Business intelligence 9 1.1 Decisioni efficaci e tempestive........ 9 1.2 Dati, informazioni e conoscenza....... 12 1.3 Ruolo dei modelli
DettagliPROCEDURA MAPPATURA SINISTRI
Pagina 1 di 14 PROCEDURA MAPPATURA SINISTRI Revisione Prima emissione Data. Descrizione delle modifiche Redazione Verifica Approvazione PR 2- v 0 17-09-14 Pagina 2 di 14 1. Campo di applicazione La presente
DettagliESERCITAZIONI N. 2 corso di statistica
ESERCITAZIONI N. 2corso di statistica p. 1/23 ESERCITAZIONI N. 2 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONI N. 2corso di statistica p. 2/23 Introduzione Tabelle di contingenza Dipendenza
DettagliDESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.
Corso di Laurea Specialistica in Biologia Sanitaria, Universita' di Padova C.I. di Metodi statistici per la Biologia, Informatica e Laboratorio di Informatica (Mod. B) Docente: Dr. Stefania Bortoluzzi
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliStatistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1
Statistica Capitolo 1 Verifica di Ipotesi su una Singola Popolazione Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Formulare ipotesi nulla ed ipotesi alternativa
DettagliProva scritta del modulo di Statistica I (6 CFU) Cognome Nome Matr. Firma
Prova scritta del modulo di Statistica I (6 CFU) 29.01.10 Cognome Nome Matr. Firma Indicare il Corso di Laurea d appartenenza ECOCOM (A-Lh) ECOAMM (A-Lh) ECOMARK (A-Lh) ECOBAN ECOSTI ECOCOM (Li-Z) ECOAMM
DettagliCorso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica. a.a. 2015/2016
Corso di Laurea in Economia Aziendale Docente: Marta Nai Ruscone Statistica a.a. 2015/2016 1 Indici di posizione GLI INDICI DI POSIZIONE sono indici sintetici che evidenziano le caratteristiche essenziali
Dettaglile scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:
DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it si basano su tre elementi: le scale di misura sistema empirico: un insieme di entità non numeriche (es. insieme di persone; insieme
DettagliSDE Marco Riani
SDE 2018 Marco Riani mriani@unipr.it http://www.riani.it RAPPRESENTAZIONI GRAFICHE Nella comunicazione una figura vale più di cento numeri e di mille parole! SCOPI DELLE RAPPRESENTAZIONI GRAFICHE NELLE
DettagliStatistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza
DettagliDistribuzioni e rappresentazioni grafiche
Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Outline 1 Distribuzioni unitarie e di frequenza 2 3 4 5 Outline 1 Distribuzioni unitarie e di frequenza 2 3 4 5 Distribuzione unitaria [1/2] Data
DettagliStatistica Aziendale Avanzata
PROGRAMMA del corso, informazioni e fonti bibliografiche Statistica Aziendale Avanzata Modulo A / Modulo B Organizzazione del corso Anno Accademico 2015/16 Codice 91019 Docente responsabile prof.ssa Silvia
DettagliESAME. 9 Gennaio 2017 COMPITO B
ESAME 9 Gennaio 2017 COMPITO B Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto
DettagliCOGNOME.NOME...MATR..
STATISTICA 29.01.15 - PROVA GENERALE (STANDARD) Modalità B (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità
DettagliMatematica per psicologi
Matematica per psicologi Docente: prof. Gabriella Caristi, E-mail: caristi@units.it http://www.dsm.univ.trieste.it/~caristi Tel.: 040 558 2605 Testo: Statistical methods for the social sciences, A. Agresti-B.
DettagliLivello di misura Scala Nominale Scala Ordinale Scala di Rapporti. Scala Nominale
Esercitazione Supponiamo che il collettivo che si vuole studiare sia composto da un gruppo di turisti. La seguente tabella raccoglie l osservazione di alcuni caratteri di interesse. Costo Soggetto Titolo
DettagliSTATISTICA PER LA DIGITAL ECONOMY Marco Riani
STATISTICA PER LA DIGITAL ECONOMY 2018 Marco Riani mriani@unipr.it http://www.riani.it Ponderazione delle unità Unità statistiche: con la stessa importanza con importanza diversa: ponderazione Vettore
DettagliAnalisi bivariata. Il caso di caratteri qualitativi
Analisi bivariata Il caso di caratteri qualitativi Pagina 337 Che cosa è l analisi bivariata? E lo studio congiunto di due caratteri Esempio nel caso di caratteri qualitativi: I valori delle celle derivano
DettagliDispense Associazione PRELIMINARY DRAFT
Dispense Associazione PRELIMINARY DRAFT Cristina Mollica & Jan Martin Rossi January 3, 2019 1 Esercizio 3 - Prova scritta 12-01-2018 Esercizio 3. Si consideri la distribuzione doppia di un campione di
DettagliESERCIZI STATISTICA DESCRITTIVA
ESERCIZI STATISTICA DESCRITTIVA Frequenze assolute e relative Titolo di studio Frequenze assolute Frequenze relative Proporzioni Percentuali Senza titolo 30 0,025 2,5 Lic. elementare 509 0,424 42,4 Licenza
Dettagli