ANALISI DEI DATI PER IL MARKETING 2014
|
|
- Giacinto Tortora
- 8 anni fa
- Visualizzazioni
Transcript
1 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani TRATTAMENTI PRELIMINARI DEI DATI Pulizia dei dati (data cleaning) = processo capace di garantire, con una certa soglia di affidabilità, la correttezza d un insieme di dati (dataset, database, data warehouse). 1
2 QUALITA DEI DATI definita con riguardo alle seguenti caratteristiche: rilevanza, cioè la capacità di soddisfare le reali esigenze conoscitive degli utilizzatori; accuratezza, cioè la corrispondenza tra le stime ottenute ed i valori veri (ma ignoti) nella popolazione di riferimento; tempestività, cioè la capacità di fornire i risultati in tempi ravvicinati rispetto all esecuzione dell indagine; accessibilità, cioè la possibilità per l utente di reperire facilmente e comprendere l informazione richiesta; confrontabilità, che fa riferimento alla validità dei raffronti dei dati nel tempo o nello spazio. PROBLEMI NEL DATA CLEANING Le unità statistiche non rilevate (casi mancanti); i valori mancanti di singole variabili; la tipologia degli errori; i valori anomali e le osservazioni influenti. 2
3 CASI MANCANTI Se le unità statistiche campionarie effettivamente rilevate sono in numero di m, invece delle n originariamente previste (m<n), si può procedere in due modi: i) si considera la matrice dei dati formata dalle m unità disponibili; ii) si rilevano (n-m) unità ulteriori, sostituendo ciascuna unità mancante con un altra. DISTORSIONI, AUTOSELEZIONE MISSING VALUES Matrice dei dati formata da n righe, ma con vuoti (blank) in alcune caselle. i) Carattere non pertinente per la singola unità ii) Risposta non so in una domanda riguardante un opinione iii) Rifiuto di singole risposte iv) Mancata rilevazione dovuta a cause esterne 3
4 PROCESSO GENERATORE DEI MISSING VALUES X con tutti i dati, Y con dati mancanti i)missing Completely at Random (MCAR) La probabilità di riscontrare un valore mancante è indipendente dai valori di X ediy, per cui i dati omessi sono completamente casuali. ii) Missing at Random (MAR) I valori mancanti dipendono da X ma non da Y; se s individuano opportune classi o categorie di X la probabilità d un dato mancante di Y non è uguale per tutte le classi (o categorie), ma nell ambito di ciascuna di esse i valori mancanti sono casuali. iii) Missing not at Random La probabilità di riscontrare un dato mancante dipende dai valori che assume Y ed eventualmente anche da quelli di X. STRATEGIE POSSIBILI Analisi solo dei casi completi (esclusione listwise), Analisi dei casi disponibili per ciascun fenomeno (criterio columnwise) o per ciascuna coppia di variabili (criterio pairwise) Altri criteri: ponderazione, imputazione 4
5 File di esempio TAGLIAT40.SAV Effettuare un analisi dei dati mancanti e dei valori estremi univariati (ossia esterni all intervallo [Q1-1.5*IQR Q3+1.5*IQR]) Calcolare medie e deviazioni standard con tutti i dati e solo i dati mancanti (esclusione listwise e pairwise) Traccia di soluzione in SPSS 5
6 Traccia di soluzione in SPSS Traccia di soluzione in SPSS 6
7 Traccia di soluzione in SPSS Es. l unità 15 è mancante per la variabile «rotte» ed è un valore estremo univariato superiore per la variabile «umidit» Es. se si esclude la variabile ceneri il numero di casi completi è 30. Se si considerano tutte e tre le variabili le unità con tutti i valori sono 23 (esclusione listwise) 7
8 Per ottenere le statistiche descrittive con criterio listwise e a coppie selezionare le relative caselle di controllo (v. schermata di seguito) Output 8
9 File di esempio NAVIG(GPS).SAV Effettuare un analisi dei dati mancanti e dei valori estremi univariati (ossia esterni all intervallo [Q1-1.5*IQR Q3+1.5*IQR]) Calcolare medie e deviazioni standard con tutti i dati e solo i dati mancanti (esclusione listwise e pairwise) PROCEDURA IN SPSS 100 navigatori (GPS) 9
10 Numerosità escludendo una o più variabili CRITERIO LISTWISE 10
11 Suggerimenti per la scelta della STRATEGIA Poche unità con dati mancanti (<5%): LISTWISE Variabile con molti dati mancanti: SI ELIMINA Unità con molti valori mancanti: SI ELIMINA COMPITO FEBBRAIO 2008-II, N. 3 Si è effettuata un indagine campionaria su quattrocento individui, mediante un questionario che prevedeva 10 domande con risposte quantitative. Per sei di queste variabili si sono ottenute risposte complete, mentre le restanti quattro presentano rispettivamente 3, 5, 12 e 316 dati mancanti. Volendo effettuare analisi bivariate e analisi multivariate di questo data set: quali strategie può ragionevolmente adottare il ricercatore per il trattamento dei missing values? Quali conseguenze comporta ciascuna delle scelte effettuate? 11
12 RISOLUZIONE Si deve osservare in primo luogo che la decima domanda presenta ben 316 dati mancanti su un totale di 400 individui partecipanti all indagine. Ai fini delle analisi multivariate, la decisione più ragionevole è dunque quella di eliminarla, effettuando le elaborazioni sul data set costituito dalla restanti 9 variabili (vedi il testo: ZANI CERIOLI, 2007, p. 77, n. 2). La matrice dei dati di dimensioni può ora essere trattata con il criterio pairwise o con il criterio listwise. Quest ultimo è preferibile poiché i dati mancanti nelle variabili considerate sono pochi TIPI DI ERRORI Errori campionari Errori non campionari Errore totale La stima delle componenti dell errore totale attribuibili ad ogni singola fonte di errore è denominata profilo dell errore e rende possibile l attività di convalida (validation) dell informazione ottenuta. 12
13 ERRORI DI MISURA (parte dell errore non campionario) Costituiti dalla differenza tra il valore vero (ma ignoto!) del fenomeno in un certa unità statistica ed il valore rilevato dall indagine: valori inammissibili o dati fuori dominio; valori anomali (outliers); errori non facilmente individuabili, in quanto non corrispondono a valori inammissibili o anomali. VALORI ANOMALI Definizione. Un valore anomalo è un osservazione che, essendo atipica o erronea, si scosta decisamente dal comportamento degli altri dati, con riferimento al tipo di analisi considerata. 13
14 RICHIAMI SUL BOXPLOT Boxplot di 16 punti 14
15 Boxplot di 16 punti Il punto di troncamento superiore è in corrispondenza del valore più grande x 75% +1.5DI Il punto di troncamento inferiore si colloca in corrispondenza del valore più piccolo x 25% -1.5DI Boxplot dei 20 valori della tabella 4.2 libro STAT (p. 159) 15
16 Tasso di disoccupazione Tasso di attività 16
17 Boxplots in Excel Aprire il file HT_box.xls. Utilizzando il componente aggiuntivo boxplot.xla costuire il boxplot per le variabili prezzo e potenza. Aggiungere le etichette alle unità che risultano anomale INDIVIDUAZIONE DEGLI OUTLIERS UNIVARIATI Una variabile: boxplot Esempio: home theatre, prezzo e potenza 17
18 Esercizio Nel file ex23.sav analizzare tramite boxplot come varia la distribuzione della retribuzione al variare del titolo di studio (identificare i valori anomali) Separare la precedente analisi per maschi e femmine 18
19 Esercizio Nel file ex23.sav analizzare tramite boxplot come varia la distribuzione della retribuzione al variare del titolo di studio, inserendo come variabile di gruppo lo stato civile 19
20 Soluzione Boxplot in SPSS: riepilogo opzioni Vai al caso Etichetta ID punti Modalità etichette valori Variabile riquadro righe/colonne Variabile di gruppo su X 20
21 INDIVIDUAZIONE DEGLI OUTLIERS BIVARIATI Diagramma di dispersione OUTLIERS BIVARIATI 21
22 TIPI DI OUTLIERS (p. 81) TRATTAMENTO DEGLI OUTLIERS Se esso è dovuto ad un errore di rilevazione non correggibile: eliminazione (trattandolo come un dato mancante). Se è attribuibile ad una distribuzione differente: esclusione listwise della corrispondente unità statistica. Se è dovuto alla variabilità intrinseca del fenomeno: conservarlo (eventualmente trasformazione della corrispondente variabile, ad esempio logaritmica). 22
23 OUTLIERS PER VARIABILI ORDINALI E NOMINALI OSSERVAZIONI INFLUENTI Il vettore dei dati di un unità statistica è una osservazione influente se incide in misura molto rilevante sul valore numerico d un certo indice statistico oppure sui parametri o sull adattamento d uno specifico modello. Omission approach: calcolo delle variazioni dell indice o dei parametri del modello eliminando una singola unità fra le n considerate. 23
24 r xy = 0.6, senza outlier r xy = 0 (p. 85) r xy = 0.6, senza outlier r xy = 0.98 (p. 85) 24
25 Teorema (di Sastry and Nag, 1990). Considerando n coppie di dati (x i, y i ), i = 1, 2,, n, di due variabili X e Y, delle quali (n -1) assumono valori prefissati, risulta: lim r 2 xy = 1 per x 2 n + e y 2 n + Una sola osservazione molto più grande delle altre fa tendere ad 1 il coefficiente di correlazione! ESERCIZIO Si disegni un diagramma di dispersione riferito a 12 unità ed a due variabili X e Y con forte correlazione lineare inversa. Si inserisca in tale grafico un ulteriore unità, che risulta anomala per la variabile X, ma non per la variabile Y. Si dica quale effetto produce sul coefficiente di correlazione l inserimento della suddetta tredicesima unità 25
26 Esercizio Generare 50 osservazioni y in base al modello di regressione Generare i dati x in base alla distribuzione uniforme [0 1] e i disturbi epsilon in base alla distribuzione normale N(0, σ). Stimare i parametri a e b del modello di regressione. Esercizio (continua) Verificare empiricamente il teorema di Sastry and Nag, 1990, ossia aggiungere un osservazione molto distante dalla nuvola dei punti e vedere come cambia r 2 xy 26
ANALISI DEI DATI PER IL MARKETING 2017
ANALISI DEI DATI PER IL MARKETING 2017 Marco Riani mriani@unipr.it http://www.riani.it TRATTAMENTI PRELIMINARI DEI DATI Pulizia dei dati (data cleaning) = processo capace di garantire, con una certa soglia
DettagliANALISI DEI DATI PER IL MARKETING Marco Riani
ANALISI DEI DATI PER IL MARKETING 2018 Marco Riani mriani@unipr.it http://www.riani.it TRATTAMENTI PRELIMINARI DEI DATI Pulizia dei dati (data cleaning) = processo capace di garantire, con una certa soglia
DettagliRicerca di outlier. Ricerca di Anomalie/Outlier
Ricerca di outlier Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Ricerca di Anomalie/Outlier Cosa sono gli outlier? L insieme di dati che sono considerevolmente differenti dalla
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara
DettagliRegressione Mario Guarracino Data Mining a.a. 2010/2011
Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume
DettagliSTATISTICA IX lezione
Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri
DettagliCorso di laurea in Scienze Motorie. Corso di Statistica. Docente: Dott.ssa Immacolata Scancarello Lezione 2: Misurazione, tabelle
Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione : Misurazione, tabelle 1 Misurazione Definizione: La misura è l attribuzione di un valore numerico
DettagliPROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO
PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO L indagine si è svolta nel periodo dal 26 agosto al 16 settembre 2014 con l obiettivo di conoscere l opinione dei residenti
DettagliLABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE
Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) LABORATORIO EXCEL
Dettagli1. Distribuzioni campionarie
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie
DettagliVALORE DELLE MERCI SEQUESTRATE
La contraffazione in cifre: NUOVA METODOLOGIA PER LA STIMA DEL VALORE DELLE MERCI SEQUESTRATE Roma, Giugno 2013 Giugno 2013-1 Il valore economico dei sequestri In questo Focus si approfondiscono alcune
DettagliANALISI DEI DATI PER IL MARKETING 2014
ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it RAPPRESENTAZIONI GRAFICHE Nella comunicazione una figura vale più di cento numeri e di mille parole! 1 SCOPI DELLE
DettagliEPG Metodologia della ricerca e Tecniche Multivariate dei dati. Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it. www.psicometria.unich.
EPG Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it www.psicometria.unich.it GIORNI E ORARI LEZIONI Sabato 01-03-2014 h 08:00-12:00 Sabato
DettagliRAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL
RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL 1 RAPPRESENTAZIONE GRAFICA Per l analisi dati con Excel si fa riferimento alla versione 2007 di Office, le versioni successive non differiscono
DettagliDott.ssa Caterina Gurrieri
Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo
DettagliUniversità del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva
Università del Piemonte Orientale Corsi di Laurea Triennale Corso di Statistica e Biometria Introduzione e Statistica descrittiva Corsi di Laurea Triennale Corso di Statistica e Biometria: Introduzione
DettagliLABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE
LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE DESCRIZIONE DEI DATI DA ESAMINARE Sono stati raccolti i dati sul peso del polmone di topi normali e affetti da una patologia simile
DettagliLaboratorio di Pedagogia Sperimentale. Indice
INSEGNAMENTO DI LABORATORIO DI PEDAGOGIA SPERIMENTALE LEZIONE III INTRODUZIONE ALLA RICERCA SPERIMENTALE (PARTE III) PROF. VINCENZO BONAZZA Indice 1 L ipotesi -----------------------------------------------------------
DettagliIndice Statistiche Univariate Statistiche Bivariate
Indice 1 Statistiche Univariate 1 1.1 Importazione di un file.data.............................. 1 1.2 Medie e variabilità................................... 6 1.3 Distribuzioni di frequenze...............................
DettagliIl concetto di valore medio in generale
Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo
DettagliStatistica. Lezione 6
Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante
DettagliIl confronto fra proporzioni
L. Boni Il rapporto Un rapporto (ratio), attribuendo un ampio significato al termine, è il risultato della divisione di una certa quantità a per un altra quantità b Il rapporto Spesso, in maniera più specifica,
DettagliRelazioni statistiche: regressione e correlazione
Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica
DettagliExcel Terza parte. Excel 2003
Excel Terza parte Excel 2003 TABELLA PIVOT Selezioniamo tutti i dati (con le relative etichette) Dati Rapporto tabella pivot e grafico pivot Fine 2 La tabella pivot viene messa di default in una pagina
DettagliStatistica. Le rappresentazioni grafiche
Statistica Le rappresentazioni grafiche Introduzione Le rappresentazioni grafiche costituiscono uno dei mezzi più efficaci, sia per descrivere in forma visiva i risultati di numerose osservazioni riguardanti
DettagliStrumenti informatici 2.1 - Realizzare grafici e tabelle con Excel e SPSS
Strumenti informatici 2.1 - Realizzare grafici e tabelle con Excel e SPSS Realizzare un grafico con Excel è molto semplice, e permette tutta una serie di varianti. Il primo passo consiste nell organizzare
DettagliLa categoria «ES» presenta (di solito) gli stessi comandi
Utilizzo delle calcolatrici FX 991 ES+ Parte II PARMA, 11 Marzo 2014 Prof. Francesco Bologna bolfra@gmail.com ARGOMENTI DELLA LEZIONE 1. Richiami lezione precedente 2.Calcolo delle statistiche di regressione:
DettagliServizi di consulenza specialistica per IGRUE 2009 2012
Allegato 9A Metodo della stima delle differenze Descrizione della procedura Il metodo della stima delle differenze è indicato qualora il controllore ritenga che la popolazione sia affetta da un tasso di
DettagliAnalisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it
Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri
DettagliProcedura tecnico-statistica per il calcolo dell Indice di Disagio Socioeconomico (IDS)
Procedura tecnico-statistica per il calcolo dell Indice di Disagio Socioeconomico (IDS) Unità di Valutazione-DPS Ministero dello Sviluppo Economico Luglio 2008 Per garantire uniformità e completezza dei
DettagliElaborazione dei dati su PC Regressione Multipla
21 Elaborazione dei dati su PC Regressione Multipla Analizza Regressione Statistiche Grafici Metodo di selezione Analisi dei dati 21.1 Introduzione 21.2 Regressione lineare multipla con SPSS 21.3 Regressione
DettagliESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE
ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE e-mail: tommei@dm.unipi.it web: www.dm.unipi.it/ tommei Ricevimento: su appuntamento Dipartimento di Matematica, piano terra, studio 114
DettagliMetodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla
Il metodo della regressione può essere esteso dal caso in cui si considera la variabilità della risposta della y in relazione ad una sola variabile indipendente X ad una situazione più generale in cui
Dettagli3. Piano di lavoro: - applicazione di alcune semplici procedure, con il confronto tra le diverse soluzioni possibili nell ambito del programma SPSS
Per utilizzare SPSS sui PC dell aula informatica occorre accedere come: ID: SPSS Password: winidams Testo rapido di consultazione: Fideli R. Come analizzare i dati al computer. ed. Carocci, Urbino, 2002.
Dettaglietà sesso luogo-abitazione scuola superiore esperienza insegnamento 1 2 2 2 1 2 2 2 2 2 1 2 3 2 2 2 1 2 4 2 2 2 1 2 5 3 2 2 1 2 6 2 2 2 1 2 7 3 2 1 1
età sesso luogo-abitazione scuola superiore esperienza insegnamento 1 1 1 3 1 4 1 5 3 1 6 1 7 3 1 1 8 3 1 9 3 1 10 3 1 11 3 1 1 1 13 4 1 1 14 3 1 15 1 16 1 17 1 18 1 19 1 0 1 1 1 1 3 3 1 4 1 Come analizzare
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliGrafici delle distribuzioni di frequenza
Grafici delle distribuzioni di frequenza L osservazione del grafico può far notare irregolarità o comportamenti anomali non direttamente osservabili sui dati; ad esempio errori di misurazione 1) Diagramma
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1 Dott.ssa Antonella Costanzo a.costanzo@unicas.it A.Studio dell interdipendenza tra variabili: riepilogo Concetto relativo allo studio delle relazioni tra
DettagliProf.ssa Paola Vicard
Questa nota consiste perlopiù nella traduzione (con alcune integrazioni) da Descriptive statistics di J. Shalliker e C. Ricketts, 2000, University of Plymouth Consideriamo i dati nel file esercizio10_dati.xls.
DettagliUniversità del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica
Università del Piemonte Orientale Corsi di Laurea Triennale di area tecnica Corso di Statistica Medica Campionamento e distribuzione campionaria della media Corsi di laurea triennale di area tecnica -
DettagliCome archiviare i dati per le scienze sociali
Come archiviare i dati per le scienze sociali ADPSS-SOCIODATA Archivio Dati e Programmi per le Scienze Sociali www.sociologiadip.unimib.it/sociodata E-mail: adpss.sociologia@unimib.it Tel.: 02 64487513
DettagliVERIFICA DELLE IPOTESI
VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi
DettagliStima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una
DettagliRelazioni tra variabili
Università degli Studi di Padova Facoltà di Medicina e Chirurgia Corso di Laurea in Medicina e Chirurgia - A.A. 009-10 Scuole di specializzazione in: Medicina Legale, Medicina del Lavoro, Igiene e Medicina
DettagliProva di autovalutazione Prof. Roberta Siciliano
Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.
Dettagli5.3 TABELLE 5.3.1 RECORD 5.3.1.1 Inserire, eliminare record in una tabella Aggiungere record Eliminare record
5.3 TABELLE In un sistema di database relazionali le tabelle rappresentano la struttura di partenza, che resta poi fondamentale per tutte le fasi del lavoro di creazione e di gestione del database. 5.3.1
DettagliCapitolo 2 Distribuzioni di frequenza
Edizioni Simone - Vol. 43/1 Compendio di statistica Capitolo 2 Distribuzioni di frequenza Sommario 1. Distribuzioni semplici. - 2. Distribuzioni doppie. - 3. Distribuzioni parziali: condizionate e marginali.
DettagliExcel. A cura di Luigi Labonia. e-mail: luigi.lab@libero.it
Excel A cura di Luigi Labonia e-mail: luigi.lab@libero.it Introduzione Un foglio elettronico è un applicazione comunemente usata per bilanci, previsioni ed altri compiti tipici del campo amministrativo
DettagliGuida alla costruzione di tavole con i database
Guida alla costruzione di tavole con i database Al fine di fornire all utente uno strumento di analisi flessibile, oltre a rendere disponibili alcune tavole riepilogative in questo volume, viene data la
DettagliRELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della
RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili
DettagliVerifica di ipotesi e intervalli di confidenza nella regressione multipla
Verifica di ipotesi e intervalli di confidenza nella regressione multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2014 Rossi MRLM Econometria - 2014 1 / 23 Sommario Variabili di controllo
DettagliUNIVERSITÀ DEGLI STUDI DI MILANO-BICOCCA A. A. 2008-2009 FACOLTÀ DI ECONOMIA. Programma del modulo di STATISTICA I (6 crediti)
UNIVERSITÀ DEGLI STUDI DI MILANO-BICOCCA A. A. 2008-2009 FACOLTÀ DI ECONOMIA Programma del modulo di STATISTICA I (6 crediti) ECOCOM (lettere A-Lh): ECOCOM (lettere Li-Z): ECOBAN: ECOAMM (Lettere A-Lh):
DettagliStatistica 4038 (ver. 1.2)
Statistica 4038 (ver. 1.2) Software didattico per l insegnamento della Statistica SERGIO VENTURINI, MAURIZIO POLI i Il presente software è utilizzato come supporto alla didattica nel corso di Statistica
DettagliTeoria in sintesi 10. Attività di sportello 1, 24 - Attività di sportello 2, 24 - Verifica conclusiva, 25. Teoria in sintesi 26
Indice L attività di recupero 6 Funzioni Teoria in sintesi 0 Obiettivo Ricerca del dominio e del codominio di funzioni note Obiettivo Ricerca del dominio di funzioni algebriche; scrittura del dominio Obiettivo
DettagliINTRODUZIONE A EXCEL ESERCITAZIONE I
1 INTRODUZIONE A EXCEL ESERCITAZIONE I Corso di Idrologia e Infrastrutture Idrauliche Prof. Roberto Guercio Cos è Excel 2 Foglio di calcolo o foglio elettronico è formato da: righe e colonne visualizzate
DettagliFacciamo qualche precisazione
Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione
DettagliStatistica descrittiva: prime informazioni dai dati sperimentali
SECONDO APPUNTAMENTO CON LA SPERIMENTAZIONE IN AGRICOLTURA Statistica descrittiva: prime informazioni dai dati sperimentali La statistica descrittiva rappresenta la base di partenza per le applicazioni
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi per la media (varianza nota), p-value del test Il manager di un fast-food
DettagliCorso di laurea in Economia e Gestione delle Arti e delle Attività Culturali a.a. 2003-2004 INTRODUZIONE ALLA STATISTICA DESCRITTIVA
Corso di laurea in Economia e Gestione delle Arti e delle Attività Culturali a.a. 2003-2004 INTRODUZIONE ALLA STATISTICA DESCRITTIVA Prof. Stefania Funari Parte I TERMINOLOGIA STATISTICA e CONCETTI INTRODUTTIVI
Dettagli3. Confronto tra medie di due campioni indipendenti o appaiati
BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO
DettagliI ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale
I ESERCITAZIONE ESERCIZIO 1 Si vuole testare un nuovo farmaco contro il raffreddore. Allo studio partecipano 200 soggetti sani della stessa età e dello stesso sesso e con caratteristiche simili. i) Che
DettagliCorrezione dell Esame di Statistica Descrittiva (Mod. B) 1 Appello - 28 Marzo 2007 Facoltà di Astronomia
Correzione dell Esame di Statistica Descrittiva (Mod. B) 1 Appello - 8 Marzo 007 Facoltà di Astronomia ESERCIZIO 1 La seguente tabella riporta la distribuzione congiunta della situazione lavorativa e dello
DettagliSistema operativo. Sommario. Sistema operativo...1 Browser...1. Convenzioni adottate
MODULO BASE Quanto segue deve essere rispettato se si vuole che le immagini presentate nei vari moduli corrispondano, con buona probabilità, a quanto apparirà nello schermo del proprio computer nel momento
DettagliSERVIZIO [TO]BIKE INDAGINE SULLA SODDISFAZIONE DEGLI UTENTI
SERVIZIO [TO]BIKE INDAGINE SULLA SODDISFAZIONE DEGLI UTENTI 25 febbraio 2013 indagine eseguita a Novembre 2012 curata dalla dott.ssa Elena Amistà in collaborazione con il Servizio Qualità della Città di
DettagliLE CARTE DI CONTROLLO (4)
LE CARTE DI CONTROLLO (4) Tipo di carta di controllo Frazione difettosa Carta p Numero di difettosi Carta np Dimensione campione Variabile, solitamente >= 50 costante, solitamente >= 50 Linea centrale
DettagliRISULTATI DEL SONDAGGIO DI GRADIMENTO DEL SITO WEB
RISULTATI DEL SONDAGGIO DI GRADIMENTO DEL SITO WEB SUGGERIMENTI PER MIGLIORARE IL SITO In questa sezione vengono pubblicati i commenti e i suggerimenti lasciati dagli utenti (circa il 15% dei partecipanti)
DettagliPROGRAMMA SVOLTO NELLA SESSIONE N.
Università C. Cattaneo Liuc, Corso di Statistica, Sessione n. 1, 2014 Laboratorio Excel Sessione n. 1 Venerdì 031014 Gruppo PZ Lunedì 061014 Gruppo AD Martedì 071014 Gruppo EO PROGRAMMA SVOLTO NELLA SESSIONE
DettagliIl campionamento. Ulteriori vantaggi: economicità (costi e tempi limitati)
Il campionamento Il campionamento Insieme delle operazioni che consistono nella selezione, nelle intenzioni rappresentativa, degli appartenenti ad una popolazione, allo scopo di studiare una porzione della
DettagliIl questionario. Laboratorio del corso Tecniche quantitative di ricerca sociale. IV lezione. Modulo: Rilevazione dei dati
Il questionario Laboratorio del corso Tecniche quantitative di ricerca sociale Modulo: Rilevazione dei dati IV lezione Simona Ballabio Federico Denti Le prime fasi del processo di ricerca 1 2 Teoria Ipotesi
Dettagli. A primi passi con microsoft a.ccepss SommarIo: i S 1. aprire e chiudere microsoft access Start (o avvio) l i b tutti i pro- grammi
Capitolo Terzo Primi passi con Microsoft Access Sommario: 1. Aprire e chiudere Microsoft Access. - 2. Aprire un database esistente. - 3. La barra multifunzione di Microsoft Access 2007. - 4. Creare e salvare
DettagliESERCITAZIONE 4 SOCIALE. Corso di Laurea Comunicazione e A.A. 2012/2013
ESERCITAZIONE 4 STATISTICA PER LA RICERCA SOCIALE Corso di Laurea Comunicazione e Psicologia A.A. 2012/2013 \\lib\psico\corsi\esercitazioni_cp1 Il programma SPSS 1) Aprire spss 2) Immettere dati / aprire
DettagliCOMPITO B - ANALISI DEI DATI PER IL MARKETING OTTOBRE 2009
COGNOME E NOME COMPITO B - ANALISI DEI DATI PER IL MARKETING OTTOBRE 2009 Esercizio I MATR. Si è effettuata un indagine di customer satisfaction su un campione di 100 acquirenti d un modello di auto, chiedendo
DettagliInferenza statistica. Statistica medica 1
Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella
DettagliAnalizza/Confronta medie. ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107. Test t. Test t. t-test test e confronto tra medie chi quadrato
Analizza/Confronta medie ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107 t-test test e confronto tra medie chi quadrato C.d.L. Comunicazione e Psicologia a.a. 2008/09 Medie Calcola medie e altre statistiche
DettagliPULSANTI E PAGINE Sommario PULSANTI E PAGINE...1
Pagina 1 Sommario...1 Apertura...2 Visualizzazioni...2 Elenco...2 Testo sul pulsante e altre informazioni...3 Comandi...3 Informazioni...4 Flow chart...5 Comandi...6 Pulsanti Principali e Pulsanti Dipendenti...6
DettagliESERCIZI SVOLTI PER LA PROVA DI STATISTICA
ESERCIZI SVOLTI PER LA PROVA DI STATISTICA Stefania Naddeo (anno accademico 4/5) INDICE PARTE PRIMA: STATISTICA DESCRITTIVA. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE. VALORI CARATTERISTICI
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliGESTIONE INDUSTRIALE DELLA QUALITÀ A
GESTIONE INDUSTRIALE DELLA QUALITÀ A Lezione 10 CAMPIONAMENTO (pag. 62-64) L indagine campionaria all interno di una popolazione consiste nell estrazione di un numero limitato e definito di elementi che
DettagliGUIDA RAPIDA PER LA COMPILAZIONE DELLA SCHEDA CCNL GUIDA RAPIDA PER LA COMPILAZIONE DELLA SCHEDA CCNL
GUIDA RAPIDA BOZZA 23/07/2008 INDICE 1. PERCHÉ UNA NUOVA VERSIONE DEI MODULI DI RACCOLTA DATI... 3 2. INDICAZIONI GENERALI... 4 2.1. Non modificare la struttura dei fogli di lavoro... 4 2.2. Cosa significano
DettagliINDICE PREFAZIONE VII
INDICE PREFAZIONE VII CAPITOLO 1. LA STATISTICA E I CONCETTI FONDAMENTALI 1 1.1. Un po di storia 3 1.2. Fenomeno collettivo, popolazione, unità statistica 4 1.3. Caratteri e modalità 6 1.4. Classificazione
DettagliSOLUZIONI ESERCITAZIONE NR. 6 Variabili casuali binomiale e normale
SOLUZIONI ESERCITAZIONE NR. 6 Variabili casuali binomiale e normale ESERCIZIO nr. 1 I Presidi delle scuole medie superiori di una certa cittá italiana hanno indetto tra gli studenti dell ultimo anno una
Dettagli~ Copyright Ripetizionando - All rights reserved ~ http://ripetizionando.wordpress.com STUDIO DI FUNZIONE
STUDIO DI FUNZIONE Passaggi fondamentali Per effettuare uno studio di funzione completo, che non lascia quindi margine a una quasi sicuramente errata inventiva, sono necessari i seguenti 7 passaggi: 1.
DettagliStatistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.
Analisi multivariata Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Cercare di capire le relazioni
DettagliStatistiche campionarie
Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle
DettagliC) DIAGRAMMA A SETTORI
C) DIAGRAMMA A SETTORI Procedura: Determinare la percentuale per ciascuna categoria Convertire i valori percentuali in gradi d angolo Disegnare un cerchio e tracciare i settori Contrassegnare i settori
DettagliIndice-sommario INDICE SOMMARIO CAPITOLO I LE MATRICI DEI DATI E LE ANALISI UNIVARIATE
VII INDICE SOMMARIO Prefazione... xv CAPITOLO I LE MATRICI DEI DATI E LE ANALISI UNIVARIATE 1. Analisi dei dati e data mining... 1 2. La matrice dei dati «unità pervariabili»... 6 3. Idatiricavatidaun
DettagliLA CORRELAZIONE LINEARE
LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione
DettagliAutorità Nazionale Anticorruzione e per la valutazione e la trasparenza delle amministrazioni pubbliche
Autorità Nazionale Anticorruzione e per la valutazione e la trasparenza delle amministrazioni pubbliche Metodologia dell attività di vigilanza e controllo dell Autorità in relazione agli obblighi di pubblicazione
DettagliAmministrazione, finanza e marketing - Turismo Ministero dell Istruzione, dell Università e della Ricerca PROGRAMMAZIONE DISCIPLINARE PER U. di A.
CLASSE quinta INDIRIZZO AFM-SIA-RIM-TUR UdA n. 1 Titolo: LE FUNZIONI DI DUE VARIABILI E L ECONOMIA Utilizzare le strategie del pensiero razionale negli aspetti dialettici e algoritmici per affrontare situazioni
DettagliCENNI DI METODI STATISTICI
Corso di Laurea in Ingegneria Aerospaziale CENNI DI METODI STATISTICI Docente: Page 1 Page 2 Page 3 Due eventi si dicono indipendenti quando il verificarsi di uno non influisce sulla probabilità di accadimento
DettagliSTATISTICA SOCIALE Corso di laurea in Scienze Turistiche - A.A. 2007/2008 Esercizi di riepilogo - 14 dicembre 2007
STATISTICA SOCIALE Corso di laurea in Scienze Turistiche - A.A. 2007/2008 Esercizi di riepilogo - 14 dicembre 2007 Esercizio 1 In Tabella 1 è riportato il numero di crediti maturati al 30 settembre 2007
Dettagliper immagini guida avanzata Uso delle tabelle e dei grafici Pivot Geometra Luigi Amato Guida Avanzata per immagini excel 2000 1
Uso delle tabelle e dei grafici Pivot Geometra Luigi Amato Guida Avanzata per immagini excel 2000 1 Una tabella Pivot usa dati a due dimensioni per creare una tabella a tre dimensioni, cioè una tabella
Dettagli11. Analisi statistica degli eventi idrologici estremi
. Analisi statistica degli eventi idrologici estremi I processi idrologici evolvono, nello spazio e nel tempo, secondo modalità che sono in parte predicibili (deterministiche) ed in parte casuali (stocastiche
DettagliREGOLAMENTO (UE) N. 1235/2011 DELLA COMMISSIONE
30.11.2011 Gazzetta ufficiale dell Unione europea L 317/17 REGOLAMENTO (UE) N. 1235/2011 DELLA COMMISSIONE del 29 novembre 2011 recante modifica del regolamento (CE) n. 1222/2009 del Parlamento europeo
DettagliAnalisi della performance temporale della rete
Analisi della performance temporale della rete In questo documento viene analizzato l andamento nel tempo della performance della rete di promotori. Alcune indicazioni per la lettura di questo documento:
DettagliUniversità degli Studi di Ferrara - A.A. 2014/15 Dott. Valerio Muzzioli ORDINAMENTO DEI DATI
ORDINAMENTO DEI DATI Quando si ordina un elenco (ovvero una serie di righe contenenti dati correlati), le righe sono ridisposte in base al contenuto di una colonna specificata. Distinguiamo due tipi di
DettagliIl campionamento. risultati ottenuti sul campione sono generalizzabili alla popolazione da cui è stato estratto
Il campionamento Il campionamento Insieme delle operazioni che consistono nella selezione, nelle intenzioni rappresentativa, degli appartenenti ad una popolazione, allo scopo di studiare una porzione della
DettagliPotenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1
Potenza dello studio e dimensione campionaria Laurea in Medicina e Chirurgia - Statistica medica 1 Introduzione Nella pianificazione di uno studio clinico randomizzato è fondamentale determinare in modo
DettagliSommario. Capitolo 1 Impiego della statistica per la gestione dell azienda 1. Capitolo 2 Disponibilità e produzione delle informazioni statistiche 19
Prefazione XI Capitolo 1 Impiego della statistica per la gestione dell azienda 1 1.1 Premessa 1 1.2 Il ruolo della statistica a supporto del processo decisionale del manager 3 1.3 L impiego della statistica
Dettagli