Imputazione dati mancanti
|
|
- Lidia Leone
- 6 anni fa
- Visualizzazioni
Transcript
1 Imputazione dati mancanti
2 Una volta preparata la matrice dei dati, occorre controllare alcuni aspetti delle variabili disponibili. Missing Value Range Minimum & Maximum Extreme Values Per verificare la presenza di errori particolari, dati mancanti e valori estremi
3
4 Dati mancanti MISSING VALUE Missing Completely At Random Missing At Random Missing non ingnorabili MCAR Il processo che ha determinato la non rilevazione è completamente indipendente dal valore mancante e da qualsiasi altra variabile disponibile MAR Il processo che ha determinato la non rilevazione è completamente indipendente dal valore mancante ma può dipendere da altre variabili disponibili NMAR Il processo che ha determinato la non rilevazione del valore dipende dal valore mancante
5 Missing completely at random (MCAR) La probabilità che un certo valore per una data variabile sia missing è indipendente da qualsiasi altro valore per qualsiasi altra variabile, missing o osservata. Ovvero i valori missing values sono distribuiti aleatoriamente. Esempi Esperimento Avviamo più prove sperimentali con un ordine casuale. Concludiamole dopo 30 minuti. Sondaggi Chiediamo un numero di domande sorteggiate casualmente Limitiamo al 30% del campione (casuale) un certo item Data entry Inseriamo gli item in disordine sorteggiandoli dal mucchio Fermiamo l inserimento dati a intervalli aleatori.
6 Missing at random (MAR) La probabilità che un valore sia missing è collegata ai valori osservati disponibili Esempi Le donne meno spesso indicano l età I cinesi più spesso evadono le tasse MAR se sesso e nazionalità sono osservati
7 Not missing at random (NMAR) La probabilità che un valore sia mancante è collegata ai valori mancanti Esempi I sovrappeso meno spesso indicano il peso I ricchi il reddito Gli appartenenti all estrema destra il partito NMAR: problema grave
8 Cosa fare? Primo punto: individuare i missing utilizzando le funzioni di calcolo per le frequenze, anche tavole doppie, individuando così anche i dati anomali o errori di inserimento particolari Quindi, in fase di codifica ed inserimento dei dati, sia assegnato un valore univoco ai dati mancanti, in modo da distinguerli chiaramente dai valori effettivi. Ne segue che, ai missing, spettano sempre valori al di fuori dei campi di esistenza delle rispettive variabili, magari identici per tutto il data set: ad esempio 0 se esistono variabili su scala a rapporti 0 è lecito? NO! occorre un alternativa? Sì un codice alfabetico NA
9 Strategia passiva i dati missing vengono ignorati; l analisi viene effettuata esclusivamente sui dati presenti (complete case approach) in due diversi modi: casewise o parwise deletion casewise deletion (listwise deletion) vengono analizzati solamente casi completi; in presenza di molte variabili si ha una considerevole perdita di casi; Non esiste una regola per decidere quando eliminare il record o correggerlo con un imputazione (strategia attiva). Con grandi campioni e basse proporzioni di missing (5% o meno) comunemente si procede ad una casewise/ listwise deletion
10 Strategia passiva Nella casewise deletion o listwise deletion il problema principale dovuto è la perdita di informazioni e quindi di potenza statistica. Ad esempio, con l 1% di probabilità di avere un missing per ognuna delle 100 variabili considerate risulterebbe disponibile solo il 37% del campione. Con 50 variabili avremmo solo il 60% E con il 5% di probabilità di avere un missing, non si avrebbe a disposizione nemmeno l 1% e l 8% del campione, per 100 e 50 variabili complete (come mai?)
11 Strategia passiva pairwise deletion: vengono analizzati casi che presentano dati missing per ciascuna coppia di variabili considerate; Ad esempio, il calcolo delle correlazioni può essere svolto su un numero diverso di casi per ciascuna coppia di variabili; l insieme dei coefficienti di correlazione viene allora stimato su un maggior numero di casi rispetto alla situazione precedente. Questa opzione è solitamente poco preferibile, appunto perché il calcoli sono fatti su sottocampioni diversi e la matrice di varianza \ covarianza può generare problemi
12 Strategia esplorativa Abbiamo detto che i dati missing di una variabile sono raccolti in un solo codice, gestito sullo stesso modo delle altre modalità della variabile attiva. Tale strategia consente di verificare se i valori mancanti si riferiscono ad osservazioni sistematicamente diverse da quelle complete e di studiare le differenze tra unità complete e unità incomplete.
13 Strategia esplorativa
14 Strategia esplorativa
15 Strategia esplorativa
16 Strategia esplorativa
17 Strategia attiva (imputazione) L obiettivo in questo caso è quello di sostituire ciascun valore mancante con uno plausibile, stimato sulla base dei valori validi delle altre variabili completo. Supponiamo, ad esempio, di voler stimare il valore mancante per la variabile peso conoscendo sesso e/o l età per ogni intervistato. Si dovrebbe considerare in modo molto cauto l uso dell imputazione, per via del suo potenziale impatto, talora molto forte, sull analisi dei dati.
18 Strategia 1 listwise n=20 donne (grigio) più riservate per le variabili peso (Y) età (X 2 ) caso sesso (X1) età-20 (X2) peso (Y)
19 Simulazione listwise cancello tutti i casi con valori missing lavoro solo sui record completi è il default nei software In questo caso il campione risultante non è selezione in funzione del peso Y, ma del sesso X. La cancellazione listwise è stata selettiva per sesso, non per peso. Se il peso non dipende dal sesso, il campione residuo non è distorto per peso caso sesso (X1) età-20 (X2) peso (Y)
20 LD conviene, in generale, su dati MCAR LD non porta a distorsioni salvo la cancellazione dipenda da Y
21 Strategia 2: media Si calcola la media dei casi completi Y per sostituirla nei casi mancanti Lo stesso per X 1, X 2 Il modello implicito Y= Y X 1 = 1 X 2 = 2 Problemi Si oscura la relazione tra X e Y si sottostima la varianza di Y e la covarianza tra X i e Y
22 Strategia 2: media condizionata Si calcola la media sui casi completi, ma condizionatamente ai valori noti X 1, X 2 il modello implicito se Y è missing Y = X 1 1 Problemi Si ignora la componente random (manca ) si sottostima la varianza della variabile Y imputata
23 Strategia 3: media condizionata + Come la media condizionata più un residuo aleatorio Il modello implicito se Y è missing Y = 0 X 1 1 Y Problemi con Y modifico artificialmente la correlazione tra Y e X 1 introduco un'altra sorgente di variabilità nei miei dati
24 Problemi con l imputazione singola Si sottostima la variabilità delle variabili missing e quindi anche la variabilità delle stime campionarie svolte anche con i dati imputati Infatti si trattano i valori imputati come osservati, mentre sono più incerti sono ulteriori stime! In altri termini, quando si considera l aggiunta di un residuo aleatorio () ipoteticamente dovuto al modello aleatorio considerato, si introduce una sorta di ulteriore campionamento quindi una aleatorietà aggiuntiva oltre a quella primaria dovuta all'estrazione iniziale del campione
IL DISEGNO DELLA RICERCA
IL DISEGNO DELLA RICERCA Che cosa vuol dire? è la strategia dell intera ricerca. Anche se la demarcazione non è netta, esistono disegni a (prevalente) impostazione: campionaria sperimentali osservazionali
DettagliSommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51
Sommario 1 I dati...15 1.1 Classificazione delle rilevazioni...17 1.1.1 Esperimenti ripetibili (controllabili)...17 1.1.2 Rilevazioni su fenomeni non ripetibili...18 1.1.3 Censimenti...19 1.1.4 Campioni...19
DettagliLa progettazione di un indagine statistica
Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Outline 1 L indagine campionaria 2 3 Outline 1 L indagine campionaria 2 3 L indagine campionaria [1/2] Principalmente influenzata da: tempi costi
DettagliIMPUTAZIONE MULTIPLA: UN APPLICAZIONE ALL ANALISI DI DATI DI REDDITO
Università degli studi di Firenze Dipartimento Statistico DOTTORATO IN STATISTICA APPLICATA VII CICLO IMPUTAZIONE MULTIPLA: UN APPLICAZIONE ALL ANALISI DI DATI DI REDDITO Anna Giraldo Relatore: Prof. Luigi
DettagliI SONDAGGI DI OPINIONE. La necessità di una teoria dei campioni
I SONDAGGI DI OPINIONE La necessità di una teoria dei campioni 1. Le credenziali del campione Le molte, a volte moltissime, informazioni che solitamente provengono da una indagine campionaria, anche di
DettagliSommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25
Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità
DettagliStatistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme
DettagliANALISI DEI DATI PER IL MARKETING 2017
ANALISI DEI DATI PER IL MARKETING 2017 Marco Riani mriani@unipr.it http://www.riani.it TRATTAMENTI PRELIMINARI DEI DATI Pulizia dei dati (data cleaning) = processo capace di garantire, con una certa soglia
DettagliL A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010
L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi
DettagliDistribuzioni campionarie. Antonello Maruotti
Distribuzioni campionarie Antonello Maruotti Outline 1 Introduzione 2 Concetti base Si riprendano le considerazioni fatte nella parte di statistica descrittiva. Si vuole studiare una popolazione con riferimento
DettagliMetodologia di applicazione dei modelli di massima verosimiglianza per il trattamento dei dati missing
Metodologia di applicazione dei modelli di massima verosimiglianza per il trattamento dei dati missing Erminio A. Bonizzoni Congresso nazionale BIAS 9/3 aprile 9 Sesto Fiorentino Firenze Stimatori di Massima
DettagliUniversità degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1
Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Lezione 1 - Mercoledì 28 Settembre 2016 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,
DettagliElementi di base su modello binomiale e modello normale
Elementi di base su modello binomiale e modello normale (alcune note) Parte 1: il modello binomiale Di fondamentale importanza nell analisi della qualità sono i modelli. I due principali modelli statistico-probablistici
DettagliIl modello di regressione lineare multipla. Il modello di regressione lineare multipla
Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa
DettagliUniversità di Siena. Teoria della Stima. Lucidi del corso di. Identificazione e Analisi dei Dati A.A
Università di Siena Teoria della Stima Lucidi del corso di A.A. 2002-2003 Università di Siena 1 Indice Approcci al problema della stima Stima parametrica Stima bayesiana Proprietà degli stimatori Stime
DettagliStatistica 1- parte II
Statistica 1- parte II Esercitazione 3 Dott.ssa Antonella Costanzo 25/02/2016 Esercizio 1. Verifica di ipotesi sulla media (varianza nota) Il preside della scuola elementare XYZ sospetta che i suoi studenti
DettagliDispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
DettagliDiPAV, 2007, 20, I DATI MANCANTI. Emanuela Chemolli * Margherita Pasini **
DiPAV, 2007, 20, 51-56 I DATI MANCANTI Emanuela Chemolli * Margherita Pasini ** Sommario Spesso i ricercatori si trovano di fronte al problema dei dati mancanti. Questo articolo presenta alcune informazioni
DettagliTipi di variabili. Indici di tendenza centrale e di dispersione
Tipi di variabili. Indici di tendenza centrale e di dispersione L. Boni Variabile casuale In teoria della probabilità, una variabile casuale (o variabile aleatoria o variabile stocastica o random variable)
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliPsicologia come scienza: Il metodo scientifico
Psicologia come scienza: Il metodo scientifico identificare domande su un evento formulare un ipotesi per spiegare l evento eseguire una ricerca per supportare e confutare la spiegazione Ripetere la ricerca
DettagliCognome e Nome:... Matricola e corso di laurea:...
Statistica - corso base Prof. B. Liseo Prova di esame dell 8 gennaio 2014 Cognome e Nome:................................................................... Matricola e corso di laurea:...................................................
Dettaglile scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:
DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it si basano su tre elementi: le scale di misura sistema empirico: un insieme di entità non numeriche (es. insieme di persone; insieme
Dettaglib) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):
ESERCIZIO 1 Una grande banca vuole stimare l ammontare medio di denaro che deve essere corrisposto dai correntisti che hanno il conto scoperto. Si seleziona un campione di 100 clienti su cui si osserva
DettagliLEZIONI DI STATISTICA MEDICA
LEZIONI DI STATISTICA MEDICA Lezione n.11 - Principi dell inferenza statistica - Campionamento - Distribuzione campionaria di una media e di una proporzione - Intervallo di confidenza di una media e di
DettagliStatistica ARGOMENTI. Calcolo combinatorio
Statistica ARGOMENTI Calcolo combinatorio Probabilità Disposizioni semplici Disposizioni con ripetizione Permutazioni semplici Permutazioni con ripetizioni Combinazioni semplici Assiomi di probabilità
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 4.1 I principali test statistici per la verifica di ipotesi: Il test t Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico
DettagliANALISI DEI DATI PER IL MARKETING 2014
ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it TRATTAMENTI PRELIMINARI DEI DATI Pulizia dei dati (data cleaning) = processo capace di garantire, con una certa soglia
DettagliIdraulica e Idrologia: Lezione 6
Idraulica e Idrologia: Lezione 6 Agenda del giorno - Eventi estremi in idrologia: legame fra magnitudo e probabilità; - Statistica e probabilità in idrologia; - Tempo di ritorno. 1 Analisi statistica di
DettagliEsercizi di Probabilità e Statistica
Esercizi di Probabilità e Statistica Samuel Rota Bulò 6 giugno 26 Statistica Esercizio Sia {X n } n una famiglia di v.a. di media µ e varianza σ 2. Verificare che X = n n X i σ 2 = n (X i µ) 2 S 2 = n
DettagliUlteriori conoscenze di informatica Elementi di statistica Esercitazione3
Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3 Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows. Immettere Nome utente b## (##
DettagliRingraziamenti dell Editore
Indice Elenco dei simboli e delle abbreviazioni in ordine di apparizione Ringraziamenti dell Editore XI XVII 1 Introduzione FAQ e qualcos altro, da leggere prima 1 1.1 QuestoèunlibrodiStatistica....................
DettagliQuesto calcolo richiede che si conoscano media e deviazione standard della popolazione.
Università del Piemonte Orientale Corso di laurea in biotecnologie Corso di Statistica Medica La distribuzione t - student 1 Abbiamo visto nelle lezioni precedenti come il calcolo del valore Z, riferito
DettagliStatistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
DettagliIndagine statistica. Indagine Totale Indagine Campionaria Fasi dell indagine
10/1 Indagine statistica Indagine Totale Indagine Campionaria Fasi dell indagine definizione degli obiettivi definizione delle unità e delle variabili da rilevare scelta del periodo di riferimento individuazione
DettagliCap. 7 Distribuzioni campionarie
Cap. 7 Distribuzioni campionarie 1 Popolazione e Campione Una popolazione è l insieme di tutte le unità oggetto di studio Tutti i potenziali votanti nelle prossime elezioni Tutti i pezzi prodotti oggi
DettagliUniversità del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student
Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica La distribuzione t - student 1 Abbiamo visto nelle lezioni precedenti come il calcolo del valore Z,
DettagliStrumenti informatici Calcolare il coefficiente di correlazione di Pearson con Excel e SPSS
Strumenti informatici 7.3 - Calcolare il coefficiente di correlazione di Pearson con Excel e SPSS Il coefficiente di correlazione di Pearson può essere calcolato con la funzione di Excel =CORRELAZIONE(Matrice1;Matrice2),
DettagliIl modello di regressione lineare multipla con regressori stocastici
Università di Pavia Il modello di regressione lineare multipla con regressori stocastici Eduardo Rossi Il valore atteso condizionale Modellare l esperimento casuale bivariato nel quale le variabili casuali
Dettaglilezione 5 AA Paolo Brunori
AA 2016-2017 Paolo Brunori dove eravamo arrivati - le stime OLS ci consentono di approssimare linearmente la relazione fra una variabile dipendente (Y) e una indipendente (X) - i parametri stimati su un
Dettaglilezione 9 AA Paolo Brunori
AA 2016-2017 Paolo Brunori Dove siamo arrivati? - la regressione lineare multipla ci permette di stimare l effetto della variabile X sulla Y tenendo ferme tutte le altre variabili osservabili che hanno
DettagliCorso di Statistica Esercitazione 1.8
Corso di Statistica Esercitazione.8 Test su medie e proporzioni Prof.ssa T. Laureti a.a. 202-203 Esercizio Un produttore vuole monitorare i valori dei livelli di impurità contenute nella merce che gli
DettagliCampionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1
Campionamento La statistica media campionaria e la sua distribuzione 1 Definisco il problema da studiare: es. tempo di percorrenza tra abitazione e università Carattere: tempo ossia v.s. continua Popolazione:
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
DettagliMetodologie Quantitative
Metodologie Quantitative Concetti statistici di base II M Q Marco Perugini Milano-Bicocca 1 Laboratorio Iscrizione/Scelta Turno Laboratorio Metodologie Quantitative Turno 1: Lunedì pomeriggio Turno 2:
DettagliI appello di calcolo delle probabilità e statistica
I appello di calcolo delle probabilità e statistica A.Barchielli, L. Ladelli, G. Posta 8 Febbraio 13 Nome: Cognome: Matricola: Docente: I diritti d autore sono riservati. Ogni sfruttamento commerciale
DettagliOld Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.
Coppie o vettori di dati Spesso i dati osservati sono di tipo vettoriale. Ad esempio studiamo 222 osservazioni relative alle eruzioni del geyser Old Faithful. Old Faithful, Yellowstone Park. Old Faithful
DettagliUniversità del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica
Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare
DettagliIL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e
DettagliErrori (o bias) negli studi epidemiologici
Errori (o bias) negli studi epidemiologici Errore casuale o random: sono i più pericolosi perché i più difficili da individuare e per questo motivo non è possibile tenerne conto in fase di analisi Variazione
DettagliConfronto tra più di due campioni
Confronto tra più di due campioni La matrice dei dati Quando si esaminano più di due popolazioni, le informazioni sono u- sualmente organizzate sotto forma di matrice.,,, n ( ω ω ω ) 1 2 Pino, Maria,,Giacomo
DettagliEconometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA 2014-2015 Paolo Brunori
AA 2014-2015 Paolo Brunori popolazione studiata e popolazione di interesse - popolazione studiata: popolazione da cui è stato estratto il campione - popolazione di interesse: popolazione per la quale ci
DettagliLa valutazione dei rischi. Corso di risk management Prof. Giuseppe D Onza
La valutazione dei rischi Corso di risk management Prof. Giuseppe D Onza LA VALUTAZIONE DEI RISCHI E un attività che caratterizza la gestione dei rischi finalizzata ad apprezzare la gravità dei fenomeni
DettagliPROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
DettagliANALISI DELLE SERIE STORICHE
ANALISI DELLE SERIE STORICHE De Iaco S. s.deiaco@economia.unile.it UNIVERSITÀ del SALENTO DIP.TO DI SCIENZE ECONOMICHE E MATEMATICO-STATISTICHE FACOLTÀ DI ECONOMIA 24 settembre 2012 Indice 1 Funzione di
DettagliIl processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni
La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con
DettagliUlteriori Conoscenze di Informatica e Statistica
ndici di forma Ulteriori Conoscenze di nformatica e Statistica Descrivono le asimmetrie della distribuzione Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 ( piano) tel.: 06 55 17 72 17
DettagliCapitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari"
Levine, Krehbiel, Berenson Statistica Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari" Unità Integrata Organizzativa
DettagliLa verifica delle ipotesi
La verifica delle ipotesi Se abbiamo un idea di quale possa essere il valore di un parametro incognito possiamo sottoporlo ad una verifica, che sulla base di un risultato campionario, ci permetta di decidere
Dettagli05. Errore campionario e numerosità campionaria
Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,
DettagliGiorno n. clienti di attesa
Esercizio 1 Un aspetto cruciale per la qualità del servizio ai clienti in un supermercato è il cosiddetto checkout (ovvero il tempo che il cliente impiega dal momento in cui si mette in fila alla cassa
DettagliStatistica Metodologica
Statistica Metodologica Esercizi di Probabilita e Inferenza Silvia Figini e-mail: silvia.figini@unipv.it Problema 1 Sia X una variabile aleatoria Bernoulliana con parametro p = 0.7. 1. Determinare la media
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
DettagliUniversità degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A
Università degli Studi di Padova Corso di Laurea in Medicina e Chirurgia - A.A. 015-16 Corso Integrato: Statistica e Metodologia Epidemiologica Disciplina: Statistica e Metodologia Epidemiologica Docenti:
DettagliLaboratorio di Statistica 1 con R Esercizi per la Relazione. I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati
Laboratorio di Statistica 1 con R Esercizi per la Relazione I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati nel corso. Esercizio 1. 1. Facendo uso dei comandi
DettagliEsercitazioni di Statistica Metodologica
Esercitazioni di Statistica Metodologica June 22, 2009 1 Esercizio La compagnia di telefonia fissa Happy Line ha svolto una indagine sul numero di telefonate effettuate dai suoi clienti la settimana scorsa.
DettagliUniversità di Siena. Corso di STATISTICA. Parte seconda: Teoria della stima. Andrea Garulli, Antonello Giannitrapani, Simone Paoletti
Università di Siena Corso di STATISTICA Parte seconda: Teoria della stima Andrea Garulli, Antonello Giannitrapani, Simone Paoletti Master E 2 C Centro per lo Studio dei Sistemi Complessi Università di
DettagliAnalisi della varianza
Università degli Studi di Padova Facoltà di Medicina e Chirurgia Facoltà di Medicina e Chirurgia - A.A. 2009-10 Scuole di specializzazione Lezioni comuni Disciplina: Statistica Docente: dott.ssa Egle PERISSINOTTO
DettagliStatistica Applicata all edilizia: il modello di regressione
Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione
Dettaglia) Usando i seguenti livelli di significatività, procedere alla verifica di ipotesi, usando come ipotesi alternativa un'ipotesi unidirezionale:
ESERCIZIO 1 Da studi precedenti, il responsabile del rischio di una grande banca sa che l'ammontare medio di denaro che deve essere corrisposto dai correntisti che hanno il conto scoperto è pari a 240.
DettagliCapitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
DettagliSTATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA
Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE
DettagliEsercitazione di Statistica Indici di associazione
Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza
DettagliConcetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2016/2017. Giovanni Lafratta
Concetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2016/2017 Giovanni Lafratta ii Indice 1 Spazi, Disegni e Strategie Campionarie 1 2 Campionamento casuale
DettagliEsercizi riassuntivi di Inferenza
Esercizi riassuntivi di Inferenza Esercizio 1 Un economista vuole stimare il reddito medio degli abitanti di una cittadina mediante un intervallo al livello di confidenza del 95%. La distribuzione del
DettagliL Analisi della Varianza ANOVA (ANalysis Of VAriance)
L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 Concetti generali: Confronto simultaneo tra più di due popolazioni, esempi... La analisi della varianza estende il confronto a p gruppi con p>2.
DettagliPresentazione dell edizione italiana
1 Indice generale Presentazione dell edizione italiana Prefazione xi xiii Capitolo 1 Una introduzione alla statistica 1 1.1 Raccolta dei dati e statistica descrittiva... 1 1.2 Inferenza statistica e modelli
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Stimatore media campionaria Il tempo in minuti necessario a un certo impiegato dell anagrafe
DettagliIndagine sulle forze di lavoro nel Comune di Firenze. Nota metodologica
Indagine sulle forze di lavoro nel Comune di Firenze. Nota metodologica 1. Procedimento di stima La maggior parte dei caratteri che si rilevano nell indagine sulle Forze di Lavoro sono di tipo qualitativo.
DettagliPROBABILITÀ ELEMENTARE
Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti
DettagliSTATISTICA SOCIALE - Corso di laurea in Scienze Turistiche Prova finale del 18 dicembre 2007 Compito A
STATISTICA SOCIALE - Corso di laurea in Scienze Turistiche Prova finale del 18 dicembre 2007 Compito A Esercizio 1 La Tabella 1 riporta la distribuzione dei Comuni di una certa Provincia per numero di
DettagliVecchie prove d esame Statistica e Calcolo delle Probabilità
Vecchie prove d esame Statistica e Calcolo delle Probabilità Esercizio 1 (Esame 11 Gennaio 2005): Alla fine di una giornata di lavoro un intervistatore si accorge di aver perso i dati raccolti su un certo
DettagliEsame di Statistica A-Di Prof. M. Romanazzi
1 Università di Venezia Esame di Statistica A-Di Prof. M. Romanazzi 25 Maggio 2015 Cognome e Nome..................................... N. Matricola.......... Valutazione Il punteggio massimo teorico di
DettagliIBM SPSS Missing Values 21
IBM SPSS Missing Values 21 Nota: Prima di utilizzare queste informazioni e il relativo prodotto, leggere le informazioni generali disponibili in Note a pag. 92. Questa versione si applica a IBM SPSS Statistics
DettagliStatistica Inferenziale
Statistica Inferenziale Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Esercizio 1 (stima puntuale) In un processo di controllo di qualità, siamo interessati al numero mensile di guasti
DettagliEsercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)
STATISTICA (2) ESERCITAZIONE 5 26.02.2014 Dott.ssa Antonella Costanzo Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota) Il responsabile del controllo qualità di un azienda che
DettagliLE DISTRIBUZIONI CAMPIONARIE
LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria
DettagliTest di ipotesi. Test
Test di ipotesi Test E una metodologia statistica che consente di prendere una decisione. Esempio: Un supermercato riceve dal proprio fornitore l assicurazione che non più del 5% delle mele di tipo A dell
DettagliEsame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).
Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si
DettagliCorso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
DettagliTest delle Ipotesi Parte I
Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test
DettagliIndagine Sole 24 Ore-Banca d Italia sulle aspettative di inflazione
Indagine Sole 24 Ore-Banca d Italia sulle aspettative di inflazione Giugno 2000 INDICE 1. Sintesi dei risultati... 3 2. Nota metodologica... 4 3. Indice delle tavole e delle figure... 7 4. Appendice: il
DettagliCognome e Nome:... Corso di laurea:...
Statistica - corso base Prof. B. Liseo Prova di esame dell 8 gennaio 201 Cognome e Nome:................................................................... Corso di laurea:.......................................................................
DettagliDistribuzioni e inferenza statistica
Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione
DettagliStatistica Capitolo 1 Perchè h st d u i diare la st ti a sti? ca Cap. 1-1
Statistica Capitolo 1 Perchè studiare la statistica? ti ti Cap. 1-1 Obiettivi del Capitolo Dopo aver completato t il capitolo, sarete in grado di: Spiegare come le decisioni sono spesso basate su informazioni
DettagliProva scritta di Complementi di Probabilità e Statistica. 7 Dicembre 2012
Prova scritta di Complementi di Probabilità e Statistica 7 Dicembre. Un ingegnere vuole investigare se le caratteristiche di una superficie metallica sono influenzate dal tipo di pittura usata e dal tempo
DettagliCenni di statistica statistica
Cenni di statistica La statistica è una disciplina che ha come fine lo studio quantitativo e qualitativo di un particolare fenomeno in condizioni di incertezza o non determinismo, ovvero di non completa
DettagliIl modello lineare e l analisi della varianza con
Il modello lineare e l analisi della varianza con Rocco Micciolo Università di Trento http://hostingwin.unitn.it/micciolo/ ANOVA a 1 via La scomposizione della devianza ANOVA a 1 via e modello lineare
DettagliData Mining. Prova parziale del 20 aprile 2017: SOLUZIONE
Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova
Dettagli1. Introduzione ai disegni sperimentali. 5. Analisi della regressione lineare. 6. Confronto tra proporzioni di due o più campioni indipendenti
BIOSTATISTICA 1. Introduzione ai disegni sperimentali 2. Un carattere quantitativo misurato in un campione: elementi di statistica descrittiva e inferenziale 3. Confronto tra medie di due campioni indipendenti
Dettagli