È l insieme delle regole seguite per la costruzione del campione.

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "È l insieme delle regole seguite per la costruzione del campione."

Transcript

1 Il campionamento

2 CAMPIONAMENTO È il procedimento logico in base al quale l insieme delle procedure per la costruzione del campione si salda alla teoria della stima e dll della verifica dll delle ipotesi. DISEGNO DI CAMPIONAMENTO È l insieme delle regole seguite per la costruzione del campione.

3 Il piano di campionamento E L INSIEME DI OPERAZIONI CHE PORTANO A: 1. DEFINIRE LA POPOLAZIONE OBIETTIVO NELLA RILEVAZIONE STATISTICA; 2. DEFINIRE LE UNITA CAMPIONARIE; 3. SCEGLERE IL O I CAMPIONI SUI QUALI AVVERRA LA RILEVAZIONE STATISTICA; 4. CALCOLARE LA DIMENSIONE DEL CAMPIONE 5. DEFINIRE IL METODO O PROCEDIMENTO DI CAMPIONAMENTO; 6. FORMULARE, INFINE, UN GIUDIZIO SULLA BONTA DEL CAMPIONE.

4 Struttura tt del campione: insieme i delle liste che si utilizzano per costruire il campione. La lista comprende l elenco l di tutte le unità che compongono l universo. Se la struttura del campione è semplice: una lista. Se la struttura del campione è complessa: più liste.

5 La popolazione è it intesa come aggregato di unità statistiche. ti ti Le caratteristiche e le proprietà della popolazione che si intendono studiare sono definite variabili o caratteri. Possiamo ottenere le informazioni sulle variabili attraverso due metodi: - Rilevazione totale o censuaria (si analizzano tutte le unità che compongono l universo) - Rilevazione campionaria (studio per inferenza dell universo)

6 Definizioni di base Popolazione o universo: ogni insieme finito o infinito di unità (non necessariamente esseri umani). La numerosità si indica con N Campione: insieme delle n (unità campionarie) selezionate tra le N che compongono la popolazione, detta popolazione di riferimento Statistica descrittiva: è l insieme delle procedure utili per organizzare i dati raccolti in forma conveniente e comunicabile Statistica inferenziale: è l insieme delle procedure atte a raggiungere conclusioni più ampie rispetto ai valori raccolti, tali da poter essere messi in relazione con l universo.

7 Vogliamo studiare le variabili (proprietà) X, Y, Z, di un certo campione. Studiarle significa conoscere alcuni valori caratteristici assunti dll dall intera popolazione (cioè la loro DISTRIBUZIONE) o le relazioni fra le variabili stesse. Chiamiamo queste conoscenze PARAMETRI PARAMETRO (grandezza relativa ad una popolazione): è una grandezza vera che assume un certo valore (noto o meno) ESEMPIO: Proporzione di studenti del master con gli occhi verdi

8 Esempi: Se l unità è l individuo id e la variabile X è il reddito e vogliamo conoscere il reddito medio, il parametro della popolazione che vogliamo conoscere è la MEDIA Se la variabile Y è il voto e noi vogliamo conoscere la proporzione di persone che hanno votato il partito A, il parametro della popolazione che vogliamo conoscere è una PROPORZIONE Se vogliamo studiare la relazione fra le variabili X e Z, il parametro che vogliamo conoscere è un coefficiente di CORRELAZIONE

9 Stimatore Grandezza relativa a un campione. Stima il relativo parametro della popolazione da cui è estratto il campione ESEMPIO: Proporzione di studenti con gli occhi verdi presenti a questo corso Lo STIMATORE è diverso dal PARAMETRO e dipende dal campione estratto. Lo stimatore è una misura affetta da errore (errore di campionamento). Le misure affette da errore di campionamento sono chiamate variabili aleatorie o casuali

10 Se conoscessimo la popolazione totale, avremmo il valore esatto del parametro che stiamo studiando, ma questa è un ipotesi che non si verifica mai (se non nei casi di censimento) L indagine campionaria ci fornisce una STIMA, un valore approssimato

11 Se indichiamo con V il valore (sconosciuto) del parametro della popolazione p (che può essere una media, una proporzione, p un coefficiente di correlazione, ecc.), con v il valore trovato nel campione (cioè la sua stima) e con e l'errore di campionamento, possiamo scrivere: V = v ± e Parametro della popolazione p (incognito) Stima del campione Errore di campionamento Mentre non ci sono difficoltà per calcolare l la stima v, che è direttamente fornita dai dati del campione, il vero problema consiste nel calcolare l'errore di campionamento. Si tratta di un problema assai rilevante. Intuitivamente, infatti, per determinare l'entità dell'errore dovremmo conoscere anche qualche cosa della popolazione: ma come facciamo se su di essa non sappiamo nulla?

12 Tuttavia, se il campione è stato scelto secondo una procedure rigorosamente casuale, cioè si tratta di un campione probabilistico, allora la statistica ci permette di calcolare l'entità di tale errore. Quindi, se effettuiamo una rilevazione totale sul reddito degli italiani, possiamo dire: il reddito medio degli italiani è Se effettuiamo un rilevazione campionaria, diciamo: c è il 95% di probabilità che il reddito medio degli italiani sia di ± 50 Nel secondo caso, il ricercatore non è certo del suo calcolo, c è cèun 5% di probabilità che il reddito sia al di fuori dei valori indicati. Il ricercatore calcola un intervallo di fiducia nel quale si colloca il valore della statistica della popolazione. La stima del campione è sempre affetta da un ERRORE DI CAMPIONAMENTO. L'errore di campionamento è direttamente proporzionale al livello di fiducia che vogliamo avere nella stima e alla variabilità del fenomeno studiato, mentre è inversamente proporzionale all'ampiezza del campione.

13 Errore totale della stima Componenti principali Casuale Errore di campionamento Errore dovuto all'intrinseca variabilità del processo di campionamento probabilistico Errore non campionario Sistematico Errore di selezione dovuto all'adozione adozione di un disegno di campionamento non probabilistico Errore di copertura Errore di non risposta totale Errore di non risposta parziale Errore di misurazione Errore di elaborazione (varianza campionaria)

14 Errore di campionamento L errore di campionamento si verifica per VARIAZIONE CASUALE deriva da un elemento naturale ineliminabile: i il CASO SELEZIONE VIZIATA fatta su un settore non rappresentativo della popolazione. Il campione si dice DISTORTO questo è un BUON CAMPIONE perché l errore lerrore dovuto alla variazione casuale può essere STIMATO Questo è un CATTIVO CAMPIONE perché l errore non può essere stimato!

15 Variazione casuale La variazione casuale è dovuta al caso, cioè a quell'«insieme di fattori o cause, piccole o grandi, che agiscono su un fenomeno senza che noi possiamo o vogliamo controllarli esattamente e prevederne quindi l'azione» (Cavalli-Sforza). La variazione i casuale fasì che unamisura effettuata su un campione non fornisca un valore identico alla misura effettuata sulla popolazione: ci potrebbe essere - ed in effetti c'è sempre - un certo errore, che viene detto errore campionario. L'errore campionario deriva semplicemente dal fatto che stiamo osservando soltanto una parte della popolazione.

16 Esempio Supponiamo di avere a disposizione due farmaci, A e B, ugualmente efficaci, nel senso che guariscono il 50% dei pazienti trattati. Supponiamo di fare un esperimento per studiare l'effetto dei due farmaci; supponiamo che, in questo esperimento, non sia presente alcun bias e quindi che i dati ottenuti siano assolutamente affidabili. Tuttavia, se l'esperimento prevede di esaminare un numero limitato di soggetti per ciascuno dei due trattamenti, facilmente osserveremo che il farmaco A induce guarigione con maggior frequenza rispetto al farmaco B (o viceversa). Questo effetto è dovuto, appunto, alla variazione casuale. Ovviamente, l'errore di campionamento è condizionato dall'esistenza di variabilità tra gli individui che compongono la popolazione di partenza; se tutti - per assurdo - avessero lo stesso carattere in egual misura, l'esame di qualsiasi numero di individui fornirebbe lo stesso valore, e quindi l'errore di campionamento sarebbe nullo.

17 Selezione viziata La selezione viziata è quella che viene effettuata su un segmento non rappresentativo della popolazione. Questo avviene quando la scelta delle unità che costituiranno il campione viene effettuata t con regole non rigorosamente causali. Tl Talvolta, lt è lo stesso sperimentatore che, definendo delle regole estemporanee volte a neutralizzare - nelle intenzioni - gli effetti del caso e ad ottenere un campione più aderente alla popolazione, commette un errore che rende i dati inutilizzabili. Un campione che non è stato ottenuto correttamente fornisce misurazioni e risultati per i quali è impossibile calcolare il cosiddetto «errore di campionamento». La selezione viziata fa sì che all'errore campionario si sommi un altro tipo di errore, detto errore non campionario o bias.

18 La selezione viziata fornisce un campione non rappresentativo (distorto) ESEMPIO 1. Vogliamo accertare la proporzione di persone che si curano con preparati p omeopatici in una determinata città. Non potendo esaminare tutti gli individui della città considerata, decidiamo di esaminare un campione di persone. Per comodità, scegliamo le persone che si servono presso le farmacie provviste anche di prodotti omeopatici. Il campione così ottenuto sarà sicuramente composto proprio da molte di quelle persone che assumono preparati omeopatici. Il nostro campione sarà viziato perché (1) ha selezionato persone che preferiscono la medicina omeopatica, e (2) ha selezionato persone che si servono in farmacie omeopatiche. Presumibilmente, una maggior quantità di individui del nostro campione risulterà privilegiare il trattamento omeopatico e dunque potremmo erroneamente concludere che "moltissime persone non ricorrono alle terapie tradizionali".

19 La selezione viziata fornisce un campione non rappresentativo (distorto) ESEMPIO 2. Il frammento prelevato con una biopsia epatica rappresenta circa 1/50000 dell'organo. Essendo il campione così piccolo rispetto all'intero organo, esiste la possibilità di ampie variazioni i i da uncampione all'altro. lt Inoltre, poiché ihéilil frammento viene esaminato, in genere, allo scopo di diagnosticare una malattia dell'intero fegato, esiste la possibilità che il processo di inferenza sia viziato. Ad esempio, si preleva un campione di tessuto sano in un organo ammalato.

20 In conclusione Si può affermare che soltanto quando la scelta degli individui che compongono il campione è stata dettata dal puro e semplice caso (campionamento a probabilistico poa stco o randomizzato), è possibile prevedere e calcolare l'entità della differenza tra campione e popolazione. p In caso contrario, il campione si dice «distorto»». Con un campione distorto, non è possibile calcolare l'errore di campionamento e i dati ottenuti saranno difficilmente utilizzabili.

21 bias o distorsione: differenza, causata da un errore sistematico, tra la stima ottenuta da un campione e la vera caratteristica della popolazione Per «bias» si intende "un processo, effettuato in qualsiasi stadio della inferenza,, che tende a fornire risultati che si discostano sistematicamente dai valori veri".

22 bias (o distorsione o errore sistematico) ti bias Se la moneta è bilanciata: 1000 lanci -> in circa il 50% dei casi ci aspettiamo che venga testa (o croce) Se ripetiamo l esperimento più volte, escludendo i casi in cui si ha il 50%, in media metà delle volte la % sarà superiore e metà della volte sarà inferiore al 50%. Se la moneta fosse sbilanciata nel peso: Allora ci aspetteremmo due percentuali diverse, di entità proporzionale allo sbilanciamento.

23 bias (o distorsione o errore sistematico) ti BIAS DI SELEZIONE distorsione nella scelta del campione (es. usare pazienti ospedalizzati per infarto miocardico acuto come campione per valutare l efficacia di un intervento per smettere di fumare; utilizzare come campione controllo broncopatici in uno studio caso-controllo per trovare l associazione fra fumo e cancro del polmone, etc.) Esempio: il rapporto tra massa corporea e pressione arteriosa è influenzato dall'età; se il campione è stato ricavato in una comunità con etàmediainferioreallamedianazionaleleconclusionitrattedaquesto campione non possono essere applicate alla comunità nazionale

24 Errori non campionari Nelle indagini infermieristiche possono essere più grandi dell errore di campionamento: - errata definizione della popolazione - errori nella lista (sottocopertura, sovracopertura, duplicazioni) - errori nello strumento di rilevazione - effetto intervistato - eventuale effetto intervistatore - mancata risposte ( non trovati, rifiuti, ecc) - errori nelle fasi di codifica, imputazione, elaborazione dei dati

25 Altre forme di bias/distorsione BIAS DI MISURAZIONE - Distorsione nella raccolta dei dati. Bias di misurazione (che si verifica se i metodi di misurazione non sono ben tarati, o validi, oppure se sono imprecisi o diversi tra i pazienti studiati). Esempio: misurare la pressione con uno sfigmomanometro difettoso, confrontare rilevazioni del peso corporeo pesando o chiedendo il peso con dei questionari, etc. BIAS DI CONFONDIMENTO: Bias di confondimento (che si verifica quando è presente un ftt fattore estraneo - di confondimento appunto -che è associato, it anche se in modo non causale, sia alla esposizione-trattamento, sia all'esito. Errore dovuto alla presenza di una variabile di confondimento (fattore che confonde l associazione fra due fenomeni generando una associazione statistica che non è una relazione causale, definita relazione spuria) Esempio: in uno studio caso-controllo condotto per valutare l associazione tra cancro del colon e un attività lavorativa sedentaria sarebbe inappropriato controllare per la bassa attività fisica giacché essa rappresenta una conseguenza di quell attività lavorativa.

26 Determinazione i dll della NUMEROSITÀ OTTIMALE dl del campione: È la numerosità che permette alle stime che compiamo di raggiungere il livelloll di attendibilità dbl che ci attendiamo.

27 5% 2% 1% N n N n N n > 400 > >

28 Numerosità campionaria Dipende dalla variabilità insita nella variabile di studio Dipende dall errore che si accetta di commettere Dipende dal grado di fiducia che si vuole attribuire alla stima Non è importante la frazione di campionamento ma la numerosità del campione Es. Caso Literary Digest 1936 USA Landon-Roosvelt

29 Vantaggi del campionamento: Riduzione dei costi Rapidità Scopi specifici Accuratezza

30 Criteri di inclusione e di esclusione Nel leggere un rapporto di ricerca è necessario verificare se il ricercatore ha identificato i descrittori della popolazione che costituiscono le basi per: i criteri di inclusione (eleggibilità) e i criteri di esclusione (delimitazione) che sono i criteri utilizzati per selezionare il campione dall insieme di tutte le unità. I criteri di definizione della popolazione stabiliscono quella che sarà la popolazione target.

31 3 concetti correlati al tema del campionamento: 1. Eterogeneità: presenza di caratteristiche e qualità diverse nel campione, collegate alla variabilità degli atteggiamenti e dei comportamenti 2. Rappresentatività: si dice rappresentativo un campione che presenta alcune caratteristiche dell universo in proporzioni analoghe 3. Sufficienza: misura l attendibilità dei dati, ovvero la probabilità che essi siano validi per l universo entro certi termini statisticamente determinabili

32 Regole seguite per identificare le unità da inserire i nel campione : come si seleziona ogni singolo caso? Criterio costante: uguale per tutte le unità della lista Criterio variabile: se ad ogni unità viene assegnata una probabilità di selezione propria

33 Che cosa è possibile ottenere dai dati raccolti? - Verifica delle ipotesi di contenuto (cioè le ipotesi di rapporti tra le variabili): si rimane nell ambito dei risultati disponibili e tale verifica è valida soltanto per le unità di analisi considerate. valido per campioni NON PROBABILISTICI - Inferenze: si generalizzano i risultati dal campione all universo valido per campioni PROBABILISTICI

34 Campionamento - metodi

35 Campionamento probabilistico (remind) In statistica, si parla di campionamento probabilistico quando ogni soggetto o oggetto di cui è composta la popolazione ha una probabilità nota di essere incluso nel campione. Questo tipo di campione garantisce la rappresentabilità mentre dei campioni non probabilistici non si possono generalizzare i risultati di indagine. Infatti il campione probabilistico è quel campione i cui risultati possono essere estesi con un certo livello di fiducia (detto anche livello di confidenza) alla popolazione. In statistica il campionamento casuale corrisponde ad un'estrazione da una popolazione p distribuita secondo la sua legge (funzione di densità) di un determinato numero di individui/oggetti.

36 Campioni probabilistici Campioni casuali o probabilistici: sono regolati dalla legge del CASO, cioè della probabilità Si attribuisce ad ogni unità della popolazione p una determinata probabilità positiva di essere selezionata Si utilizzano tecniche per la selezione casuale del campione Il campionamento probabilistico consente al ricercatore di stimare la probabilità che ogni elemento della popolazione ha di essere selezionato

37 Campioni probabilistici La probabilità di selezionare i casi è nota Per costruire un campione probabilistico è indispensabile la conoscenza dell universo; devono essere note e disponibili le fonti (es. lista completa della popolazione) Le fonti possono anche definire universi settoriali Si possono costruire diversi tipi di campioni probabilistici a seconda del metodo di estrazione

38 Campionamento casuale semplice e Campionamento casuale sistematico Può essere estratto per sorteggio o per intervallo fisso (scegliendo un nominativo ogni tot da una lista e prevedendo eventuali sostituti), fino a raggiungere la numerosità desiderata. Il rapporto tra la numerosità dell universo e quella del campione dà la misura dell intervallo fisso da rispettare. È opportuno su popolazioni relativamente piccole, in un area ristretta, dove si può disporre di liste complete.

39 Campionamento casuale semplice E la più semplice tecnica di selezione di un campione; il procedimento è sostanzialmente simile allo schema di estrazione da un urna urna. Un campione casuale semplice è un campione in cui è già nota la probabilità che ogni individuo della popolazione ha di essere scelto. Nel campionamento casuale semplice si indica con n la dimensione del campione, ossia il numero di elementi del campione, e con N la dimensione della popolazione, ossia il numero di elementi della popolazione. La probabilità che ogni individuo della popolazione ha di essere scelto alla prima estrazione è 1/N. La selezione del campione può essere fatta in due modi: con reimmissione; senza reimmissione. Nel campionamento con reimmissione ciascun elemento della popolazione è disponibile ad ogni estrazione, quindi ad ogni estrazione ogni individuo ha sempre probabilità 1/N di essere estratto. tt In questo modo un individuo id può essere nuovamente estratto tt in una successiva estrazione. Nel campionamento senza reimmissione un individuo, una volta selezionato, non viene rimesso nella popolazione e non può più essere scelto di nuovo.

40

41 Campionamento sistematico Un altro tipo di campionamento è il campionamento sistematico. In questo caso si procede nel modo seguente. Data la popolazione di N individui e fissata la dimensione n del campione, si calcola il quoziente intero R/n=N. Si sceglie un numero k a caso (ad esempio da un urna) compreso fra 1 e R; si includono nel campione gli individui della lista che occupano iposti k, k+r, k+2r,... Esempio Da una popolazione di 1000 individui si vuole formare un campione di 50 individui; in questo caso N= 1000 n = R= 1000/50 Si sceglie un numero k a caso fra 1 e 20, sia ad esempio k = 15. Il campione sarà formato dagli elementi della lista che portano il numero 15, 35, 55, 75,... Se l elenco di tutti gli individui della popolazione è fatto in modo casuale, anche il campione sarà casuale. Se invece l elenco non è casuale rispetto alla variabile che si vuole studiare, il campione estratto può essere distorto. Il campionamento sistematico ti è più facile da eseguire, ma il suo uso acritico può portare con facilità a campioni affetti da errori sistematici; questo rischio non c è con il campionamento casuale semplice. In generale i risultati di un campionamento sistematico dipendono in larga misura dalle caratteristiche dell indagine che si vuole fare e dalla popolazione da cui si campiona.

42 Campionamento sistematico - esempio Volendo effettuare un indagine sulle abitudini alimentari di una popolazione p di studenti, scegliendone un campione di 3000, possiamo prendere i nati in un dato giorno del mese di un anno fissato. Se però si volesse usare lo stesso campione per studiare il quoziente di intelligenza, questo campione sarebbe distorto, perché il quoziente di intelligenza, come il campione, è influenzato dall età.

43 Se non abbiamo liste della popolazione N, possiamo costruire un campione sistematico? Sì, in alcuni casi, ad es.: exit polls, ricerche di mercato Regola: tutteleunitàdevonoaverelastessaprobabilità di essere g : p incluse nel campione, quindi l estrazione deve coinvolgere tutta la popolazione e non solo una parte. Es. tutti i clienti del CUP : la rilevazione deve durare per tutto l orario di apertura

44

45

46 Campionamento randomizzato stratificato (1) Un altro tipo di campionamento è il campionamento stratificato. E una delle tecniche di campionamento più famose e usate; consiste nel dividere gli N individui della popolazione in sottopopolazioni, o strati, sulla base di una caratteristica comune; nell estrarre poi un campione casuale semplice da ogni strato in modo indipendente, e nel riunire insieme i risultati dei singoli campionamenti per formare un unico campione dell ampiezza richiesta. Si mantiene l estra lestrazione casuale, ma si utilizzano una o più variabili stratificanti, tali da controllare meglio la rappresentatività dei casi selezionati. Questo metodo è più efficace perché assicura che gli individui della popolazione siano rappresentati adeguatamente nel campione; questo garantisce una maggior precisione ii nelle stime di dei parametri dll della popolazione.

47 Campionamento stratificato (2) Il ricorso alla stratificazione presuppone che si abbiano delle conoscenze sulla popolazione, in modo da poterla suddividere in strati, ad esempio classi di età, classi di reddito, ecc. La stratificazione consente di aumentare la precisione delle stime, senza comportare un aumento del numero totale di elementi del campione. Infatti la bontà dei risultati di un indagine campionaria dipende essenzialmente da due fattori: dimensione del campione; variabilità del fenomeno in esame. Quindi per aumentare la precisione dei risultati si può agire aumentando la dimensione del campione con conseguente aumento dei costi; se si pone il vincolo sul numero di elementi del campione, l unica possibilità per aumentare la significatività dei risultati della rilevazione è utilizzare un campionamento stratificato.

48 Il campione può essere proporzionale o non proporzionale. Il campione si dice stratificato proporzionale se riproduce la stessa composizione degli strati della popolazione Es. se operai, impiegati, i lavoratori autonomi eprofessionisti i sono rispettivamente il 35, 40, 15 e 10% della popolazione, costruiremo un campione di 1000 casi composto da 350 operai, 400 impiegati, ecc Invece, se sovra o sotto-rappresentiamo alcuni strati, otteniamo un campione stratificato non proporzionale. In questo caso, dovremo effettuare un operazione di ponderazione.

49 Campionamento stratificato - esempio Studio dell incidenza di una data patologia, che è influenzata dall età, in un gruppo di N individui. Con un campionamento semplice può accadere che il campione sia composto prevalentemente da giovanioda anziani. Se anziché applicare il campionamento casuale semplice all intera popolazione, si procede prima a una stratificazione degli individui secondo tre grandi classi di età (giovani, adulti, anziani) e poi si attua un campionamento semplice nell ambito di ciascuna classe, si ha la certezza che tutte e tre le categorie entrino a far parte del campione in modo equilibrato. L ampiezza del campione in ogni strato (non tutti gli strati hanno la stessa numerosità) può essere stabilità in vari modi diversi.

50 Campionamento a grappolo o a più stadi o cluster Nel campionamento a grappolo, gli N individui nella popolazione sono suddivisi in molti gruppi, detti grappoli (sottopopolazioni), in modo tale che ogni grappolo sia rappresentativo dell intera popolazione. Si estrae poi un campione casuale di grappoli e tutti gli individui di ciascuno dei grappoli selezionati sono inclusi nel campione. I grappoli possono essere definiti sulla base di raggruppamenti naturali, come quelli determinati dalle regioni, dalle città, o dalle famiglie. Il campionamento a grappolo può essere meno costoso del campionamento casuale semplice, soprattutto quando la popolazione sottostante è disseminata su una vasta area geografica. g Comunque, il campionamento a grappolo tende a essere meno efficiente sia del campionamento casuale semplice, che del campionamento stratificato, e si rende necessaria una dimensione complessiva del campione più grande per ottenere risultati precisi come quelli che si ottengono con altri procedimenti.

51 Campionamento a grappolo Si utilizza ad es. quando manca la lista completa delle unità della popolazione. Viene definito it sulla base di scelte e procedure successive, che passano per più stadi o fasi. Si individuano diverse unità (primarie, secondarie ) e si procede con estrazioni i successive

52 Campionamento a stadi o a grappoli o cluster popolazione composta da un numero elevato di soggetti 1 stadio: suddivisione dell intera popolazione p in gruppi omogenei (es. per comune di residenza) da cui si estraggono casualmente delle unità(es. un gruppo di comuni) A Stadi: al 2 stadio si estrae un campione di popolazione dalle unità estratte nel 1 stadio A Grappoli: al 2 stadio si estraggono tutte le unità del 1 stadio/grappolo

53 Es. ricerca sui medici di medicina generale Unità primaria: Ausl locale cui afferisce il medico Unità secondarie: i medici stessi Il campionamento si effettua in due stadi, cioè in due estrazioni successive. Primo: si estrae un campione di unità primarie (ad es. 100 aziende Ausl) Secondo: si estrae casualmente un numero di unità secondarie, cioè un numero di medici

54 Campione a grappolo Si utilizza quando la popolazione è naturalmente suddivisa in gruppi di unità contigue Ad es. le famiglie, le classi scolastiche, i ricoverati in ospedale, ecc. Campione a stadi e a grappolo si possono combinare: Es. Indagine multiscopo dell Istat sulle famiglie (a stadi: campione di comuni; a grappolo: campione di famiglie)

55

56

57

58 Campioni non probabilistici Seguono l orientamento di chi li costruisce; vengono costruiti senza conoscere la probabilità di estrazione dei casi Viene a mancare la conoscenza dell universo L inferenza non si può applicare I risultati sono validi solo per il campione

59 Campioni non probabilistici Gli schemi di campionamento non probabilistico prescindono dal principio di casualità e si basano su criteri soggettivi oppure oggettivi di scelta delle unità. La sezione delle unità della popolazione avviene esclusivamente in base alla capacità del ricercatore di interpretare le caratteristiche della popolazione e nel fare in modo che esse siano rispettate nel campione. Non è possibile applicare la teoria della probabilità per calcolare l errore campionario né quella dell inferenza per estendere i risultati campionari all intera popolazione.

60 Tipi di campione non probabilistico Di convenienza Propositivo o a scelta ragionata Per quote (anche detto stratificato non probabilistico) A palla di neve (a valanga)

61 Campionamento di convenienza E costruito in modo accidentale senza nessun criterio di base. Consiste nell utilizzo delle persone/oggetti più facilmente accessibili come soggetti di studio. E anche detto accidentale o a casaccio. Esempio 1: sondaggio elettorale telefonico. Si intervistano le prime 100 persone che rispondono al telefono (considerare orario ecc). Esempio 2: in un sondaggio di opinioni all'interno di una piccola azienda con 200 impiegati si vuole studiare la valutazione attribuita alla qualità dll della mensa.a questo scopo si decide di esaminare un campione composto da 20 persone. Per motivi di convenienza, si intervistano le prime 20 personechesipresentanoinsalamensa.questocriterioémoltopratico, in quanto non bisogna attendere l'arrivo di tutti i dipendenti; tuttavia, si esamineranno impiegati di livello più basso: i dipendenti più impegnati o comunque meno "affamati" non entreranno a far parte del campione. Questo campione, è dunque viziato da un errore sistematico.

62 Campionamento di convenienza Esempio 3: Tutti gli studenti iscritti al secondo anno o i primi 25 pazienti con una determinata diagnosi che si presentano pese oallaa Casa della asalute di Palombara ao aasabinaa E anche detto volontario. Esempio 4: Si vuole valutare l efficacia i di un nuovo vaccino contro l AIDS. Tutti i soggetti a rischio che volontariamente si presentano ai centri sieroprofilattici e che risultano sieronegativi vengono sottoposti alla vaccinazione.

63 Campionamento a scelta ragionata Le unità campionarie vengono scelte in modo razionale sulla base di alcune loro caratteristiche, e si utilizza quando l ampiezza del campione è limitata. Il ricercatore seleziona gli elementi sulla base della propria esperienza, facendo in modo di ottenere un campione rappresentativo della popolazione. Consiste nella scelta delle aree di analisi o delle unità campionarie in funzione della peculiarità del fenomeno da studiare e della sua presenza ritenuta dal ricercatore fortemente concentrata in tali aree o su tali unità. Esempio: in uno studio finalizzato a esaminare l esperienza di trapianto di midollo osseo, il campione propositivo è costituito da pazienti con cancro che hanno subito un intervento di trapianto autologo di midollo osseo a seguito di diagnosi di tumore

64 Campione di esperti Consiste nel ricorso a persone che, per la particolare attività che svolgono, sono a conoscenza di informazioni i i e notizie i su specifici i fenomeni; pertanto il loro coinvolgimento risulta indispensabile per stimare la dimensione e le caratteristiche del fenomeno stesso. Appare evidente quali e quante problematiche di natura statistica sono connesse ad indagini effettuate tramite testimoni privilegiati senza i quali, tuttavia, risulterebbe quasi impossibile dimensionare alcuni fenomeni e peculiari. E utilizzato nelle ricerche di tipo qualitativo (focus group). p q ( g p) Si distinguono: Opinion leader (figure socialmente influenti). Testimoni privilegiati (figure non socialmente importanti ma detentori di informazioni).

65 Campionamento per quote La procedura di selezione prevede i seguenti passi: la popolazione da campionare viene suddivisa in gruppi sulla base di determinate caratteristiche (ad es. anagrafiche), dai dati censuari o da altre fonti si ricava il peso percentuale di ciascuna classe. Il totale della numerosità del campione viene suddiviso tra le classi in modo da rispecchiare le proporzioni esistenti nella popolazione. La scelta delle unità da intervistare è demandata all intervistatore nell ambito delle quote assegnategli. Di fatto il campionamento per quote èsimilealcampionamento stratificato, ma la scelta delle unità, in ciascuno strato non è probabilistica è ciò comporta l assenza di stime corrette e causa una sottostima della varianza complessiva. D altro canto riduce le mancate risposte e ha costi molto più contenuti.

66 Campionamento per quote Ha la stessa logica del campionamento stratificato, ma le quote all interno di ciascuno strato sono selezionate dai ricercatori con criteri non probabilistici. Si ottiene definendo un dato numero di soggetti da campionare secondo certe variabili, o in base ad una quota fissa (100 infermieri, 100 medici, ecc) o mantenendo una certa proporzione tra universo e campione ( se in un ospedale ci sono 30% di medici e 70% di infermieri si cerca di mantenere la stesa quota nel campione ma la scelta nei singoli strati non rispetta leregolel dll dellaprobabilità). bbl Non essendo la scelta delle unità in ciascuno strato probabilistica, ciò comporta l assenza di stime corrette e causa una sottostima della varianza complessiva. Riduce però le mancate risposte e ha costi molto più contenuti.

67 Campionamento per quote Vantaggi non è richiesta una lista delle unità, non è necessario ricontattare tt un unità non rispondente, l intervistatore gode di ampia flessibilità e libertà nella scelta delle unità. Svantaggi gg la scelta delle persone da intervistare dipende totalmente dall intervistatore, l esigenza di raggiungere la quota può accrescere la durata media dell indagine.

68 Campionamento a valanga Anche detto a catena o a palla di neve E utilizzato nel caso la popolazione sia costituita da soggetti che tendono ad occultare la loro identità (omosessuali, prostitute ecc.) o sono di difficile reperibilità (clandestini ecc). Consiste nel selezionare i casi utilizzando le reti relazionali (sociali, culturali, politiche) di un gruppo di persone inizialmente contattate. Es. Indagine sugli immigrati senza permesso di soggiorno Si contatta un immigrato, lo si sottopone ad intervista e poi gli si chiede di indicare un altro immigrato di sua conoscenza disposto a rilasciare l intervista.

69 Campioni probabilistici Campioni non probabilistici Semplicità No Sì Rapidità No Sì Economicità No Sì Ipotesi di Sì Sì contenuto Analisi Sì No dell universo Rappresentatività Sì No Inferenza Sì No

70 Considerazioni conclusive Note di uso per la pianificazione un disegno campionario Adottare una strategia di campionamento testata, monitorata e validata. Considerare più disegni di campionamento alternativi e valutarli alla luce di informazioni disponibili quali censimenti, indagini precedenti, dati amministrativi o appositi studi pilota. Prevedere una certa flessibilità nel disegno in maniera da far fronte a necessità quali l aggiornamento delle probabilità di selezione o una riduzione della dimensione campionaria. Prevedere una rotazione del campione qualora si desideri fornire stime di variazioni efficienti e si voglia limitare il carico della rilevazione sulle unità statistiche. i Prevedere metodi per trattare il caso in cui alcune delle unità indagate si scoprano non appartenere allo stato loro assegnato o non rientrare nella classificazione loro attribuita. Considerare nella fase di disegno del campione anche problemi connessi agli errori di campionamento quali l impossibilità di contattare qualche unità, il contatto di unità non appartenenti alla popolazione (ad esempio un OSS dove ci si aspetta un infermiere) o il rifiuto a partecipare all indagine.

Statistica descrittiva e statistica inferenziale

Statistica descrittiva e statistica inferenziale Statistica descrittiva e statistica inferenziale 1 ALCUNI CONCETTI POPOLAZIONE E CAMPIONE Popolazione: insieme finito o infinito di unità statistiche classificate secondo uno o più caratteri Campione:

Dettagli

Teoria e tecniche dei test

Teoria e tecniche dei test Teoria e tecniche dei test Lezione 9 LA STANDARDIZZAZIONE DEI TEST. IL PROCESSO DI TARATURA: IL CAMPIONAMENTO. Costruire delle norme di riferimento per un test comporta delle ipotesi di fondo che è necessario

Dettagli

Indagine statistica. Indagine Totale Indagine Campionaria Fasi dell indagine

Indagine statistica. Indagine Totale Indagine Campionaria Fasi dell indagine 10/1 Indagine statistica Indagine Totale Indagine Campionaria Fasi dell indagine definizione degli obiettivi definizione delle unità e delle variabili da rilevare scelta del periodo di riferimento individuazione

Dettagli

CAMPIONAMENTO - ALCUNI TERMINI CHIAVE

CAMPIONAMENTO - ALCUNI TERMINI CHIAVE CAMPIONAMENTO - ALCUNI TERMINI CHIAVE POPOLAZIONE = qualsiasi insieme di oggetti (unità di analisi) di ricerca N = ampiezza della popolazione PARAMETRI = caratteristiche della popolazione [media, proporzione

Dettagli

PRINCIPI DI EPIDEMIOLOGIA E SORVEGLIANZA Orvieto, 22 marzo Maria Miceli

PRINCIPI DI EPIDEMIOLOGIA E SORVEGLIANZA Orvieto, 22 marzo Maria Miceli PRINCIPI DI EPIDEMIOLOGIA E SORVEGLIANZA Orvieto, 22 marzo 2006 Campionamento Maria Miceli Cos è il campionamento? Procedura attraverso la quale alcuni membri della popolazione sono selezionati come rappresentatitivi

Dettagli

Le indagini campionarie

Le indagini campionarie Le indagini campionarie: i principali schemi di campionamento Le indagini campionarie Il reperimento dei DATI STATISTICI attraverso una RILEVAZIONE è un operazione che ha dei COSTI, sia in termini di TEMPO

Dettagli

LA COSTRUZIONE DELLA BASE EMPIRICA B RELATIVAMENTE ALL UNITÀ DI ANALISI LA DEFINIZIONE OPERATIVA DELL OGGETTO

LA COSTRUZIONE DELLA BASE EMPIRICA B RELATIVAMENTE ALL UNITÀ DI ANALISI LA DEFINIZIONE OPERATIVA DELL OGGETTO LA COSTRUZIONE DELLA BASE EMPIRICA B RELATIVAMENTE ALL UNITÀ DI ANALISI LA DEFINIZIONE OPERATIVA DELL OGGETTO CONSISTE NELLO SPECIFICARE IL TIPO DI OGGETTO CUI E INTERESSATA L INDAGINE = L UNITA DI ANALISI

Dettagli

Alcuni concetti. Unità

Alcuni concetti. Unità Alcuni concetti Campionamento: il processo di selezione di un certo numero di unità da una popolazione di studio predefinita Popolazione di riferimento: l insieme totale, finito o infinito, degli elementi

Dettagli

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1 Campionamento La statistica media campionaria e la sua distribuzione 1 Definisco il problema da studiare: es. tempo di percorrenza tra abitazione e università Carattere: tempo ossia v.s. continua Popolazione:

Dettagli

CON O SENZA REIMMISSIONE

CON O SENZA REIMMISSIONE CAMPIONAMENTO Per una buona inferenza o induzione statistica, bisogna affrontare il problema del campionamento, ovvero del come raccogliere un campione della popolazione affinché la si possa studiare induttivamente.

Dettagli

Il Campionamento Statistico

Il Campionamento Statistico Il Campionamento Statistico Campionamento sistematico (1/2) Introdotto per ovviare ai costi elevati del campionamento casuale e semplice; richiede la selezione casuale soltanto

Dettagli

Distribuzioni campionarie. Antonello Maruotti

Distribuzioni campionarie. Antonello Maruotti Distribuzioni campionarie Antonello Maruotti Outline 1 Introduzione 2 Concetti base Si riprendano le considerazioni fatte nella parte di statistica descrittiva. Si vuole studiare una popolazione con riferimento

Dettagli

Campionamento La statistica media campionaria e la sua distribuzione

Campionamento La statistica media campionaria e la sua distribuzione Campionamento La statistica media campionaria e la sua distribuzione 1 Definisco il problema da studiare: es. tempo di percorrenza tra abitazione e università Carattere: tempo ossia v.s. continua Popolazione:

Dettagli

Pag. 1 di 9. Fabio Ostanello Dip. Scienze Mediche Veterinarie, Università di Bologna 13/09/ Tecniche di campionamento

Pag. 1 di 9. Fabio Ostanello Dip. Scienze Mediche Veterinarie, Università di Bologna 13/09/ Tecniche di campionamento - Tecniche di 1. Principi e metodi di Definizione di ed ambiti di applicazione. Vantaggi e svantaggi delle tecniche di. 2. Popolazione di riferimento e rappresentatività campionaria Criteri di definizione

Dettagli

Errori (o bias) negli studi epidemiologici

Errori (o bias) negli studi epidemiologici Errori (o bias) negli studi epidemiologici Errore casuale o random: sono i più pericolosi perché i più difficili da individuare e per questo motivo non è possibile tenerne conto in fase di analisi Variazione

Dettagli

Il campionamento. Storia del campionamento nelle scienze sociali

Il campionamento. Storia del campionamento nelle scienze sociali Il campionamento Storia del campionamento nelle scienze sociali 1895 (Congresso internazionale di statistica a Berna) : A.Kiaer campionamento ragionato al posto di indagini censuarie 1926 : A.Bowley: campionamento

Dettagli

Il Campionamento. La popolazione di riferimento

Il Campionamento. La popolazione di riferimento Il Campionamento La popolazione di riferimento La popolazione (o universo) di una ricerca è quell insieme dei casi che teoricamente costituiscono l oggetto di indagine e che hanno in comune almeno una

Dettagli

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta): ESERCIZIO 1 Una grande banca vuole stimare l ammontare medio di denaro che deve essere corrisposto dai correntisti che hanno il conto scoperto. Si seleziona un campione di 100 clienti su cui si osserva

Dettagli

Andrea Manganaro. Tecniche di campionamento a confronto per i sistemi di audit regionali

Andrea Manganaro. Tecniche di campionamento a confronto per i sistemi di audit regionali Andrea Manganaro Tecniche di campionamento a confronto per i sistemi di audit regionali Definizione del problema Le regioni finanziano ogni anno diverse attività tramite due fondi europei: il Fondo Europeo

Dettagli

Capitolo 7. Distribuzioni campionarie. Statistica. Levine, Krehbiel, Berenson

Capitolo 7. Distribuzioni campionarie. Statistica. Levine, Krehbiel, Berenson Levine, Krehbiel, Berenson Statistica Capitolo 7 Distribuzioni campionarie Insegnamento: Statistica Applicata Corsi di Laurea in "Scienze e tecnologie Alimentari" Unità Integrata Organizzativa Agraria,

Dettagli

standardizzazione dei punteggi di un test

standardizzazione dei punteggi di un test DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it standardizzazione dei punteggi di un test serve a dare significato ai punteggi che una persona ottiene ad un test, confrontando la

Dettagli

POPOLAZIONE CAMPIONE

POPOLAZIONE CAMPIONE CAMPIONAMENTO 1 POPOLAZIONE Insieme finito o infinito di unità legate da almeno una caratteristica comune, che consenta di stabilire un criterio di appartenenza alla popolazione stessa. Esempio Bambini

Dettagli

Analizzare in termini quantitativi significa basarsi su dati e non su idee o ipotesi

Analizzare in termini quantitativi significa basarsi su dati e non su idee o ipotesi Statistica La Statistica è una metodologia per l analisi quantitativa dei fenomeni collettivi, cioè fenomeni il cui studio richiede l osservazione di un insieme di manifestazioni individuali Analizzare

Dettagli

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI PSICOMETRIA Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI CAMPIONI INDIPENDENTI Campioni estratti casualmente dalla popolazione con caratteristiche omogenee Assegnazione

Dettagli

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con

Dettagli

Campione: parte della popolazione che si seleziona per l analisi.

Campione: parte della popolazione che si seleziona per l analisi. M. Garetto - Statistica 1 Campionamento Statistica descrittiva: si può definire come un insieme di metodi che comprendono: la raccolta la presentazione la caratterizzazione di un insieme di dati con lo

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

LE DISTRIBUZIONI CAMPIONARIE

LE DISTRIBUZIONI CAMPIONARIE LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria

Dettagli

STATISTICA SOCIALE - Corso di laurea in Scienze Turistiche Prova finale del 18 dicembre 2007 Compito A

STATISTICA SOCIALE - Corso di laurea in Scienze Turistiche Prova finale del 18 dicembre 2007 Compito A STATISTICA SOCIALE - Corso di laurea in Scienze Turistiche Prova finale del 18 dicembre 2007 Compito A Esercizio 1 La Tabella 1 riporta la distribuzione dei Comuni di una certa Provincia per numero di

Dettagli

STATISTICA ESERCITAZIONE

STATISTICA ESERCITAZIONE STATISTICA ESERCITAZIONE Dott. Giuseppe Pandolfo 1 Giugno 2015 Esercizio 1 Una fabbrica di scatole di cartone evade il 96% degli ordini entro un mese. Estraendo 300 campioni casuali di 300 consegne, in

Dettagli

LA COSTRUZIONE DELLA BASE EMPIRICA B RELATIVAMENTE ALL UNITÀ DI ANALISI LA DEFINIZIONE OPERATIVA DELL OGGETTO

LA COSTRUZIONE DELLA BASE EMPIRICA B RELATIVAMENTE ALL UNITÀ DI ANALISI LA DEFINIZIONE OPERATIVA DELL OGGETTO LA COSTRUZIONE DELLA BASE EMPIRICA B RELATIVAMENTE ALL UNITÀ DI ANALISI LA DEFINIZIONE OPERATIVA DELL OGGETTO CONSISTE NELLO SPECIFICARE IL TIPO DI OGGETTO CUI E INTERESSATA L INDAGINE = L UNITA DI ANALISI

Dettagli

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota) STATISTICA (2) ESERCITAZIONE 5 26.02.2014 Dott.ssa Antonella Costanzo Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota) Il responsabile del controllo qualità di un azienda che

Dettagli

Il campionamento statistico. prof. C.Guida

Il campionamento statistico. prof. C.Guida Il campionamento statistico prof. C.Guida Per determinare le caratteristiche fondamentali di una popolazione statistica non è sempre necessario analizzare tutta la popolazione, ma risulta sufficiente esaminare

Dettagli

Il campionamento e l inferenza. Il campionamento e l inferenza

Il campionamento e l inferenza. Il campionamento e l inferenza Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento

Dettagli

a) 36/100 b) 1/3 c)

a) 36/100 b) 1/3 c) Da un urna contenente 10 palline, di cui 6 bianche e 4 nere, si estraggono due palline. Determinare la probabilità del seguente evento E=«le due palline sono bianche» nel caso di estrazioni a) con rimbussolamento

Dettagli

Schema lezione 5 Intervalli di confidenza

Schema lezione 5 Intervalli di confidenza Schema lezione 5 Intervalli di confidenza Non centrerò quella barca, ne sono convinto al 95% COMPRENDERE: Significato di intervallo di confidenza Uso degli stimatori come quantità di pivot per stime intervallari

Dettagli

STATISTICA SOCIALE - Corso di laurea in Scienze Turistiche Prova finale del 18 dicembre 2007 compito B

STATISTICA SOCIALE - Corso di laurea in Scienze Turistiche Prova finale del 18 dicembre 2007 compito B STATISTICA SOCIALE - Corso di laurea in Scienze Turistiche Prova finale del 18 dicembre 2007 compito B Esercizio 1 La Tabella 1 riporta la distribuzione dei turisti che hanno soggiornato in una certa città

Dettagli

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07 PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 006/07 Esercizio 1 Prova scritta del 16/1/006 In un ufficio postale lavorano due impiegati che svolgono lo stesso compito in maniera indipendente, sbrigando

Dettagli

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo 1. Gli studi di simulazione possono permetterci di apprezzare alcune delle proprietà di distribuzioni campionarie ricavate

Dettagli

Esercizi riassuntivi di Inferenza

Esercizi riassuntivi di Inferenza Esercizi riassuntivi di Inferenza Esercizio 1 Un economista vuole stimare il reddito medio degli abitanti di una cittadina mediante un intervallo al livello di confidenza del 95%. La distribuzione del

Dettagli

Facoltà di Economia. francesco mola. I sondaggi e le inchieste. campionaria la cui realizzazione avviene secondo le

Facoltà di Economia. francesco mola. I sondaggi e le inchieste. campionaria la cui realizzazione avviene secondo le I sondaggi d opinione (polls) e le inchieste (surveys) Corso di Analisi di Mercato Facoltà di Economia francesco mola I sondaggi e le inchieste Un sondaggio rappresenta una particolare indagine campionaria

Dettagli

Giovanna Boccuzzo Dipartimento di Scienze Statistiche Università di Padova

Giovanna Boccuzzo Dipartimento di Scienze Statistiche Università di Padova La costruzione dei dati e la rappresentazione di informazione statistica Giovanna Boccuzzo Dipartimento di Scienze Statistiche Università di Padova Da dove provengono i dati statistici? Fonti esaustive

Dettagli

Gli errori nella verifica delle ipotesi

Gli errori nella verifica delle ipotesi Gli errori nella verifica delle ipotesi Nella statistica inferenziale si cerca di dire qualcosa di valido in generale, per la popolazione o le popolazioni, attraverso l analisi di uno o più campioni E

Dettagli

I disegni sperimentali e il controllo

I disegni sperimentali e il controllo I disegni sperimentali e il 1. Procedure del 2. Disegni monofattoriali 3. Disegni multifattoriali Il disegno sperimentale Popolazione Campionamento casuale Campione Misura variabili di interesse Gruppo

Dettagli

L indagine campionaria Lezione 5

L indagine campionaria Lezione 5 Anno accademico 2007/08 L indagine campionaria Lezione 5 Docente: prof. Maurizio Pisati Campionamento Il campionamento è l insieme delle operazioni finalizzate a generare il campione iniziale di una data

Dettagli

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo TOPOGRAFIA 2013/2014 L operazione di misura di una grandezza produce un numero reale che esprime il rapporto della grandezza stessa rispetto a un altra, a essa omogenea, assunta come unità di misura. L

Dettagli

Distribuzioni campionarie

Distribuzioni campionarie 1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari

Dettagli

Distribuzione Gaussiana - Facciamo un riassunto -

Distribuzione Gaussiana - Facciamo un riassunto - Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura

Dettagli

STATISTICA SOCIALE Corso di laurea in Scienze Turistiche - A.A. 2005/2006 II Prova - 20 dicembre 2005

STATISTICA SOCIALE Corso di laurea in Scienze Turistiche - A.A. 2005/2006 II Prova - 20 dicembre 2005 STATISTICA SOCIALE Corso di laurea in Scienze Turistiche - A.A. 2005/2006 II Prova - 20 dicembre 2005 Per verbalizzare l'esame: iscriversi ad uno degli appelli di gennaio-febbraio utilizzando il Servizio

Dettagli

Campionamento. Pag. 1 di 9. Fabio Ostanello - Facoltà di Medicina Veterinaria, Università di Bologna 03/11/2006

Campionamento. Pag. 1 di 9. Fabio Ostanello - Facoltà di Medicina Veterinaria, Università di Bologna 03/11/2006 Obiettivi Campionamento Che cosa è il Campionamento? Perchè utilizziamo i Campioni? Concetto di rappresentatività MetodidiCampionamento Errore di Campionamento Calcolo della dimensione del campione Definizione

Dettagli

L indagine campionaria Lezione 3

L indagine campionaria Lezione 3 Anno accademico 2007/08 L indagine campionaria Lezione 3 Docente: prof. Maurizio Pisati Variabile casuale Una variabile casuale è una quantità discreta o continua il cui valore è determinato dal risultato

Dettagli

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n. 5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema

Dettagli

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1 . Verifica di ipotesi: parte seconda.. Verifica di ipotesi per due campioni. Quando abbiamo due insiemi di dati possiamo chiederci, a seconda della loro natura, se i campioni sono simili oppure no. Ci

Dettagli

X Lezione Analisi della varianza Esempi e esercizi CPS - Corso di studi in Informatica II parte: Statistica

X Lezione Analisi della varianza Esempi e esercizi CPS - Corso di studi in Informatica II parte: Statistica Corso di Calcolo delle Probabilità e Statistica II Parte - STATISTICA X Lezione Analisi della varianza Esempi e esercizi 1 Argomenti della X Lezione Tests per il confronto di più medie: ANOVA Utilità e

Dettagli

QUANDO RACCOGLIERE DATI SU BASE CAMPIONARIA??

QUANDO RACCOGLIERE DATI SU BASE CAMPIONARIA?? QUANDO RACCOGLIERE DATI SU BASE CAMPIONARIA?? 1) QUANDO SI ESEGUE UNA SPERIMENTAZIONE PILOTA 2) QUANDO E IMPRATICABILE, PER MOTIVI PRATICI, ECONOMICI ecc... RACCOGLIERE DATI SULL INTERA POPOLAZIONE (ad

Dettagli

La Statistica: introduzione e approfondimenti

La Statistica: introduzione e approfondimenti La Statistica: introduzione e approfondimenti Definizione di statistica Che cosa è la statistica? La statistica è una disciplina scientifica che trae i suoi risultati dalla raccolta, dall elaborazione

Dettagli

zio L'INDAGINE CAMPIONARIA Metodi, disegni e tecniche di campionamento

zio L'INDAGINE CAMPIONARIA Metodi, disegni e tecniche di campionamento zio L'INDAGINE CAMPIONARIA Metodi, disegni e tecniche di campionamento B f F~ :_ ~ () ì E(.'.6.. CJ?.. E S T Luigi Fabbris L'indagine camp1onar1a Metodi, disegni e tecniche di campionamento La Nuova Italia

Dettagli

Statistica sociale Laurea specialistica in Progettazione e gestione del turismo culturale. Lezione 2. Metodologia della ricerca sociale

Statistica sociale Laurea specialistica in Progettazione e gestione del turismo culturale. Lezione 2. Metodologia della ricerca sociale Statistica sociale Laurea specialistica in Progettazione e gestione del turismo culturale Lezione 2 Metodologia della ricerca sociale Gianluca Dominutti 6. Il campionamento È un argomento che, per essere

Dettagli

Test d Ipotesi Introduzione

Test d Ipotesi Introduzione Test d Ipotesi Introduzione Uno degli scopi più importanti di un analisi statistica è quello di utilizzare i dati provenienti da un campione per fare inferenza sulla popolazione da cui è stato estratto

Dettagli

Relazione di fisica ESPERIMENTO N 1

Relazione di fisica ESPERIMENTO N 1 ISTITUTO SUPERIORE "B. RUSSELL" DI ROMA Relazione di fisica ESPERIMENTO N 1 1.TITOLO Misurazione indiretta della massa di un cilindretto metallico mediante i metodi della tara di J.C. Borda e della doppia

Dettagli

Capitolo 2 Le misure delle grandezze fisiche

Capitolo 2 Le misure delle grandezze fisiche Capitolo 2 Le misure delle grandezze fisiche Gli strumenti di misura Gli errori di misura Il risultato di una misura Errore relativo ed errore percentuale Propagazione degli errori Rappresentazione di

Dettagli

Università del Piemonte Orientale. Corso di Laurea in Igiene Dentale. Corso di Statistica per la ricerca sperimentale e tecnologica

Università del Piemonte Orientale. Corso di Laurea in Igiene Dentale. Corso di Statistica per la ricerca sperimentale e tecnologica Università del Piemonte Orientale Corso di Laurea in Igiene Dentale Corso di Statistica per la ricerca sperimentale e tecnologica Campionamento e distribuzione campionaria della media Corso di laurea triennale

Dettagli

Economia e Gestione delle Imprese

Economia e Gestione delle Imprese Economia e Gestione delle Imprese Facoltà di Scienze Politiche Corso di Laurea in Economia Prof. Marco Galdenzi Anno accademico 2013/14 LE RILEVAZIONI INTERNE ORDINE Produzione Magazzino Vendite Acquisti

Dettagli

Distribuzioni e inferenza statistica

Distribuzioni e inferenza statistica Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione

Dettagli

Disegni di studio nella ricerca epidemiologica

Disegni di studio nella ricerca epidemiologica Disegni di studio nella ricerca epidemiologica Dott. Pamela Di Giovanni Disegni epidemiologici La ricerca epidemiologica utilizza, per i suoi scopi, diverse strategie di studio che vengono distinte in

Dettagli

Alberi Decisionali Per l analisi del mancato rinnovo all abbonamento di una rivista

Alberi Decisionali Per l analisi del mancato rinnovo all abbonamento di una rivista Alberi Decisionali Per l analisi del mancato rinnovo all abbonamento di una rivista Il problema L anticipazione del fenomeno degli abbandoni da parte dei propri clienti, rappresenta un elemento fondamentale

Dettagli

1. Introduzione ai disegni sperimentali. 5. Analisi della regressione lineare. 6. Confronto tra proporzioni di due o più campioni indipendenti

1. Introduzione ai disegni sperimentali. 5. Analisi della regressione lineare. 6. Confronto tra proporzioni di due o più campioni indipendenti BIOSTATISTICA 1. Introduzione ai disegni sperimentali 2. Un carattere quantitativo misurato in un campione: elementi di statistica descrittiva e inferenziale 3. Confronto tra medie di due campioni indipendenti

Dettagli

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Intervalli di confidenza Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 10 Dicembre 2014 Stefania Spina Esercitazioni di statistica 1/43 Stefania Spina

Dettagli

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi Esercitazione 14 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 14 Ex.1: Verifica Ipotesi sulla media (varianza nota) Le funi prodotte da un certo macchinario hanno una

Dettagli

Indice: Strategie generali Strategie specifiche Ripetizione Metodi per aumentare la validità

Indice: Strategie generali Strategie specifiche Ripetizione Metodi per aumentare la validità Controllo Indice: Strategie generali Strategie specifiche Ripetizione Metodi per aumentare la validità Definiremo il controllo come qualsiasi mezzo impiegato per eliminare le possibili minacce alla validità

Dettagli

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE

Dettagli

Indagine Forze Lavoro a livello di SEL area livornese

Indagine Forze Lavoro a livello di SEL area livornese Comune di LIVORNO Comune di Collesalvetti Indagine Forze Lavoro a livello di SEL area livornese (Comuni Livorno e Collesalvetti) Impianto metodologico e principali stime Federico Giuntoli Resp. UCS Comune

Dettagli

Variabili e scale di misura

Variabili e scale di misura Variabili e scale di misura Statistica descrittiva e Analisi multivariata Prof. Giulio Vidotto PSY-NET: Corso di laurea online in Discipline della ricerca psicologico-sociale IL CAMPIONAMENTO Esempio:

Dettagli

Utilità delle rilevazioni campionarie

Utilità delle rilevazioni campionarie Il campionamento Utilità delle rilevazioni campionarie Lavorare su una parte anziché su tutto ha l indubbio vantaggio di risparmiare energie, denaro e sforzi organizzativi. Per questo la teoria dei campioni,

Dettagli

Principi di analisi causale Lezione 3

Principi di analisi causale Lezione 3 Anno accademico 2007/08 Principi di analisi causale Lezione 3 Docente: prof. Maurizio Pisati Approccio causale Nella maggior parte dei casi i ricercatori sociali utilizzano la regressione per stimare l

Dettagli

UNIVERSITÀ DEGLI STUDI DI PERUGIA

UNIVERSITÀ DEGLI STUDI DI PERUGIA SIGI, Statistica II, esercitazione n. 3 1 UNIVERSITÀ DEGLI STUDI DI PERUGIA FACOLTÀ DI ECONOMIA CORSO DI LAUREA S.I.G.I. STATISTICA II Esercitazione n. 3 Esercizio 1 Una v.c. X si dice v.c. esponenziale

Dettagli

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI

Dettagli

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA

Dettagli

Test di ipotesi su due campioni

Test di ipotesi su due campioni 2/0/20 Test di ipotesi su due campioni Confronto tra due popolazioni Popolazioni effettive: unità statistiche realmente esistenti. Esempio: Confronto tra forze lavoro di due regioni. Popolazioni ipotetiche:

Dettagli

Indice Aspetti generali sul campionamento da popolazioni finite Campionamento probabilistico Disegno campionario semplice

Indice Aspetti generali sul campionamento da popolazioni finite Campionamento probabilistico Disegno campionario semplice Indice 1 Aspetti generali sul campionamento da popolazioni finite.. 1 1.1 Rilevazionicensuarieerilevazionicampionarie... 1 1.2 Lineemetodologichediunarilevazionestatistica... 3 1.3 Popolazioni, etichette,

Dettagli

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Statistica inferenziale La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Verifica delle ipotesi sulla medie Quando si conduce una

Dettagli

Proprietà della varianza

Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Intermezzo: ma perché dovremmo darci la pena di studiare come calcolare la varianza nel caso di somme,

Dettagli

LA REVISIONE LEGALE DEI CONTI Metodologie

LA REVISIONE LEGALE DEI CONTI Metodologie LA REVISIONE LEGALE DEI CONTI Metodologie statistiche per l'esame delle voci Novembre 2013 Indice 1. Introduzione 2. Classificazione delle rilevazioni statistiche 3. Esame di tutte le voci 4. Esame di

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Stima Puntuale Prof. Livia De Giovanni statistica@dis.uniroma.it Esercizio In ciascuno dei casi seguenti determinare quale tra i due stimatori S e T per il parametro θ è distorto

Dettagli

Casa dello Studente. Casa dello Studente

Casa dello Studente. Casa dello Studente Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino

Dettagli

MISURE ANALITICHE MISURE ANALITICHE. η = x - θ. θ (valore vero) x (misura) ERRORE TOTALE. η 1 > 0

MISURE ANALITICHE MISURE ANALITICHE. η = x - θ. θ (valore vero) x (misura) ERRORE TOTALE. η 1 > 0 MISURE ANALITICHE MISURE ANALITICHE Il risultato di un operazione di misura è un numero reale (x), detto misura analitica che esprime il valore vero (). a) livello VERO di un indicatore biologico (valore

Dettagli

FISICA. Elaborazione dei dati sperimentali. Autore: prof. Pappalardo Vincenzo docente di Matematica e Fisica

FISICA. Elaborazione dei dati sperimentali. Autore: prof. Pappalardo Vincenzo docente di Matematica e Fisica FISICA Elaborazione dei dati sperimentali Autore: prof. Pappalardo Vincenzo docente di Matematica e Fisica LA MISURA GLI STRUMENTI DI MISURA Gli strumenti di misura possono essere analogici o digitali.

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.

Dettagli

Vedremo i concetti di:

Vedremo i concetti di: 1 Campionamento e distribuzioni campionarie Vedremo i concetti di: Popolazione e suoi parametri Campionamento da popolazioni finite Campionamento da popolazioni infinite Statistiche campionarie e loro

Dettagli

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni

Dettagli

L INDAGINE SUL BENESSERE ORGANIZZATIVO IN ARPA EMILIA-ROMAGNA LA SCELTA DEL CAMPIONE

L INDAGINE SUL BENESSERE ORGANIZZATIVO IN ARPA EMILIA-ROMAGNA LA SCELTA DEL CAMPIONE L INDAGINE SUL BENESSERE ORGANIZZATIVO IN ARPA EMILIA-ROMAGNA LA SCELTA DEL CAMPIONE 1 Premessa In questa presentazione viene descritta la procedura scelta per determinare le persone da coinvolgere nell

Dettagli

IL CAMPIONAMENTO NELLE SCIENZE SOCIALI

IL CAMPIONAMENTO NELLE SCIENZE SOCIALI IL CAMPIONAMENTO NELLE SCIENZE SOCIALI Metodi della ricerca sociale e di mercato Dott. Pietro Croci Università degli Studi di Teramo L inchiesta campionaria Esistono due modi per conoscere un fenomeno:

Dettagli

Seconda Parte Specifica per la tipologia di scuola - Statistica sanitaria e Biometria - 22/07/2016

Seconda Parte Specifica per la tipologia di scuola - Statistica sanitaria e Biometria - 22/07/2016 Domande relative alla specializzazione in: Statistica sanitaria e Biometria Scenario 1: In uno studio prospettivo condotto per valutare la relazione tra l'uso di estrogeni e rischio di cancro alla mammella,

Dettagli

ANALISI AFFIDABILITÀ SCALE

ANALISI AFFIDABILITÀ SCALE RICERCA CONGIUNTA NEL SETTORE DELLA MISURA DELLA SODDISFAZIONE DEGLI UTENTI DEI SITI E DEI SERVIZI ON LINE DELLE AMMINISTRAZIONI E PER LA PREDISPOSIZIONE DI UNO STRUMENTO DI RILEVAZIONE DELLA CUSTOMER

Dettagli

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento. N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume

Dettagli

ESPERIMENTO DISEGNO SPERIMENTALE CLASSICO. Requisiti

ESPERIMENTO DISEGNO SPERIMENTALE CLASSICO. Requisiti ESPERIMENTO INSIEME DI PROCEDURE LOGICHE E OPERATIVE SCHEMA OPERATIVO DI RACCOLTA E ANALISI DEI DATI DISEGNO SPERIMENTALE - ISPIRATO AL SISTEMA LOGICO-PROCEDURALE CHE PRESIEDE AL PROBLEMA DELL IMPUTAZIONE

Dettagli

Il confronto fra medie

Il confronto fra medie L. Boni Obiettivo Verificare l'ipotesi che regimi alimentari differenti non producano mediamente lo stesso effetto sulla gittata cardiaca Ipotesi nulla IPOTESI NULLA La dieta non dovrebbe modificare in

Dettagli

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE 1 STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono

Dettagli

MISURAZIONE. Sistema empirico (SE): ciò che si vuole misurare; costituito da elementi legati tra loro da relazioni

MISURAZIONE. Sistema empirico (SE): ciò che si vuole misurare; costituito da elementi legati tra loro da relazioni Attendibilità Misurazione I problemi di misurazione degli oggetti di studio sono comuni a tutte le discipline scientifiche. In psicologia il problema è solo più evidente, non più grave. I costrutti che

Dettagli