I SONDAGGI DI OPINIONE. La necessità di una teoria dei campioni

Documenti analoghi
Teoria e tecniche dei test

Concetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2016/2017. Giovanni Lafratta

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5

Questo calcolo richiede che si conoscano media e deviazione standard della popolazione.

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

Distribuzioni campionarie. Antonello Maruotti

Test di ipotesi. Test

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3

05. Errore campionario e numerosità campionaria

LE DISTRIBUZIONI CAMPIONARIE

Esercizi di Probabilità e Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Corso di Psicometria Progredito

DISTRIBUZIONI DI CAMPIONAMENTO

Il campionamento e l inferenza. Il campionamento e l inferenza

Imputazione dati mancanti

Il Test di Ipotesi Lezione 5

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica

La progettazione di un indagine statistica

Corso di Statistica Esercitazione 1.8

Cap. 7 Distribuzioni campionarie

Esempio (Azzalini, pp. 6-15)

Distribuzioni campionarie

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari"

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo

Elementi di base su modello binomiale e modello normale

Statistica Sociale e Criminale (12 CFU) A.A. 2015/2016

L indagine campionaria Lezione 3

Schema lezione 5 Intervalli di confidenza

Il confronto fra medie

La verifica delle ipotesi

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):

La probabilità matematica

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1

CON O SENZA REIMMISSIONE

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

Tipi di variabili. Indici di tendenza centrale e di dispersione

standardizzazione dei punteggi di un test

Statistica Inferenziale

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3

Esercizi su variabili aleatorie discrete

3.1 La probabilità: eventi e variabili casuali

Alcune v.a. discrete notevoli

Proprietà della varianza

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4

ESAME. 9 Gennaio 2017 COMPITO B

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Stima puntuale di parametri

Statistica Inferenziale

Il Campionamento Statistico

Principali procedimenti di campionamento casuali 1

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

Elementi di Psicometria con Laboratorio di SPSS 1

Statistica Metodologica

Gli errori nella verifica delle ipotesi

Contenuti: Capitolo 14 del libro di testo

Ψ PSICOMETRIA. Corso di laurea triennale (classe 34) STATISTICA INFERENZIALE

Statistica Matematica A - Ing. Meccanica, Aerospaziale II prova in itinere - 2 febbraio 2005

Calcolo della probabilità

I disegni sperimentali e il controllo

Sperimentazioni di Fisica I mod. A Statistica - Lezione 3

Le variabili casuali o aleatorie

4. Si supponga che il tempo impiegato da una lettera spedita dall Italia per arrivare a destinazione segua una distribuzione normale con media

Domande di teoria. Esercizi

Statistica Inferenziale

Statistica descrittiva e statistica inferenziale

Dispensa di Statistica

STATISTICA ESERCITAZIONE 13

STATISTICA ESERCITAZIONE

Analizzare in termini quantitativi significa basarsi su dati e non su idee o ipotesi

Fondamenti di Psicometria. La statistica è facile!!! VERIFICA DELLE IPOTESI

Elementi di Psicometria con Laboratorio di SPSS 1

STATISTICA. Esercizi vari

TEST n La funzione di ripartizione di una variabile aleatoria:

Test di ipotesi su due campioni

Stima diretta della domanda di trasporto

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo

LA REVISIONE LEGALE DEI CONTI Metodologie

Misure Meccaniche e Termiche. punti massa. Valore atteso: Varianza:

Statistica Capitolo 1 Perchè h st d u i diare la st ti a sti? ca Cap. 1-1

Un esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione

Test delle Ipotesi Parte I

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

Modelli probabilistici variabili casuali

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

Statistica Inferenziale

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)

Il modello di regressione lineare multipla con regressori stocastici

LEZIONI DI STATISTICA MEDICA

Distribuzione Gaussiana - Facciamo un riassunto -

Quanti soggetti devono essere selezionati?

STATISTICA A K (60 ore)

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

un elemento scelto a caso dello spazio degli esiti di un fenomeno aleatorio;

Esercitazioni di Statistica

STIMA DELLA VARIANZA CAMPIONARIA

lezione 8 AA Paolo Brunori

Transcript:

I SONDAGGI DI OPINIONE La necessità di una teoria dei campioni

1. Le credenziali del campione Le molte, a volte moltissime, informazioni che solitamente provengono da una indagine campionaria, anche di piccola dimensione, inducono spesso ad essere poco attenti alle caratteristiche o credenziali del campione stesso. Tuttavia le credenziali di un campione,cioè il modo in cui è stato costruito, non solo sono importanti per l'interpretazione dei risultati ma, in via di principio, sono le sole informazioni che possiamo assegnargli per qualificarlo.

L'idea di campionamento Tutti, nella vita quotidiana, abbiamo familiarità con questo concetto: al mercato, si campiona a colpo d'occhio la qualità della frutta che intende acquistare è considerando il comportamento di coloro che abbiamo conosciuto in passato, che scegliamo quali altre persone preferiamo conoscere.

Il concetto di distorsione Assenza di distorsione e presenza di affidabilità sono le credenziali che richiediamo ai campioni di tutti i giorni e, in termini più specifici, anche al campionamento statistico Quindi occorre definire le credenziali del campione in modo scientifico e per questo ci serve una teoria dei campioni

Quando estraiamo un campione Il problema sta tutto nel decidere come selezionare il campione da una data popolazione. se non facciamo attenzione alla scelta del metodo di campionamento, non v'è alcuna speranza di fare affermazioni sulla popolazione, attraverso i risultati del campione, con un reale fondamento scientifico.

2. La distorsione campionaria Se volessi campionare 10 studenti nella mia aula, la via più rapida forse consisterebbe nello scegliere 10 studenti nella prima fila. Se, ad esempio, fossi interessato alla loro statura media, questo procedimento risulterebbe opinabile.

Conoscendo altre caratteristiche della popolazione, potremmo fare tutti in necessari confronti per verificare quanto il nostro procedimento di estrazione sia distorto, ma non potremo mai sapere tutto sulla popolazione: in tal caso perché campionare? Quindi con qualsiasi procedimento di estrazione "ragionato" rischiamo di estrarre sistematicamente campioni distorti in relazione a tutti i caratteri non noti in popolazione e, in particolare, per quelli che stiamo investigando.

In pratica, non conosciamo quale distorsione (diretta o recondita) possa introdursi nella procedura campionaria Infatti nel campionamento non è mai sufficiente aver individuato una fonte di distorsione Dobbiamo assicurarci che col nostro metodo non possa sorgere alcuna possibilità di distorsione o almeno per le variabili di nostro interesse.

Inoltre, lo stesso campione non può mai dirci se il procedimento che lo ha determinato era libero da distorsione: anche un metodo distorto potrebbe dare esiti corretti. Dobbiamo controllare il procedimento di selezione se vogliamo eliminare il sospetto di una distorsione da selezione.

Per,assicurarci di tutto questo impieghiamo un meccanismo casuale per selezionare il campione. Ogni campione scelto con un meccanismo casuale con probabilità note di selezione viene detto un campione casuale. Le probabilità di selezione non devono essere uguali per tutti i campioni, ma devono essere note. Per definizione un campione casuale è scevro da errore di selezione, cioè dagli errori dovuti ad scelta sistematicamente errata del campione di cui appunto stiamo ora discutendo.

3. Il campione casuale semplice È un campione scelto per mezzo di una lotteria che assegna ad ogni unità della popolazione la stessa probabilità far parte del campione. Il CCS è privo di distorsione da selezione: Non v'è alcuna ragione in base alla quale un particolare campione (gli studenti in prima fila) debba venir scelta piuttosto che un altro

3. Il campione casuale semplice Quando si delega la scelta ad un meccanismo aleatorio, non si sfugge al problema di una scelta campionaria senza alcuna distorsione. Si fa esattamente quello che occorre, cioè assicurare che a nessuna umana inclinazione o pregiudizio (conscio o inconscio) venga permesso di inquinare la scelta del campione, scelta che quindi diventa libera da ogni fonte di interesse e distorsione

Il parodosso centrale Esiste un curioso e apparente paradosso nella teoria dei campionamento, secondo cui è impossibile conoscere, dall'esame del campione stesso, se esso sia o meno un «buon» campione, nel senso d'essere scevro da distorsioni di selezione Allo stesso modo di come non si possono dedurre le credenziali di un testimone dal suo aspetto

Il paradosso centrale comporta che lo stesso campione vada considerato differentemente a seconda che sia stato o meno selezionato con un procedimento libero da distorsioni «Ogni campione di 10 studenti ha la stessa probabilità di venire estratto come qualsiasi altro se selezioniamo sulla base di un procedimento casuale. Si selezionino, allora, 10 studenti nella prima fila. Non sono un campione tanto verosimile quanto qualsiasi altro? Quale possibile obiezione si può fare a un simile procedimento?».

Un campione casuale semplice può essere sospetto solo se il procedimento di campionamento è sospetto: dopo tutto esso non è che il semplice prodotto del procedimento. Ciascuna caratteristica di distorsione che possiamo indicare per il campione in realtà non è altro che una caratteristica del procedimento che lo ha generato.

La virtù del campionamento casuale sta più nella sua promessa (di imparzialità fra le unità estratte e quindi fra i campioni) e meno nel suo risultato occasionale (l'effettivo campione che si produce in una particolare situazione)

4. Un esempio di CCSSR La popolazione è composta da 6 individui: A, B, C, D, E, F a cui rileviamo la statura Y A, Y B, Y C, Y D, Y E, Y F Si vuole stimare la statura media con un campione di 2 elementi: y 1 e y 2, NB: per quanto poco reali possano apparire questi numeri, nessun punto viene a perdere di validità rispetto ad esempi con valori reali

A, B, C, D, E, F Y*= 1,72; 1,76; 1,78; 1,80; 1,80; 1,82 Y=Y*-170 Y A =2, Y B =6, Y C =8, Y D =10, Y E =10, Y F =12 La loro media, che stiamo cercando di stimare, vale esattamente 8 (vale a dire l'altezza media nella popolazione è 1,70+8).

Ora, qualunque tipo di selezione impiegato, ci sono soltanto 15 campioni possibili di 2 valori Ogni procedura di selezione che dà ad ogni possibile campione da 1 a 15 la stessa probabilità di venir scelto, come il CCSSR, è corretta La selezione campionaria distorta consiste nel favorire, in modo occulto, uno o più di questi possibili campioni. Ciò nonostante, esiste sempre la possibilità che anche un campionamento casuale produca un campione estremo.

Vediamo che nell universo dei 15 campioni possibili la media più frequente è 9, non 8. Inoltre esistono almeno tre campioni con media assai diversa dalla media di popolazione (4,11,11 contro 8) La media campionara si definisce statistica quella in popolazione parametro Appurato che il CCSSR non produce una selezione campionaria, ovvero non è un sistema di estrazione distorto, è possibile che la statistica media campionaria introduca una successiva forma di distorsione rispetto al paramentro media di popolazione?

Definizione di valore atteso e distorsione dello stimatore

Verifichiamo empiricamente la correttezza dello stimatore media campionaria

Il valore atteso e affidabilità dello stimatore

Calcoliamo empiricamente la varianza della variabile aleatoria media campionaria

Con il CCSSR ciascuno dei 15 campioni ha la stessa probabilità di presentarsi, avremo quindi: 2 possibilità su 15 (13%) di avere distanza nulla tra la media nel campione e la media effettiva (8) in popolazione 7 su 15 (47%) di avere la distanza 0 oppure 1, cioè entro la distanza 1 11 su 15 (73%) di essere entro la distanza 2 14 possibilità su 15 (93%) essere entro la distanza 3

Conclusione Quanto più chiediamo di avvicinarci al vero valore da stimare, tanto minore diventa la possibilità che questa richiesta sia soddisfatta, persino con il migliore piano di campionamento possibile Nella stima campionaria precisione e certezza sono antagoniste. Quanto più desideriamo essere sicuri delle nostre affermazioni tanto meno dobbiamo chiedere: siamo sicuri quando siamo poco precisi

Suggerimento Ricordate un sondaggio in cui si sia parlato di precisione e certezza dei risultati?