Utilità delle rilevazioni campionarie

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Utilità delle rilevazioni campionarie"

Transcript

1 Il campionamento

2 Utilità delle rilevazioni campionarie Lavorare su una parte anziché su tutto ha l indubbio vantaggio di risparmiare energie, denaro e sforzi organizzativi. Per questo la teoria dei campioni, che è la scienza che detta le regole per determinare su quale parte dei collettivi lavorare, si è molto sviluppata nel tempo, al punto che oggi si fa un numero di censimenti (l opposto dei campioni perché si analizzano i dati dell intero collettivo) di gran lunga inferiore al numero di sondaggi, in ogni campo applicativo. Oltre ad essere più costosi, i censimenti hanno la controindicazione che sono molto complessi da organizzare, specie su collettivi estesi. Talvolta non è proprio possibile controllare che tutte le unità del collettivo vengano prese in considerazione. Inoltre un censimento può necessitare di tempi di realizzazione molto lunghi. D altra parte i campioni pongono altri tipi problemi, legati alla loro effettiva affidabilità, materia questa che è oggetto di studio ed è argomento della teoria dei campioni.

3 Utilità delle rilevazioni campionarie Gli studi sulla popolazione, le abitazioni, le attività economiche, ecc. potrebbero essere effettuati in entrambi i modi (campionario o censuario), ma ci sono altri settori disciplinari, soprattutto in campo sperimentale, in cui non si può prescindere dall osservazione parziale dei collettivi. Ad esempio nella biologia, nella medicina, nella sperimentazione di farmaci, nel controllo della qualità dei prodotti, ecc. può essere osservata solo una parte del collettivo. Esempio: Supponiamo di voler controllare l effetto di un farmaco contro un placebo. Si seleziona un numero di pazienti, tutti affetti da una patologia curabile con quel farmaco, e si sottopone ciascuno o alla vera e propria cura con il farmaco in sperimentazione oppure il placebo. Alla fine si confrontano i risultati ottenuti e si stabilisce se il farmaco ha avuto un effetto significativamente maggiore del placebo. In questo caso non è possibile eseguire la sperimentazione con la tecnica censuaria, perché non si potrà mai avere a disposizione tutta la popolazione affetta da una patologia, sia per la reale difficoltà a reperire i pazienti, sia perché alcuni pazienti possono non sapere di avere quella patologia e non essere conteggiati nel collettivo. In ogni caso una sperimentazione su tutto il collettivo dei pazienti sarebbe troppo costosa e rischiosa, nel caso il farmaco non fosse adeguato.

4 Utilità delle rilevazioni campionarie Fare un campione vuol dire scegliere delle unità dal collettivo di partenza, che viene detto universo di riferimento, anche detto popolazione di riferimento, in modo che il campione ottenuto sia in miniatura uguale alla popolazione da cui è estratto. Il senso di questa uguaglianza è tutto da chiarire e, soprattutto, difficile da ottenere. Intendiamo con uguaglianza la presenza, sia nell universo, sia nel campione, di alcune caratteristiche nelle unità statistiche con la medesima proporzione. Può definirsi campione ogni sottoinsieme di una popolazione estratto con un procedimento proprio della teoria dei campioni. Un campione dovrebbe essere rappresentativo della popolazione e questo vuol dire che esso può rappresentare gli stessi fenomeni che si possono rilevare sulla popolazione.

5 Utilità delle rilevazioni campionarie La rappresentatività si può ottenere tenendo sotto controllo, nella fase di estrazione del campione, alcune caratteristiche ritenute importanti ed eseguendo la scelta delle unità di campionamento in modo casuale. In tal caso le stime ottenute sul campione sono uguali a quelle che si otterrebbero sulla popolazione a meno di un errore dovuto alla casualità, di cui si può calcolare la probabilità. Il passaggio da una stima ottenuta sul campione ad una sulla popolazione è detto induzione. Un campione sarà tanto più affidabile, quanto più sarà grande rispetto alla popolazione di riferimento (frazione di campionamento= rapporto tra numerosità campionaria e numerosità dell universo di riferimento) e quanto minore sarà la variabiltà nella popolazione dei caratteri oggetto dello studio.

6 Frazione di campionamento Esempio: Supponiamo di avere un universo di 4 unità su cui si voglia rilevare una certa misura in cm in modo campionario. Supponiamo che le unità misurino rispettivamente: a=10, b=12, c=15, d=16. La misura media è dunque pari a ( )/4=53/4=13,25. Consideriamo un campione di una unità (frazione di campionamento = ¼=0,25), supponiamo l unità b. La stima fornita da b è 12 un po differente dalla vera media dell universo che è 13,25. Le altre stime sarebbero 10, 15, 16, un valore compreso tra 10 e 16 Facciamo poi un campione di due unità (frazione di campionamento = 1/2=0,5), supponiamo a=10 e c=15. La stima fornita da essi è Se il campione di due unità fosse a=10 e d=16, la stima sarebbe di 13. Le altre stime sarebbero: 11; 13,5; 14; 15,5, un valore compreso tra 11 e 15,5 Supponiamo ora di fare un campione di 3 unità (frazione di campionamento = 3/4=0,75), a, b, c. La stima è 12,3. Per gli altri sarebbe 12,7; 13,7; 14,3, un valore compreso tra 12,3 e 14,7. Un campione di 4 unità sarebbe uguale all universo con una media uguale a quella dell universo. Dunque, maggiore è la frazione di campionamento, più attendibile è la stima della media. Notiamo però, che sempre in termini probabilistici parliamo. Infatti il campione di tre unità con una media di 14,3 è peggiore del campione di due unità con una media di 13,5.

7 Variabilità La teoria dei campioni ci aiuta a ridurre più possibile la variabilità dei risultati, in modo che le stime proposte siano più possibile attendibili. L errore di campionamento comunque è sempre presente, ma va distinto da un altro tipo di errore, che è quello insito nella misura del carattere nell unità statistica, che è presente anche nelle rilevazioni censuarie e che va ridotto più possibile. In verità, la maggiore possibilità di ridurre questo tipo di errore sta proprio nelle rilevazioni campionarie che, essendo più gestibili perché richiedono sforzi ridotti, consentono una accuratezza nella rilevazione dei dati che non può sempre essere presente nelle rilevazioni censuarie.

8 Variabilità Esempio: Supponiamo di avere un universo di 5 unità su cui si voglia rilevare una certa misura in cm in modo campionario con un campione di 3 unità. Supponiamo che le unità misurino rispettivamente: a=100, b=100, c=110, d=120, e=150. La misura media è dunque pari a ( )/5=580/5=116. I possibili campioni di tre unità che posso ottenere da queste 5 unità sono le combinazioni senza ripetizione di classe 3: C 5,3 =5!/(3!*2!)=(5*4*3*2*1)/(3*2*1 * 2*1)=10. Consideriamo qualche esempio di questi 10 campioni. a b c media = 103,3 a c e media = 120 c d e media = 126,7 b c d media = 110 a b e media = 116,7 Nessuno di essi ha fornito un valore della media esattamente uguale alla media dell universo di riferimento, ma alcuni si sono avvicinati di più.

9 Variabilità Esempio: Supponiamo che l universo a disposizione sia sempre di 5 unità e il campione di ancora di 3 unità, ma le misure su ciascuna unità siano le seguenti: a=100, b=100, c=110, d=110, e=110. La misura media è dunque pari a ( )/5=530/5=106. Consideriamo gli stessi campioni precedenti e le loro medie campionarie. a b c media = 103,3 a c e media = 106,7 c d e media = 110 b c d media = 110 a b e media = 106,7 Nessuno di essi, ancora una volta, ha fornito un valore della media esattamente uguale alla media dell universo di riferimento, ma stavolta si sono avvicinati tutti di più. Come mai? Notiamo che la varianza nel primo universo era pari a 344 mentre nel secondo è 24.

10 Utilità delle rilevazioni campionarie Non bisogna però pensare che le rilevazioni campionarie siano inefficaci. E dimostrato nella pratica, che molto spesso esse sono molto accurate e, visti i vantaggi che presentano rispetto alle rilevazioni censuarie, possono essere addirittura migliori di esse. Ci sono casi in cui si può verificare quasi immediatamente l accuratezza delle stime fornite. E il caso delle elezioni politiche e amministrative che ci consentono di verificare l errore commesso stimando i risultati con l uso di exit poll (letteralmente sondaggio all uscita ). Tali stime vengono sempre corredate da forchette tanto più ampie quanta maggiore è l incertezza su quella stima. Questo è un esercizio di campionamento particolarmente difficile, sia perché le stime su base nazionale devono tenere conto della complessità della legge elettorale che non rende eletto direttamente chi ha preso più voti, ma tutto dipende da regole di composizione delle liste sul territorio.

11 Utilità delle rilevazioni campionarie Inoltre c è da tenere in considerazione anche sia fenomeno di rifiuto a rispondere, per via della delicatezza della materia trattata, che della risposta non veritiera. E da notare anche che in questo particolare caso è richiesta una precisione notevole, non ottenibile generalmente con le stime campionarie, in quanto anche un decimale di differenza potrebbe rendere vincitore uno o l altro candidato, per cui questo particolare campo di applicazione è veramente di difficile approccio. Nonostante ciò, le tecniche di stima dei risultati delle consultazioni elettorali danno risultati piuttosto attendibili. Il fenomeno del rifiuto a rispondere è di particolare importanza perché si può pensare che chi non vuole rispondere potrebbe essere differente da chi risponde con sollecitudine. Un campione costituito solo da quest ultimo tipo può essere distorto, cioè dare stime sistematicamente errate.

12 Utilità delle rilevazioni campionarie Di fronte ad una caduta, cioè al fatto di non riuscire a raccogliere un dato durante un sondaggio (i motivi possono essere molteplici: assenza dell intervistato, dato di contatto errato, rifiuto o impossibilità dell intervistato di rispondere, ecc.) ci si può comportare in diversi modi: si continua il sondaggio con altri contatti scelti a caso si continua il sondaggio con altri contatti che abbiano caratteristiche analoghe a quello caduto si indaga quanto più è possibile sui motivi della mancata risposta per cercare di capire quanto poteva essere diverso il non-rispondente dai rispondenti al fine di limitare più possibile l errore da cui possono essere affette le stime campionarie.

13 Utilità delle rilevazioni campionarie Ma le possibili fonti di errore sistematico delle stime possono anche derivare dalla modalità con cui vengono selezionate le unità di rilevazione. Un sondaggio telefonico effettuato tramite telefono fisso, raggiunge le sole famiglie dotate di tale collegamento telefonico che sono ormai, secondo l AGCOM, il 60% delle famiglie. Un sondaggio effettuato sui mezzi pubblici per intervistare i pendolari che vanno a lavoro, considera solo coloro che percorrono un certo tratto ad una certa ora, non tutti i pendolari. Di questi fatti si deve tenere presente quando si progetta un indagine campionaria, perché ciascuno di essi è fonte di errore sistematico nelle stime. La progettazione dell indagine prende nome di piano di campionamento e comprende tutte le decisioni, le azioni, le risorse disponibili per effettuare l indagine.

14 Utilità delle rilevazioni campionarie Più il piano di campionamento è accurato, maggiore sarà l attendibilità dell indagine, minore sarà il rischio di errore sistematico e di distorsione delle stime, in altri termini, di errore non campionario. Mentre dell errore campionario possiamo dare una probabilità che sia minore di una certa quantità, di quello non campionario non possiamo dare misure. Per questo è importante che sia ridotto quanto più è possibile. In alcune indagini ISTAT sui consumi delle famiglie, si è potuto stimare che a fronte di un rifiuto a rilasciare l intervista da parte del 15% dei contattati, si è ottenuta una sovrastima dei consumi non alimentari del 10% e di quelli alimentari compresi tra il 2% e l 11%. Questo fenomeno si è manifestato perché chi si è rifiutato di rispondere aveva uno stile di vita, e un conseguente livello di consumi, inferiore al resto del campione. Ovviamente generalmente queste stime sono quasi impossibili da realizzare e l errore non campionario è ignoto.

15 Tipi di campionamento Campionamento casuale semplice Il tipo di campionamento più semplice, ma solo dal punto di vista matematico, è quello casuale semplice. Se si ha un universo composto da N unità statistiche, tutte numerate e poste in una lista, un campione casuale semplice consiste nell estrazione casuale di n di tali unità. Ad esempio, si potrebbero avere N palline in un urna da cui si estraggono n palline per formare un campione casuale semplice. Ad ogni estrazione la pallina non viene rimessa nell urna cosicché non può più essere estratta (campionamento senza ripetizione o in blocco). Se invece la pallina si reinserisce nell urna per essere ancora tra quelle estraibili, si parla di campione bernoulliano, o con ripetizione.

16 Tipi di campionamento Campionamento casuale semplice Nella pratica sono molto rari i casi in cui si dispone di una lista delle unità di rilevazione. Se ad esempio l unità di rilevazione è ciascun individuo residente in Italia, si può fare riferimento alle liste anagrafiche della popolazione residente. Fino a pochi anni fa, però, tali liste erano suddivise per comune, e, all interno del comune, per sezione elettorale, quindi non esisteva una lista unica nazionale da cui estrarre un campione casuale semplice. Oggi tale lista è disponibile. Supponendo comunque di avere la lista delle unità statistiche di rilevazione, si presenta il problema di come prenderle a caso. Quasi mai si può fare riferimento all urna, che sarebbe perfetta per l estrazione casuale, ma è adatta solo a piccoli universi di riferimento.

17 Tipi di campionamento Campionamento casuale semplice Fino a qualche tempo fa si faceva ricorso alle tavole dei numeri aleatori, tavole di numeri costituite da sequenze casuali di cifre comprese tra 0 e 9 (utilizzando alcune cifre estratte nel gioco del lotto in una successione temporale di estrazioni per garantire la casualità). Tali tavole davano numeri presi a caso che potevano essere usati per individuare a caso un unità statistica compresa in una lista. Oggi si usano funzioni automatiche di generazione di numeri casuali basate su funzioni matematiche (numeri pseudo-casuali che dipendono dal punto di partenza delle funzioni). I campioni con ripetizione non trovano facile applicazione nelle scienze sociali. Quando però la frazione di campionamento è piccola e quindi è raro il caso di trovare due volte la stessa unità nel campione, possono essere usati al posto di quelli in blocco o senza ripetizione.

18 Tipi di campionamento Campionamento casuale semplice In questo modo si può sfruttare la maggiore semplicità di alcune notazioni matematiche tipiche di questo tipo di campionamento. Nel campionamento casuale semplice tutte le unità hanno la stessa probabilità di essere incluse nel campione (probabilità di inclusione) ed è sufficiente averne una lista in qualche forma per poter realizzare il campione. I limiti principali consistono nel fatto che esistono altri tipi di campioni con la stessa attendibilità dei risultati (precisione delle stime) ma meno costosi e inoltre non si tiene conto di eventuali informazioni che si potrebbero avere a priori sulla popolazione, come ad esempio la localizzazione geografica, il genere, l età, desumibili dalle liste anagrafiche. Per questi motivi è un tipo di campionamento raramente utilizzato.

19 Tipi di campionamento Campionamento sistematico A differenza del campionamento casuale semplice, quello sistematico non seleziona in modo casuale tutte le unità del campione, ma solo la prima estratta. Dopo la prima estrazione da una lista, si procede con un certo passo che si può calcolare pari al reciproco della frazione di campionamento (N/n). Così se ad esempio si ha una popolazione di unità da cui si vuole estrarre un campione di 500 unità, basta scegliere un unità nella lista ogni 40 scegliendo la prima unità entro le prime 40. Questo tipo di campionamento non è equivalente, dal punto di vista matematico, rispetto a quello casuale semplice.

20 Tipi di campionamento Campionamento stratificato E di gran lunga il più utilizzato. Si divide l universo di riferimento in strati, usando le informazioni a priori già note sulla popolazione. Ad esempio, se si usano le liste telefoniche si può usare la collocazione geografica come variabile di stratificazione. Gli strati devono essere omogenei per qualche caratteristica ritenuta importante ai fini dell indagine. Questa suddivisione ci consente di partire da una situazione di variabilità inferiore, perché gli strati dovrebbero contenere al loro interno unità i cui caratteri hanno meno variabilità rispetto all intero universo. Ad esempio, per alcune indagini può essere utile distinguere tra centri urbani ed extraurbani, quando il fenomeno in esame si ipotizza che sia diverso tra queste due localizzazioni e quindi la variabilità all interno dei centri urbani e all interno dei centri extraurbani è minore di quella complessiva.

21 Tipi di campionamento Campionamento stratificato Oppure il genere, le classi d età o altre caratteristiche degli intervistati, se note, possono essere usate per stratificare l universo di riferimento e ridurre la variabilità. Se si devono intervistare gli studenti universitari rispetto alle proprie aspettative per il futuro lavorativo, può essere utile suddividere l universo di tutti gli studenti universitari italiani per facoltà, o per disciplina, attendendo una differenza per queste variabili nelle risposte e potendo quindi ridurre la variabilità attesa all interno di questi strati. Ovviamente l effettiva possibilità di stratificare dipende sia dalla numerosità dell universo e del campione che si vuole ottenere, sia dalla effettiva disponibilità di informazioni a priori nel nostro elenco iniziale. Quando è possibile, si fa una vera cluster analysis per individuare gli strati.

22 Tipi di campionamento Campionamento stratificato La popolazione viene dunque divisa in sottopolazioni N 1, N 2,, N k da ciascuna delle quali viene estratto un campione che può essere di tipo casuale semplice n 1, n 2,, n k Se dobbiamo stimare una media in ciascun campione, otteniamo k medie distinte M 1, M 2,, M k da cui la media della popolazione è

23 Tipi di campionamento Campionamento stratificato Riguardo alla numerosità dei campioni all interno di ciascuno strato, si può optare o per numerosità differenti per ciascuno strato, oppure per numerosità tutte uguali per i vari strati. Nel primo caso si può pensare di calcolare numerosità proporzionali alla numerosità degli strati. Così se il campione ha numerosità totale n, lo strato n i ha numerosità pari a Esempio: torniamo ad uno degli esempi precedenti, cioè quello in cui si avevano 5 unità su cui è rilevata una misura del tipo a=100, b=100, c=110, d=120, e=150. Supponiamo di poter dividere questo universo in tre strati e di estrarre da ciascuno di essi una unità per formare un campione. Gli strati siano: a, b; c; d, e. Se estraiamo da ciascuno una unità abbiamo 3 possibili campioni: a, c, d (media = 110); b, c, d (media = 110); a, c, e (media = 120). Abbiamo quindi una minore variabilità nelle medie rispetto al campionamento casuale semplice.

24 Tipi di campionamento Campionamento a più stadi In alcuni casi si può procedere per livelli successivi prima di arrivare ad estrarre le unità di campionamento. Prima di parlarne più estesamente facciamo un esempio concreto. Esempio: Supponiamo di dover estrarre un campione dall intera popolazione italiana. Possiamo innanzi tutto considerare i comuni italiani divisi per area geografica (nord, centro, sud) ed estrarre in modo casuale un certo numero di comuni da ciascuna area. Poi nei comuni selezionati si può estrarre un campione di popolazione, ottenendo così un campionamento a due stadi. In altre situazioni, ma anche in quella esemplificata, si possono considerare più di due stadi. Le unità estratte al primo stadio sono dette unità primarie. Uno dei vantaggi di questa impostazione sta nel fatto che si fa riferimento a liste ridotte (la lista dei comuni e poi la lista dei residenti dei soli comuni estratti, nell esempio precedente) invece che a liste di tutta la popolazione.

25 Tipi di campionamento Campionamento a più stadi Inoltre è possibile ridurre i costi dell indagine perché, come accade nell esempio precedente, le unità selezionate risiedono in alcuni comuni, non in tanti comuni quante sono le unità, cosa che potrebbe invece accadere in un campionamento casuale semplice su tutta la popolazione italiana. I campionamenti a più stadi possono essere anche stratificati. Nell esempio precedente in effetti le unità di primo stadio erano stratificate per area geografica. In alcune indagini dell ISTAT le unità di primo stadio, i comuni, sono stratificate per ampiezza demografica, nel senso che sono raggruppate secondo le dimensioni in termini di popolazione residente. Così si individuano due tipi di comune: quelli AR (autorappresentativi) e quelli NAR (non autorappresentativi).

26 Tipi di campionamento Campionamento a più stadi I comuni AR sono quelli grandi e costituiscono da soli uno strato. Essi devono essere selezionati perché sono gli unici di quello strato. I comuni NAR sono riuniti insieme in alcuni strati. Da questi strati si devono estrarre i comuni che possono rappresentare quello strato con un campionamento casuale semplice. E il caso dell indagine sulle Forze di lavoro, ma anche di altre indagini ISTAT in cui sono selezionate le famiglie. Campionamento a grappoli Ci sono situazioni in cui conviene scegliere gruppi già costituiti nella popolazione. E il caso del campionamento a grappoli che si usa tipicamente nelle indagini sugli studenti delle scuole, già naturalmente raggruppati in classi. Anche questo campionamento può essere stratificato o a più stadi.

27 Tipi di campionamento Campionamento per quote Ci sono situazioni, come ad esempio le ricerche di mercato o i sondaggi di opinione, effettuati tramite indagini telefoniche, in cui si procede per quote. In pratica si contattano le unità di rilevazione e, dopo il contatto, si chiedono alcune informazioni strutturali di interesse (ad esempio, genere, età, livello di istruzione). Conoscendo la composizione della popolazione di riferimento rispetto a queste variabili, si può inserire una nuova intervista solo se la quota in cui viene a cadere l intervistato non è già satura. Altrimenti si deve rinunciare all intervista e passare alla prossima. Questo campionamento, che non è rigorosamente casuale a causa dell elevato numero di cadute che si registra in prossimità della saturazione delle quote, offre il vantaggio di selezionare una popolazione dalle caratteristiche strutturali simili a quella della popolazione di riferimento.

28 Tipi di campionamento Campionamento per quote (non probabilistico) Pur con i propri limiti soprattutto legati all inapplicabilità del calcolo delle probabilità per le stime ottenute, questo tipo di campionamento offre buone possibilità di effettuare stime attendibili perché, a causa dei bassi costi di produzione dei dati, consente di agire su numerosità campionarie maggiori rispetto agli altri tipi di campionamento. Inoltre la proporzionalità rispetto alla popolazione di riferimento per caratteri difficilmente controllabili con gli altri metodi (il livello di istruzione non è contenuto nelle liste anagrafiche e tantomeno il tipo di occupazione, ecc.). Inoltre è praticato nelle indagini telefoniche in cui il tasso di risposta è generalmente maggiore rispetto a quelle postali che implicano uno sforzo maggiore da parte del rispondente. Inoltre si usa questo tipo di campionamento nel controllo della qualità in cui si interrompe il campionamento quando si raggiunge una certa composizione del campione.

29 Tipi di campionamento Campionamento a valanga (non probabilistico) Un altro campionamento non probabilistico, ma utilizzato in situazioni particolari in cui ci sono poche possibilità di fare altri tipi di campionamento, è quello a valanga. In pratica si tratta di raggiungere le prime unità statistiche che si riescono a raggiungere e poi, a partire da esse, si raggiungono le altre. E un tipico campionamento che si usa ad esempio per raccogliere informazioni sugli immigrati non regolari, sui senza fissa dimora, su tutte quelle persone che non sono comprese nelle liste ufficiali della popolazione e non potrebbero ma i essere raggiunte in altro modo. Si va in un centro di aggregazione, l ospedale, la Caritas, la strada, ecc., e si fa la rilevazione su alcune unità e poi si chiede ad esse il contatto per raggiungerne delle altre, e così via, appunto, a valanga.

30 Tipi di campionamento Campionamento ripetuto per osservazione (non probabilistico) Gli studiosi di scienze sociali si sforzano di trovare modalità sempre più efficenti di realizzare campioni in situazioni di grande difficoltà. Un tipo di campionamento, ancora una volta non probabilistico, è stato preso in prestito da altre discipline, tipo l epidemiologia applicata allo studio degli animali selvatici. Quando si vuole osservare una popolazione della quale non si abbiano liste e punti di aggregazione fissi, ci si mette in un certo luogo in cui si pensa si possano osservare un certo numero di unità che vengono in qualche modo identificate. Si ripete poi l osservazione in un altro tempo e si tiene conto delle unità già identificate. La stima del numero di unità dell universo si ottiene come: N =an/r dove a sono le unità identificate alla prima osservazione, n le unità totali della seconda osservazione, r sono le unità ricampionate nella seconda osservazione.

31 Tipi di campionamento Campionamento postale (non probabilistico) Questo tipo di campionamento è forse il primo mai sperimentato. Oggi è molto raro che si usi il mezzo postale vero e proprio per realizzare un indagine, ma i sondaggi on line possono essere assimilati ad esso. In pratica si contattano via posta, anche quella elettronica, gli intervistandi e si attende una loro spontanea risposta. E il tipo di sondaggio con il più alto numero di rifiuti, perciò non può essere ritenuto probabilistico e comporta una serie di problemi legati alle mancate risposte che non si risolvono nemmeno con l uso di solleciti ripetuti. Nella sua versione più moderna, quella elettronica, è oggi largamente usato per raccogliere opinioni in tempo veloce, opinioni che però non sono affatto riportabili all universo di riferimento, ma devono essere prese per un mero approfondimento qualitativo.

32 Quanti casi? La determinazione della numerosità campionaria Sono molti i fattori che concorrono a decidere la numerosità di un campione. Innanzi tutto bisogna decidere il piano di campionamento, determinare esattamente l universo di riferimento ed individuare il parametro o i parametri che si vogliono stimare. Poi bisogna tenere conto dei vincoli di costo, che spesso sono gli unici a determinare la numerosità campionaria, al di la di qualunque valutazione matematica. Esistono però anche delle considerazioni che possono essere fatte se si fa riferimento alla stima di una media. E noto che la varianza della stima della media campionaria tende ad annullarsi quando il campione aumenta di dimensione. Con un campione molto grande, come abbiamo visto negli esempi precedenti, le possibili medie che si possono ottenere tendono ad assumere valori simili.

33 Quanti casi? La determinazione della numerosità campionaria Siccome la media campionaria si distribuisce, come distribuzione di probabilità teorica, come una normale, si può calcolare la probabilità che essa cada entro un certo intervallo (μ - aσ, μ + aσ). Se σ è abbastanza piccolo, quando n è grande, questo intervallo è piccolo e la stima della media si avvicina molto a μ. a è un numero che moltiplica σ e si può determinare un valore di a tale che la probabilità che la media della popolazione sia compresa in quell intervallo sia pari ad un valore stabilito a priori. Ad esempio si può fissare a in modo che l intervallo (μ - aσ, μ + aσ) contenga il vero valore della media con una probabilità di 0,95 (o, come si dice di solito, del 95%) o anche di 0,99. Invertendo questo problema, si può determinare n in modo tale che la probabilità di quell intervallo sia proprio 0,95 o 0,99.

34 Quanti casi? La determinazione della numerosità campionaria L errore campionario che si è disposti a commettere, indicato in valore assoluto o in percentuale, per un estrazione di un campione senza ripetizione, come è il caso più comune nella ricerca sociale, ha la forma Da cui la numerosità campionaria per la stima di una media può essere scritta come Esempio: per una popolazione di 2000 unità, σ=36, una percentuale di attendibilità del 95%, errore massimo del 2% si ha: n=(1,96 2 *2000*36 2 )/(2 2 * ,96 2 * 36 2 )=767

35 Quanti casi? La determinazione della numerosità campionaria I valori che si utilizzano più di frequente nella stima della media artimetica sono riassunti nello schema seguente:

36 Quanti casi? La determinazione della numerosità campionaria In realtà il caso di costruzione di un campione per la determinazione di una sola media si verifica molto di rado nelle scienze sociali. Di solito si vuole determinare più di una media e probabilmente anche una percentuale, una quota di popolazione con una certa caratteristica. Allora esiste una semplice formula per il calcolo della dimensione campionaria nel caso si voglia stimare una percentuale. Esistono comunque delle comode tabelle che consentono di determinare la numerosità campionaria in dipendenza dell errore si è disposti a commettere. Ad esempio uno è pubblicato dal Governo italiano nell ambito di alcune iniziative di utilità per la Pubblica Amministrazione 1 1

37 Errore di campionamento Le tabelle degli errori di campionamento Quando si stima una proporzione P, l errore che si commette, se si è in presenza di un campionamento casuale semplice, può essere calcolato nel seguente modo Siccome la quantità P(1-P) è il prodotto tra un numero e il suo complemento ad 1 (o a 100 se si tratta di una percentuale), essa è massima quando P=½ e rappresenta l errore massimo che posso commettere calcolando una proporzione in un campione di n unità estratto da una popolazione di N unità. Esistono a tale proposito anche delle tabelle pre-calcolate che aiutano ad individuare immediatamente l errore associato ad una stima.

38 Comunicazione all Agcom

39 Comunicazione all Agcom

Statistica descrittiva e statistica inferenziale

Statistica descrittiva e statistica inferenziale Statistica descrittiva e statistica inferenziale 1 ALCUNI CONCETTI POPOLAZIONE E CAMPIONE Popolazione: insieme finito o infinito di unità statistiche classificate secondo uno o più caratteri Campione:

Dettagli

Indagine statistica. Indagine Totale Indagine Campionaria Fasi dell indagine

Indagine statistica. Indagine Totale Indagine Campionaria Fasi dell indagine 10/1 Indagine statistica Indagine Totale Indagine Campionaria Fasi dell indagine definizione degli obiettivi definizione delle unità e delle variabili da rilevare scelta del periodo di riferimento individuazione

Dettagli

CON O SENZA REIMMISSIONE

CON O SENZA REIMMISSIONE CAMPIONAMENTO Per una buona inferenza o induzione statistica, bisogna affrontare il problema del campionamento, ovvero del come raccogliere un campione della popolazione affinché la si possa studiare induttivamente.

Dettagli

CAMPIONAMENTO - ALCUNI TERMINI CHIAVE

CAMPIONAMENTO - ALCUNI TERMINI CHIAVE CAMPIONAMENTO - ALCUNI TERMINI CHIAVE POPOLAZIONE = qualsiasi insieme di oggetti (unità di analisi) di ricerca N = ampiezza della popolazione PARAMETRI = caratteristiche della popolazione [media, proporzione

Dettagli

Analizzare in termini quantitativi significa basarsi su dati e non su idee o ipotesi

Analizzare in termini quantitativi significa basarsi su dati e non su idee o ipotesi Statistica La Statistica è una metodologia per l analisi quantitativa dei fenomeni collettivi, cioè fenomeni il cui studio richiede l osservazione di un insieme di manifestazioni individuali Analizzare

Dettagli

Campionamento La statistica media campionaria e la sua distribuzione

Campionamento La statistica media campionaria e la sua distribuzione Campionamento La statistica media campionaria e la sua distribuzione 1 Definisco il problema da studiare: es. tempo di percorrenza tra abitazione e università Carattere: tempo ossia v.s. continua Popolazione:

Dettagli

Il Campionamento Statistico

Il Campionamento Statistico Il Campionamento Statistico Campionamento sistematico (1/2) Introdotto per ovviare ai costi elevati del campionamento casuale e semplice; richiede la selezione casuale soltanto

Dettagli

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI PSICOMETRIA Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI CAMPIONI INDIPENDENTI Campioni estratti casualmente dalla popolazione con caratteristiche omogenee Assegnazione

Dettagli

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta): ESERCIZIO 1 Una grande banca vuole stimare l ammontare medio di denaro che deve essere corrisposto dai correntisti che hanno il conto scoperto. Si seleziona un campione di 100 clienti su cui si osserva

Dettagli

Il campionamento e l inferenza. Il campionamento e l inferenza

Il campionamento e l inferenza. Il campionamento e l inferenza Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento

Dettagli

standardizzazione dei punteggi di un test

standardizzazione dei punteggi di un test DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it standardizzazione dei punteggi di un test serve a dare significato ai punteggi che una persona ottiene ad un test, confrontando la

Dettagli

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo TOPOGRAFIA 2013/2014 L operazione di misura di una grandezza produce un numero reale che esprime il rapporto della grandezza stessa rispetto a un altra, a essa omogenea, assunta come unità di misura. L

Dettagli

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni

Dettagli

POPOLAZIONE CAMPIONE

POPOLAZIONE CAMPIONE CAMPIONAMENTO 1 POPOLAZIONE Insieme finito o infinito di unità legate da almeno una caratteristica comune, che consenta di stabilire un criterio di appartenenza alla popolazione stessa. Esempio Bambini

Dettagli

Schema lezione 5 Intervalli di confidenza

Schema lezione 5 Intervalli di confidenza Schema lezione 5 Intervalli di confidenza Non centrerò quella barca, ne sono convinto al 95% COMPRENDERE: Significato di intervallo di confidenza Uso degli stimatori come quantità di pivot per stime intervallari

Dettagli

Gli errori nella verifica delle ipotesi

Gli errori nella verifica delle ipotesi Gli errori nella verifica delle ipotesi Nella statistica inferenziale si cerca di dire qualcosa di valido in generale, per la popolazione o le popolazioni, attraverso l analisi di uno o più campioni E

Dettagli

Lezione n. 1 _Complementi di matematica

Lezione n. 1 _Complementi di matematica Lezione n. 1 _Complementi di matematica INTRODUZIONE ALLA STATISTICA La statistica è una disciplina che si occupa di fenomeni collettivi ( cioè fenomeni in cui sono coinvolti più individui o elementi )

Dettagli

Distribuzioni campionarie. Antonello Maruotti

Distribuzioni campionarie. Antonello Maruotti Distribuzioni campionarie Antonello Maruotti Outline 1 Introduzione 2 Concetti base Si riprendano le considerazioni fatte nella parte di statistica descrittiva. Si vuole studiare una popolazione con riferimento

Dettagli

L indagine campionaria Lezione 5

L indagine campionaria Lezione 5 Anno accademico 2007/08 L indagine campionaria Lezione 5 Docente: prof. Maurizio Pisati Campionamento Il campionamento è l insieme delle operazioni finalizzate a generare il campione iniziale di una data

Dettagli

Il campionamento statistico. prof. C.Guida

Il campionamento statistico. prof. C.Guida Il campionamento statistico prof. C.Guida Per determinare le caratteristiche fondamentali di una popolazione statistica non è sempre necessario analizzare tutta la popolazione, ma risulta sufficiente esaminare

Dettagli

Elementi di base su modello binomiale e modello normale

Elementi di base su modello binomiale e modello normale Elementi di base su modello binomiale e modello normale (alcune note) Parte 1: il modello binomiale Di fondamentale importanza nell analisi della qualità sono i modelli. I due principali modelli statistico-probablistici

Dettagli

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica La distribuzione t - student 1 Abbiamo visto nelle lezioni precedenti come il calcolo del valore Z,

Dettagli

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.

Dettagli

STATISTICA INFERENZIALE

STATISTICA INFERENZIALE STATISTICA INFERENZIALE Introduzione L insieme di tutte le unità statistiche che compongono il fenomeno collettivo considerato costituisce l universo statistico o, semplicemente, universo. L insieme costituito

Dettagli

L indagine campionaria Lezione 3

L indagine campionaria Lezione 3 Anno accademico 2007/08 L indagine campionaria Lezione 3 Docente: prof. Maurizio Pisati Variabile casuale Una variabile casuale è una quantità discreta o continua il cui valore è determinato dal risultato

Dettagli

Esercitazione 8 maggio 2014

Esercitazione 8 maggio 2014 Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un

Dettagli

Distribuzioni campionarie

Distribuzioni campionarie 1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari

Dettagli

Capitolo 7. Distribuzioni campionarie. Statistica. Levine, Krehbiel, Berenson

Capitolo 7. Distribuzioni campionarie. Statistica. Levine, Krehbiel, Berenson Levine, Krehbiel, Berenson Statistica Capitolo 7 Distribuzioni campionarie Insegnamento: Statistica Applicata Corsi di Laurea in "Scienze e tecnologie Alimentari" Unità Integrata Organizzativa Agraria,

Dettagli

X Lezione Analisi della varianza Esempi e esercizi CPS - Corso di studi in Informatica II parte: Statistica

X Lezione Analisi della varianza Esempi e esercizi CPS - Corso di studi in Informatica II parte: Statistica Corso di Calcolo delle Probabilità e Statistica II Parte - STATISTICA X Lezione Analisi della varianza Esempi e esercizi 1 Argomenti della X Lezione Tests per il confronto di più medie: ANOVA Utilità e

Dettagli

Intervalli di confidenza

Intervalli di confidenza Probabilità e Statistica Esercitazioni a.a. 2006/2007 C.d.L.: Ingegneria per l Ambiente ed il Territorio, Ingegneria Civile, Ingegneria Gestionale, Ingegneria dell Informazione C.d.L.S.: Ingegneria Civile

Dettagli

Lezione 4 a - Misure di dispersione o di variabilità

Lezione 4 a - Misure di dispersione o di variabilità Lezione 4 a - Misure di dispersione o di variabilità Abbiamo visto che la media è una misura della localizzazione centrale della distribuzione (il centro di gravità). Popolazioni con la stessa media possono

Dettagli

Capitolo 2 Le misure delle grandezze fisiche

Capitolo 2 Le misure delle grandezze fisiche Capitolo 2 Le misure delle grandezze fisiche Gli strumenti di misura Gli errori di misura Il risultato di una misura Errore relativo ed errore percentuale Propagazione degli errori Rappresentazione di

Dettagli

a) Usando i seguenti livelli di significatività, procedere alla verifica di ipotesi, usando come ipotesi alternativa un'ipotesi unidirezionale:

a) Usando i seguenti livelli di significatività, procedere alla verifica di ipotesi, usando come ipotesi alternativa un'ipotesi unidirezionale: ESERCIZIO 1 Da studi precedenti, il responsabile del rischio di una grande banca sa che l'ammontare medio di denaro che deve essere corrisposto dai correntisti che hanno il conto scoperto è pari a 240.

Dettagli

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n. 5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema

Dettagli

STATISTICA ESERCITAZIONE

STATISTICA ESERCITAZIONE STATISTICA ESERCITAZIONE Dott. Giuseppe Pandolfo 1 Giugno 2015 Esercizio 1 Una fabbrica di scatole di cartone evade il 96% degli ordini entro un mese. Estraendo 300 campioni casuali di 300 consegne, in

Dettagli

Distribuzioni e inferenza statistica

Distribuzioni e inferenza statistica Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione

Dettagli

Verifica delle ipotesi: Binomiale

Verifica delle ipotesi: Binomiale Verifica delle ipotesi: Binomiale Esercizio Nel collegio elettorale di una città, alle ultime elezioni il candidato A ha ottenuto il 4% delle preferenze mentre il candidato B il 6%. Nella nuova tornata

Dettagli

STATISTICA SOCIALE Corso di laurea in Scienze Turistiche - A.A. 2005/2006 II Prova - 20 dicembre 2005

STATISTICA SOCIALE Corso di laurea in Scienze Turistiche - A.A. 2005/2006 II Prova - 20 dicembre 2005 STATISTICA SOCIALE Corso di laurea in Scienze Turistiche - A.A. 2005/2006 II Prova - 20 dicembre 2005 Per verbalizzare l'esame: iscriversi ad uno degli appelli di gennaio-febbraio utilizzando il Servizio

Dettagli

a) 36/100 b) 1/3 c)

a) 36/100 b) 1/3 c) Da un urna contenente 10 palline, di cui 6 bianche e 4 nere, si estraggono due palline. Determinare la probabilità del seguente evento E=«le due palline sono bianche» nel caso di estrazioni a) con rimbussolamento

Dettagli

QUANDO RACCOGLIERE DATI SU BASE CAMPIONARIA??

QUANDO RACCOGLIERE DATI SU BASE CAMPIONARIA?? QUANDO RACCOGLIERE DATI SU BASE CAMPIONARIA?? 1) QUANDO SI ESEGUE UNA SPERIMENTAZIONE PILOTA 2) QUANDO E IMPRATICABILE, PER MOTIVI PRATICI, ECONOMICI ecc... RACCOGLIERE DATI SULL INTERA POPOLAZIONE (ad

Dettagli

Errori di misura Teoria

Errori di misura Teoria Errori di misura Teoria a misura operazione di misura di una grandezza fisica, anche se eseguita con uno strumento precisissimo e con tecniche e procedimenti accurati, è sempre affetta da errori. Gli errori

Dettagli

Corso di Informatica Generale (C. L. Economia e Commercio) Ing. Valerio Lacagnina Rappresentazione dei numeri relativi

Corso di Informatica Generale (C. L. Economia e Commercio) Ing. Valerio Lacagnina Rappresentazione dei numeri relativi Codice BCD Prima di passare alla rappresentazione dei numeri relativi in binario vediamo un tipo di codifica che ha una certa rilevanza in alcune applicazioni: il codice BCD (Binary Coded Decimal). È un

Dettagli

Probabilità. Ing. Ivano Coccorullo

Probabilità. Ing. Ivano Coccorullo Ing. Ivano Coccorullo PROBABILITA Teoria della Eventi certi, impossibili e casuali Nella scienza e nella tecnologia è fondamentale il principio secondo il quale ogni volta che si realizza un insieme di

Dettagli

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE

Dettagli

DISTRIBUZIONE NORMALE (1)

DISTRIBUZIONE NORMALE (1) DISTRIBUZIONE NORMALE (1) Nella popolazione generale molte variabili presentano una distribuzione a forma di campana, bene caratterizzata da un punto di vista matematico, chiamata distribuzione normale

Dettagli

STATISTICA APPLICATA Prof.ssa Julia Mortera. Concentrazione

STATISTICA APPLICATA Prof.ssa Julia Mortera. Concentrazione STATISTICA APPLICATA Prof.ssa Julia Mortera Concentrazione Questo materiale non sufficiente per la conoscenza/preparazione dell argomento per il quale si rimanda al testo: Cicchitelli (2012) Statistica:

Dettagli

Parlami un po di te. https://goo.gl/forms/j3scuxwrmcd2toxi3

Parlami un po di te. https://goo.gl/forms/j3scuxwrmcd2toxi3 Parlami un po di te. https://goo.gl/forms/j3scuxwrmcd2toxi3 STATISTICA DISCIPLINA CHE STUDIA I FENOMENI COLLETTIVI, CIOE FENOMENI RIGUARDANTI UNA GRANDE MOLTITUDINE DI PERSONE O COSE UN INDAGINE STATISTICA

Dettagli

Capitolo 11 Test chi-quadro

Capitolo 11 Test chi-quadro Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara Docenti: Dott.

Dettagli

Relazione di fisica ESPERIMENTO N 1

Relazione di fisica ESPERIMENTO N 1 ISTITUTO SUPERIORE "B. RUSSELL" DI ROMA Relazione di fisica ESPERIMENTO N 1 1.TITOLO Misurazione indiretta della massa di un cilindretto metallico mediante i metodi della tara di J.C. Borda e della doppia

Dettagli

Unità Didattica realizzata dalla prof.ssa De Simone Marilena A.S. 2015/16

Unità Didattica realizzata dalla prof.ssa De Simone Marilena A.S. 2015/16 Unità Didattica realizzata dalla prof.ssa De Simone Marilena A.S. 2015/16 La matematica finanziaria si occupa di tutti i problemi relativi al denaro e al suo impiego. Il denaro è lo strumento con cui possiamo

Dettagli

Esercizi di Calcolo combinatorio: disposizioni

Esercizi di Calcolo combinatorio: disposizioni Calcolo combinatorio: disposizioni La Big Triple all ippodromo del luogo consiste nell indicare il corretto ordine di arrivo dei cavalli classificati tra i primi tre nella nona corsa. Se ci sono 12 cavalli

Dettagli

Ψ PSICOMETRIA. Corso di laurea triennale (classe 34) STATISTICA INFERENZIALE

Ψ PSICOMETRIA. Corso di laurea triennale (classe 34) STATISTICA INFERENZIALE Ψ PSICOMETRIA Corso di laurea triennale (classe 34) STATISTICA INFERENZIALE STATISTICA INFERENZIALE CAMPIONE caratteristiche conosciute POPOLAZIONE caratteristiche sconosciute STATISTICA INFERENZIALE STIMA

Dettagli

I disegni sperimentali e il controllo

I disegni sperimentali e il controllo I disegni sperimentali e il 1. Procedure del 2. Disegni monofattoriali 3. Disegni multifattoriali Il disegno sperimentale Popolazione Campionamento casuale Campione Misura variabili di interesse Gruppo

Dettagli

percorso 4 Estensione on line lezione 2 I fattori della produzione e le forme di mercato La produttività La produzione

percorso 4 Estensione on line lezione 2 I fattori della produzione e le forme di mercato La produttività La produzione Estensione on line percorso 4 I fattori della produzione e le forme di mercato lezione 2 a produzione a produttività Una volta reperiti i fattori produttivi necessari l imprenditore dovrà decidere come

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Esercitazione: La distribuzione NORMALE

Esercitazione: La distribuzione NORMALE Esercitazione: La distribuzione NORMALE Uno dei più importanti esempi di distribuzione di probabilità continua è dato dalla distribuzione Normale (curva normale o distribuzione Gaussiana); è una delle

Dettagli

IL DISEGNO DELLA RICERCA

IL DISEGNO DELLA RICERCA IL DISEGNO DELLA RICERCA Che cosa vuol dire? è la strategia dell intera ricerca. Anche se la demarcazione non è netta, esistono disegni a (prevalente) impostazione: campionaria sperimentali osservazionali

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 9-Introduzione alla statistica inferenziale (vers. 1.2, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università

Dettagli

Derivazione numerica. Introduzione al calcolo numerico. Derivazione numerica (II) Derivazione numerica (III)

Derivazione numerica. Introduzione al calcolo numerico. Derivazione numerica (II) Derivazione numerica (III) Derivazione numerica Introduzione al calcolo numerico Il calcolo della derivata di una funzione in un punto implica un processo al limite che può solo essere approssimato da un calcolatore. Supponiamo

Dettagli

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Statistica inferenziale La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Verifica delle ipotesi sulla medie Quando si conduce una

Dettagli

Concetti principale della lezione precedente

Concetti principale della lezione precedente Corso di Statistica medica e applicata 9 a Lezione Dott.ssa Donatella Cocca Concetti principale della lezione precedente I concetti principali che sono stati presentati sono: Variabili su scala nominale

Dettagli

Lezione 12. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 12. A. Iodice.

Lezione 12. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 12. A. Iodice. discrete uniforme Bernoulli Poisson Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 56 Outline discrete uniforme Bernoulli Poisson 1 2 discrete 3

Dettagli

Alfredo Rizzi. Già professore ordinario di teoria dell inferenza statistica

Alfredo Rizzi. Già professore ordinario di teoria dell inferenza statistica Alfredo Rizzi Già professore ordinario di teoria dell inferenza statistica INDUZIONE E DEDUZIONE INDUZIONE : PROCEDIMENTO LOGICO CHE CONSISTE NELL INFERIRE DA OSSERVAZIONI ED ESPERIENZE PARTICOLARI I PRINCIPI

Dettagli

Correzione primo compitino, testo A

Correzione primo compitino, testo A Correzione primo compitino, testo A Parte Esercizio Facciamo riferimento alle pagine 22 e 2 del libro di testo Quando si ha a che fare con la moltiplicazione o la divisione di misure bisogna fare attenzione,

Dettagli

La valutazione dei rischi. Corso di risk management Prof. Giuseppe D Onza

La valutazione dei rischi. Corso di risk management Prof. Giuseppe D Onza La valutazione dei rischi Corso di risk management Prof. Giuseppe D Onza LA VALUTAZIONE DEI RISCHI E un attività che caratterizza la gestione dei rischi finalizzata ad apprezzare la gravità dei fenomeni

Dettagli

Facoltà di Economia - STATISTICA - Corso di Recupero a.a Prof.ssa G. Balsamo

Facoltà di Economia - STATISTICA - Corso di Recupero a.a Prof.ssa G. Balsamo Facoltà di Economia - STATISTICA - Corso di Recupero a.a. 2012-13 Prof.ssa G. Balsamo 1 - RAPPORTI STATISTICI il fattore tempo può essere elencato come uno dei fattori componenti il quadro di indagine.

Dettagli

Il confronto fra medie

Il confronto fra medie L. Boni Obiettivo Verificare l'ipotesi che regimi alimentari differenti non producano mediamente lo stesso effetto sulla gittata cardiaca Ipotesi nulla IPOTESI NULLA La dieta non dovrebbe modificare in

Dettagli

Università del Piemonte Orientale. Corso di Laurea in Igiene Dentale. Corso di Statistica per la ricerca sperimentale e tecnologica

Università del Piemonte Orientale. Corso di Laurea in Igiene Dentale. Corso di Statistica per la ricerca sperimentale e tecnologica Università del Piemonte Orientale Corso di Laurea in Igiene Dentale Corso di Statistica per la ricerca sperimentale e tecnologica Campionamento e distribuzione campionaria della media Corso di laurea triennale

Dettagli

LA LUNGHEZZA DEI GENI UMANI (Es4.1)

LA LUNGHEZZA DEI GENI UMANI (Es4.1) STATISTICA INFERENZIALE: le caratteristiche della popolazione complessiva sono indotte da quelle osservate su un campione estratto dalla popolazione stessa(esempio exit poll) PROBLEMA: dato un campione

Dettagli

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI. Corso di Laurea Specialistica in Biologia Sanitaria, Universita' di Padova C.I. di Metodi statistici per la Biologia, Informatica e Laboratorio di Informatica (Mod. B) Docente: Dr. Stefania Bortoluzzi

Dettagli

Importanza delle incertezze nelle misure fisiche

Importanza delle incertezze nelle misure fisiche Importanza delle incertezze nelle misure fisiche La parola errore non significa equivoco o sbaglio Essa assume il significato di incertezza da associare alla misura Nessuna grandezza fisica può essere

Dettagli

Economia e Gestione delle Imprese

Economia e Gestione delle Imprese Economia e Gestione delle Imprese Facoltà di Scienze Politiche Corso di Laurea in Economia Prof. Marco Galdenzi Anno accademico 2013/14 LE RILEVAZIONI INTERNE ORDINE Produzione Magazzino Vendite Acquisti

Dettagli

Indice: Strategie generali Strategie specifiche Ripetizione Metodi per aumentare la validità

Indice: Strategie generali Strategie specifiche Ripetizione Metodi per aumentare la validità Controllo Indice: Strategie generali Strategie specifiche Ripetizione Metodi per aumentare la validità Definiremo il controllo come qualsiasi mezzo impiegato per eliminare le possibili minacce alla validità

Dettagli

Note sulla probabilità

Note sulla probabilità Note sulla probabilità Maurizio Loreti Dipartimento di Fisica Università degli Studi di Padova Anno Accademico 2002 03 1 La distribuzione del χ 2 0.6 0.5 N=1 N=2 N=3 N=5 N=10 0.4 0.3 0.2 0.1 0 0 5 10 15

Dettagli

Matematica finanziaria

Matematica finanziaria Matematica finanziaria La matematica finanziaria studia le operazioni che riguardano scambi di somme di denaro nel tempo. Sono operazioni di questo tipo, ad esempio, l investimento di un capitale in un

Dettagli

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Intervalli di confidenza Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 10 Dicembre 2014 Stefania Spina Esercitazioni di statistica 1/43 Stefania Spina

Dettagli

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2

Dettagli

In molte applicazioni sorge il problema di sapere in quanti modi possibili si può presentare un certo fenomeno.

In molte applicazioni sorge il problema di sapere in quanti modi possibili si può presentare un certo fenomeno. Definizione Oggetto del calcolo combinatorio è quello di determinare il numero dei modi mediante i quali possono essere associati, secondo prefissate regole, gli elementi di uno stesso insieme o di più

Dettagli

STATISTICHE DESCRITTIVE Parte II

STATISTICHE DESCRITTIVE Parte II STATISTICHE DESCRITTIVE Parte II INDICI DI DISPERSIONE Introduzione agli Indici di Dispersione Gamma Differenza Interquartilica Varianza Deviazione Standard Coefficiente di Variazione introduzione Una

Dettagli

Olimpiadi di Statistica Classe V - Fase Eliminatoria

Olimpiadi di Statistica Classe V - Fase Eliminatoria Olimpiadi di Statistica 2016 - Classe V - Fase Eliminatoria Domanda 1 Alla fine del torneo di calcetto organizzato dalla scuola, è stata analizzata la classifica dei marcatori dalla quale risulta la seguente

Dettagli

1 4 Esempio 2. Si determini la distribuzione di probabilità della variabile casuale X = punteggio ottenuto lanciando un dado. Si ha immediatamente:

1 4 Esempio 2. Si determini la distribuzione di probabilità della variabile casuale X = punteggio ottenuto lanciando un dado. Si ha immediatamente: CAPITOLO TERZO VARIABILI CASUALI. Le variabili casuali e la loro distribuzione di probabilità In molte situazioni, dato uno spazio di probabilità S, si è interessati non tanto agli eventi elementari (o

Dettagli

Note sull implementazione in virgola fissa di filtri numerici

Note sull implementazione in virgola fissa di filtri numerici Note sull implementazione in virgola fissa di filtri numerici 4 settembre 2006 1 Introduction Nonostante al giorno d oggi i processori con aritmetica in virgola mobili siano molto comuni, esistono contesti

Dettagli

LA CONGIUNTURA DEL SETTORE MANIFATTURIERO NELLE MARCHE NOTA METODOLOGICA IV TRIMESTRE 2015

LA CONGIUNTURA DEL SETTORE MANIFATTURIERO NELLE MARCHE NOTA METODOLOGICA IV TRIMESTRE 2015 LA CONGIUNTURA DEL SETTORE MANIFATTURIERO NELLE MARCHE NOTA METODOLOGICA IV TRIMESTRE 2015 A cura di: Questlab srl, 18/02/2016 Nota metodologica La raccolta dei questionari è stata effettuata dalla società

Dettagli

Giovanna Boccuzzo Dipartimento di Scienze Statistiche Università di Padova

Giovanna Boccuzzo Dipartimento di Scienze Statistiche Università di Padova La costruzione dei dati e la rappresentazione di informazione statistica Giovanna Boccuzzo Dipartimento di Scienze Statistiche Università di Padova Da dove provengono i dati statistici? Fonti esaustive

Dettagli

Test di ipotesi su due campioni

Test di ipotesi su due campioni 2/0/20 Test di ipotesi su due campioni Confronto tra due popolazioni Popolazioni effettive: unità statistiche realmente esistenti. Esempio: Confronto tra forze lavoro di due regioni. Popolazioni ipotetiche:

Dettagli

Strumenti di indagine per la valutazione psicologica

Strumenti di indagine per la valutazione psicologica Strumenti di indagine per la valutazione psicologica 2.3 Validazione di un test clinico Davide Massidda davide.massidda@gmail.com Definire un cut-off Per ogni scala del questionario, sommando o mediando

Dettagli

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016 Esame di Statistica 0 o CFU) CLEF febbraio 06 Esercizio Si considerino i seguenti dati, relativi a 00 clienti di una banca a cui è stato concesso un prestito, classificati per età e per esito dell operazione

Dettagli

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Misure di associazione: Indipendenza assoluta e in media Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 22 ottobre 2014 Stefania Spina Esercitazioni

Dettagli

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A) Prova scritta di STATISTICA CDL Biotecnologie (Programma di Massimo Cristallo - A) 1. Un associazione di consumatori, allo scopo di esaminare la qualità di tre diverse marche di batterie per automobili,

Dettagli

Elementi di Statistica

Elementi di Statistica Università degli Studi di Palermo Dipartimento di Ingegneria Informatica Informatica ed Elementi di Statistica 3 c.f.u. Anno Accademico 2010/2011 Docente: ing. Salvatore Sorce Elementi di Statistica Statistica

Dettagli

Il Ricevente comunica pubblicamente una chiave e. Il Mittente codifica il messaggio usando la funzione f(m, e) = C e

Il Ricevente comunica pubblicamente una chiave e. Il Mittente codifica il messaggio usando la funzione f(m, e) = C e Crittografia a chiave pubblica. Il problema della crittografia è semplice da enunciare: vi sono due persone, il Mittente e il Ricevente, che vogliono comunicare fra loro senza che nessun altro possa leggere

Dettagli

Dati sperimentali Nella serie di 10 misurazioni di tempo effettuate, si sono ottenuti i seguenti valori espressi in secondi:

Dati sperimentali Nella serie di 10 misurazioni di tempo effettuate, si sono ottenuti i seguenti valori espressi in secondi: ESPERIMENTO DI LABORATORIO DI FISICA MISURE DI TEMPO Obiettivo L obiettivo dell esperimento, oltre che familiarizzare con le misure di tempo, è quello di rivelare gli errori casuali, elaborare statisticamente

Dettagli

METODO DEI MINIMI QUADRATI

METODO DEI MINIMI QUADRATI METODO DEI MINIMI QUADRATI Torniamo al problema della crescita della radice di mais in funzione del contenuto di saccarosio nel terreno di coltura. Ripetendo varie volte l esperimento con diverse quantità

Dettagli

Localizzazione di una esplosione

Localizzazione di una esplosione XXIII Ciclo di Dottorato in Geofisica Università di Bologna Corso di: Il problema inverso in sismologia Prof. Morelli Localizzazione di una esplosione Paola Baccheschi & Pamela Roselli 1 INTRODUZIONE Problema

Dettagli

04 - Logica delle dimostrazioni

04 - Logica delle dimostrazioni Università degli Studi di Palermo Facoltà di Economia CdS Sviluppo Economico e Cooperazione Internazionale Appunti del corso di Matematica 04 - Logica delle dimostrazioni Anno Accademico 013/014 D. Provenzano,

Dettagli

Esercitazione 8 del corso di Statistica 2

Esercitazione 8 del corso di Statistica 2 Esercitazione 8 del corso di Statistica Prof. Domenico Vistocco Dott.ssa Paola Costantini 6 Giugno 8 Decisione vera falsa è respinta Errore di I tipo Decisione corretta non è respinta Probabilità α Decisione

Dettagli

Statistica sociale Laurea specialistica in Progettazione e gestione del turismo culturale. Lezione 2. Metodologia della ricerca sociale

Statistica sociale Laurea specialistica in Progettazione e gestione del turismo culturale. Lezione 2. Metodologia della ricerca sociale Statistica sociale Laurea specialistica in Progettazione e gestione del turismo culturale Lezione 2 Metodologia della ricerca sociale Gianluca Dominutti 6. Il campionamento È un argomento che, per essere

Dettagli

I formati delle istruzioni

I formati delle istruzioni Appunti di Calcolatori Elettronici Le istruzioni I formati delle istruzioni... 1 Criteri generali di progettazione dei formati delle istruzioni... 2 Cenni all indirizzamento... 4 Indirizzamento immediato...

Dettagli

Proprietà della varianza

Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Intermezzo: ma perché dovremmo darci la pena di studiare come calcolare la varianza nel caso di somme,

Dettagli

L INDAGINE SUL BENESSERE ORGANIZZATIVO IN ARPA EMILIA-ROMAGNA LA SCELTA DEL CAMPIONE

L INDAGINE SUL BENESSERE ORGANIZZATIVO IN ARPA EMILIA-ROMAGNA LA SCELTA DEL CAMPIONE L INDAGINE SUL BENESSERE ORGANIZZATIVO IN ARPA EMILIA-ROMAGNA LA SCELTA DEL CAMPIONE 1 Premessa In questa presentazione viene descritta la procedura scelta per determinare le persone da coinvolgere nell

Dettagli