Teoria e tecniche dei test. Concetti di base

Documenti analoghi
Capitolo 3 Sintesi e descrizione dei dati quantitativi

Nozioni di statistica

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:

INDICATORI DI TENDENZA CENTRALE

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Statistica di base per l analisi socio-economica

INDICATORI DI TENDENZA CENTRALE

INDICATORI DI TENDENZA CENTRALE

STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA

Dispensa di Statistica

Scale di Misurazione Lezione 2

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

1/55. Statistica descrittiva

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

CORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Esercitazione: La distribuzione NORMALE

Prefazione Ringraziamenti

Statistica Un Esempio

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

DISTRIBUZIONE NORMALE (1)

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

LA RAPPRESENTAZIONE E LA SINTESI DEI DATI

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Statistica descrittiva II

Coincide con la media aritmetica degli n dati nel campione

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Variabile casuale Normale

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Università del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva Variabili numeriche

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

Elementi di Probabilità e Statistica

Tipi di variabili. Indici di tendenza centrale e di dispersione

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

Elementi di Psicometria con Laboratorio di SPSS 1

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

Esplorazione dei dati

Istituzioni di Statistica e Statistica Economica

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

Elementi di Statistica

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Statistica. Alfonso Iodice D Enza

Università del Piemonte Orientale. Corso di Laurea in Biotecnologie. Corso di Statistica Medica. Statistica Descrittiva: Variabili numeriche

STATISTICA DESCRITTIVA (variabili quantitative)

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria

Statistica. Campione

STATISTICA Disciplina scien tifica che fornisce strumenti per l interpretazione delle informazioni contenute in insiemi di dati relativi a

STATISTICA 1 ESERCITAZIONE 6

MISURE DI SINTESI 54

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.

LA DISTRIBUZIONE NORMALE. La distribuzione Gaussiana. Dott.ssa Marta Di Nicola

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Questionario 1. Sono assegnati i seguenti dati

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

Statistica descrittiva

Metodologie statistiche per l analisi del rischio ELEMENTI DI STATISTICA DESCRITTIVA PER L ANALISI DEL RISCHIO

FENOMENI CASUALI. fenomeni casuali

STATISTICHE DESCRITTIVE Parte II

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio

L indagine campionaria Lezione 3

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

Andrea Bonanomi Università Cattolica del Sacro Cuore. Principi di Statistica Descrittiva. Milano, 9 gennaio 2015 Camera di Commercio


Rappresentazioni grafiche

LA DISTRIBUZIONE NORMALE (Vittorio Colagrande)

Capitolo 6 La distribuzione normale

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

2. Variabilità mediante il confronto di valori caratteristici della

Università di Cassino Corso di Laurea in Scienze Motorie Biostatistica Anno accademico 2011/2012

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

TEORIA DEGLI ERRORI DI MISURA, IL CALCOLO DELLE INCERTEZZE

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

ELABORAZIONE ED ANALISI STATISTICA DEI DATI

ISTOGRAMMI E DISTRIBUZIONI:

Capitolo 6. La distribuzione normale

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:

Gli indici di variabilità

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Elementi di Psicometria con Laboratorio di SPSS 1

Esercizi di Probabilità e Statistica

Misure di dispersione (o di variabilità)

ESAME. 9 Gennaio 2017 COMPITO B

Statistica descrittiva

Ringraziamenti dell Editore

Casa dello Studente. Casa dello Studente

Obiettivi Strumenti Cosa ci faremo? Probabilità, distribuzioni campionarie. Stimatori. Indici: media, varianza,

Lezione 4 a - Misure di dispersione o di variabilità

A1. La curva normale (o di Gauss)

Challenge test: metodologia e strumenti pratici per una corretta valutazione

La distribuzione delle frequenze. T 10 (s)

Facoltà di AGRARIA anno accademico 2009/10

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

I 5 principi dell estimo

Distribuzione Normale

Transcript:

Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi individui o oggetti vengono denominati unità statistiche. Una variabile è una caratteristica di ogni appartenente alla popolazione. Un campione è una parte di popolazione. L errore di campionamento è la differenza tra una caratteristica misurata sull intera popolazione e la stessa riscontrata in un campione di quella popolazione. Il grado di variabilità è una misura di come gli elementi della popolazione differiscono gli uni dagli altri in riferimento alla variabile sotto studio. 1

La popolazione e un campione Campione e popolazione (2) Un parametro è un valore numerico che descrive una caratteristica della popolazione. Una statistica è un valore numerico che descrive una caratteristica di un campione. La dimensione della popolazione è il numero delle unità statistiche della popolazione. Il relativo simbolo è N. La dimensione del campione si indica con n. Campione e popolazione (3) I dati qualitativi descrivono una caratteristica particolare di un osservazione campionaria. Nella maggior parte dei casi non sono numerici. I dati creati assegnando codifiche numeriche alle diverse categorie, senza che tali numeri abbiano un reale significato, sono chiamati dati nominali. I dati che sono creati assegnando numeri alle categorie dove l ordine di assegnazione ha un significato sono chiamati dati ordinali. Le scale di Likert sono utilizzate per raccogliere informazioni su atteggiamenti e opinioni incluso il grado di consenso di una affermazione, frequenza di uso, importanza di un argomento, qualità e gradimento. 2

Campione e popolazione (4) I dati che sono intrinsecamente numerici sono chiamati dati quantitativi. I dati discreti possono assumere solo determinati valori. Questi valori sono spesso numeri interi o comunque non decimali. I dati continui possono assumere un infinito numero di valori possibili entro un intervallo di valori della scala numerica. Tali valori sono molto spesso il risultato di misurazioni. Gli strumenti della statistica descrittiva permettono di sintetizzare i dati. Una inferenza è una deduzione o una conclusione. La distribuzione delle variabili (1) Una tabella di frequenza o distribuzione di frequenza registra ogni categoria, valore, o classe di valori che una variabile potrebbe avere e il corrispondente numero di volte che ognuna di esse ricorre nei dati. La frequenza della i-ma classe è indicata con f i. La frequenza relativa di una classificazione consiste nel numero di volte in cui una osservazione si ritrova all interno della classificazione stessa, rappresentata come una porzione del numero totale di osservazioni. La frequenza relativa può essere espressa come una frazione, decimale o percentuale. La distribuzione delle variabili (2) La frequenza relativa cumulata di una classe è la somma della frequenza relativa di quella classe con quelle di tutte le classi precedenti. Rappresenta una porzione del numero totale delle osservazioni e può essere espressa come una frazione, un numero decimale o una percentuale. 3

Esempio di distribuzione di frequenza (dai dati raccolti in aula S1) Tipo di Diploma frequenza frequenza % frequenza % cumulata Dirigente di Comunità (IT) 9 6,0% 6,0% Istituto Tecnico 37 24,7% 30,7% Liceo (classico, scientifico, linguistico, artistico) 37 24,7% 55,3% Liceo delle Scienze Sociali 27 18,0% 73,3% Liceo Socio-Psico-Pedagogico 25 16,7% 90,0% Altro titolo 15 10,0% 100,0% Totale 150 La distribuzione delle variabili (3) Il diagramma a barre rappresenta la frequenza o la frequenza relativa di una tabella di frequenza sotto forma di un rettangolo o barra o colonna. Un istogramma è molto simile a un diagramma a barre ma la scala di misura dell asse delle ascisse deve tener conto che i dati sono intrinsecamente ordinati. Esempio di diagramma a barre (dai dati raccolti in aula S1) 40 37 37 35 30 27 25 25 20 15 15 10 9 5 0 Dirigente di Comunità Istituto Tecnico Liceo (classico, Liceo delle Scienze Sociali Liceo Socio-Psico- Altro titolo (IT) scientifico, linguistico, Pedagogico artistico) 4

Esempio di istogramma (dai dati raccolti in aula S1) Voto al dipolma 60 52 50 47 40 34 30 20 10 10 5 0 6 7 8 9 10 Indici riassuntivi numerici La tendenza centrale o posizione di un insieme di dati indica dove, numericamente, i dati sono posizionati o concentrati. La forma di un insieme di dati descrive come i dati si distribuiscono intorno ai valori centrali relativamente alla simmetria o asimmetria. La variabilità di un insieme di dati descrive come i dati sono disposti intorno ai valori della tendenza centrale. Distribuzione delle variabili (4) Quando i dati sono distribuiti uniformemente su entrambi i lati del picco la distribuzione è simmetrica. Quando i dati non sono distribuiti uniformemente su entrambi i lati del picco la distribuzione è asimmetrica. 5

Istogrammi con (a) dati asimmetrici, (b) valori estremi Istogrammi con diversa variabilità che mostrano la dispersione dei dati Istogrammi con diversa variabilità che mostrano diverse regolarizzazioni 6

Indicatori di tendenza centrale (1) Una statistica è un descrittore numerico calcolato dai dati campionari ed è usato per descrivere il campione. Le statistiche, di norma, si rappresentano con lettere romane. Un parametro è un descrittore numerico usato per descrivere la popolazione. I parametri, di norma, si rappresentano con lettere greche. Indicatori di tendenza centrale (2) La media aritmetica sintetizza la posizione (tendenza centrale) della distribuzione d un insieme di dati. Si trova sommando tutti i valori dei dati e dividendo per il numero totale delle osservazioni. La media della popolazione è indicata dalla lettera greca (mu). La mediana è il valore dell osservazione centrale d una distribuzione ordinata di dati. La moda è il valore con la frequenza più alta nel campione. Indicatori di dispersione Il campo di variazione (range), R, è la differenza fra l osservazione maggiore e quella minore del campione. R = Max Min La varianza campionaria, s 2, è la media dei quadrati degli scarti tra ciascun valore e la media campionaria. Lo scarto quadratico medio s è la radice quadrata positiva della varianza. Lo scarto quadratico medio e la varianza della popolazione si indicano rispettivamente con (sigma) e 2. 7

Indicatori di posizione (1) Il valore standardizzato misura di quanti scarti quadratici medi un valore dista dalla media. Un valore anomalo (outlier) è un valore che ha una probabilità molto bassa di verificarsi. Il p -esimo percentile di un insieme di dati è il valore per cui una percentuale pari a p delle osservazioni è inferiore o uguale a esso. Il rank di percentile di un valore è la percentuale dei dati del campione pari o al di sotto del valore di interesse. Indicatori di posizione (2) Il primo quartile Q 1 è un valore tale che il 25% dei dati è inferiore o uguale a esso. Il terzo quartile Q 3 è un valore tale che il 75% dei dati è inferiore o uguale a esso. Un grafico a scatola è una rappresentazione grafica che utilizza le statistiche di sintesi per rappresentare la distribuzione di un insieme di dati. Lo scarto interquartile (SIQ) è la differenza tra il terzo e il primo quartile, Q 3 Q 1. Il valore di riferimento inferiore di un grafico a scatola è posizionato a Q 1 1.5 (SIQ) e quello superiore a Q 3 + 1.5 (SIQ). Grafico a scatola e baffi 8

La distribuzione normale (1) La distribuzione normale o gaussiana è la più importante distribuzione di probabilità di variabili continue. È caratterizzata da due parametri: media (µ) e varianza (σ 2 ) Assume valori compresi tra - e + Descrive una curva di tipo simmetrico a campana, che raggiunge il punto più alto (massimo valore di y) in corrispondenza del valore µ media, mediana e moda coincidono presenta due punti di flesso in corrispondenza di µ+σ e µ-σ; cioè i punti in cui la curva da convessa diventa concava si trovano in corrispondenza a ±1 deviazione standard dalla media La Distribuzione Normale 1 f ( X ) e 2 2 1 X 2 26 La distribuzione normale (2) La regola empirica dice che per una distribuzione simmetrica a campana : Circa il 68% delle osservazioni si trovano entro ± uno scarto quadratico medio della media. Circa il 95% delle osservazioni si trovano entro ± due scarti quadratici medi della media. Quasi tutte (più di 99%) le osservazioni si trovano entro ± tre scarti quadratici medi della media. 9

La regola empirica La Distribuzione Normale (3) La distribuzione normale standardizzata si ottiene con la trasformazione lineare dei punti grezzi in punti z z = x X s Dove x è il valore del soggetto, X è la media del campione, e s è la deviazione standard del campione 29 La distribuzione normale (4) Nella distribuzione normale standardizzata le probabilità corrispondenti alle superfici racchiuse dalla curva normale possono essere calcolate. Queste probabilità sono state tabulate e vengono riportate in apposite tabelle. 30 10

La distribuzione normale (4) Ad esempio, grazie alle tabelle è possibile conoscere l area compresa tra le z = 0 e z = 1,96 31 Indicatori della forma della distribuzione La normalità della distribuzione è fondamento di molte analisi. L asimmetria indica quanto una curva si allontana da una distribuzione normale in termini di spostamento a sinistra o a destra La curtosi indica quanto una curva si allontana da una distribuzione normale in termini di maggiore appiattimento o maggiore allungamento Con valori degli indici di asimmetria e curtosi compresi tra -1 e 1 la distribuzione può considerarsi normale 32 La correlazione Il coefficiente di correlazione è una misura della forza di una relazione lineare tra due variabili X e Y. Una correlazione di -1 corrisponde ad una perfetta relazione negativa e una correlazione di +1 corrisponde ad un perfetta relazione positiva. Il coefficiente di correlazione di Pearson, a partire dai punti z, si calcola nel seguente modo: r = z z N 11

La rappresentazione grafica dei dati di una correlazione La regressione lineare semplice (1) La relazione tra le variabili X e Y, ovvero il modello di regressione lineare semplice, può essere descritta dall equazione di una retta: y = b +b x Dove y è il valore di y predetto in base all equazione, x è il valore del soggetto nella variabile X, b e b sono stime dei parametri che indicano rispettivamente il punto in cui la retta incontra l asse delle y e l inclinazione della retta stessa. La tecnica per trovare l equazione della retta che minimizza la somma totale dei quadrati delle deviazioni tra dati osservati e punti sulla retta si dice metodo dei minimi quadrati. La regressione lineare semplice (2) La distanza tra il valore predetto di Y, ŷ e il valore osservato, y, è detta deviazione o errore di previsione. L errore standard della stima, s y x, è una misura di quanto i dati osservati variano attorno alla retta di regressione. 12

Componenti della variazione dei valori di y Tre tipi di relazioni: Perfettamente negativa, nessuna relazione e perfettamente positiva 13