TECNICHE DI ANALISI DEI DATI
|
|
|
- Clemente Grande
- 9 anni fa
- Просмотров:
Транскрипт
1 TECNICHE DI ANALISI DEI DATI AA 06/07 PROF. V.P. SENESE Questi materiali sono disponibili per tutti gli studenti al seguente indirizzo: Seconda Università di Napoli (SUN) Dipartimento di Psicologia TECNICHE DI ANALISI DEI DATI Prof. V.P. Senese INFERENZA STATISTICA Una volta definito un certo piano sperimentale, potremmo non limitarci a voler considerare una singola specifica manifestazione di tale fenomeno (e l'insieme particolare di numeri-misure che in tale singola esecuzione si ottiene), ma fare invece riferimento alla pluralità delle possibili esecuzioni del medesimo. Sotto questa prospettiva, che diremo probabilisticoinferenziale, ogni singola misura è una variabile poiché, in esecuzioni ripetute del medesimo piano sperimentale, può ottenere differenti risposte.
2 INFERENZA STATISTICA Ogni grandezza variabile (ossia, con possibili variazioni da esecuzione ad esecuzione) è supposta governata da una certa legge di probabilità (detta anche distribuzione di probabilità). Per sottolineare questo presupposto caratteristico, la grandezza variabile è detta variabile casuale o aleatoria ossia variabile la cui instabilità (di prova in prova) è qualificata da certe regolarità di tipo casuale. LE DISTRIBUZIONI TEORICHE Per poter analizzare e interpretare un fenomeno osservato è necessario riferirlo alla sua probabilità di accadimento. A tale scopo in statistica vengono impiegate le distribuzioni teoriche di probabilità il cui vantaggio consiste nella possibilità di stimare per ciascun evento la sua probabilità di accadimento. In Psicologia molte sono le distribuzioni teoriche utilizzate: ) Normale ) Binomiale 3) Chi quadro 4) F di fischer 5) t di student 6)...
3 DISTRIBUZIONE NORMALE È la funzione di probabilità che viene utilizzata per descrivere le variabili casuali continue. È DEFINITA DA: X = = media della popolazione = ds della popolazione L area sottesa alla curva è pari ad. HA LE SEGUENTI CARATTERISTICHE: INFINITA SIMMETRICA UNIMODALE ASINTOTICA Gauss X DISTRIBUZIONE NORMALE Per qualsiasi valore che la variabile X può assumere, attraverso una funzione si calcola la y i corrispondente (probabilità associata). Y y i e x i y i X 3
4 DISTRIBUZIONE NORMALE Punti di flesso Y Media=Moda=Mediana - + X + DISTRIBUZIONE NORMALE La curva NORMALE è definita dai parametri e. Abbiamo un ampia famiglia di distribuzioni normali con medie e deviazioni standard diverse Y - X + 4
5 DISTRIBUZIONE NORMALE con uguali ds ma diverse medie Y - X + DISTRIBUZIONE NORMALE oppure con uguali medie ma diverse ds. Y - X + 5
6 DISTRIBUZIONE NORMALE Qualsiasi siano i parametri e, l area della porzione di curva delimitata dalla media e un ascissa espressa in termini di deviazioni standard è costante. Y 99.73% 95.46% 68.6% X + DISTRIBUZIONE NORMALE Per verificare se la distribuzione dei valori di una variabile è normale, è possibile utilizzare due indicatori statistici: la SIMMETRIA (skewness) sx; dx la CURTOSI (kurtosis) bassa; alta Variano tra - e + e quando assumono valore 0 indicano una distribuzione perfettamente normale. Nella prassi psicologica si considerano normalmente distribuite variabili con valori compresi tra (max ) 6
7 DISTRIBUZIONE NORMALE Nell ambito della famiglia delle distribuzioni normali la possibilità di trasformare i valori di una variabile continua in valori standardizzati consente agli studiosi di far riferimento ad un unica distribuzione di probabilità che risulta indipendente dalla specifica variabile oggetto di studio: i punti z: la distribuzione normale standard. z i x i DISTRIBUZIONE NORMALE STANDARD Si tratta di una distribuzione di probabilità di forma normale associata ai valori di una variabile standardizzata i cui parametri caratteristici sono: = 0 e =. Y + = 34.3% + = 47.73% +3 = 49.86% z + 7
8 DISTRIBUZIONE NORMALE STANDARD z = 0.5 p =.985 DISTRIBUZIONE NORMALE STANDARD In pratica, mediante i punti z, conoscendo la media e la deviazione standard della distribuzione, per qualsiasi valore osservato, è possibile calcolare la probabilità di accadimento. Basta fare riferimento alle tavole dei punti z, o utilizzare un software. Media e dev.st x z i i z xi Tavola punti z /software p(z xi ) = p( ) z y i e 8
9 DISTRIBUZIONE NORMALE STANDARD Riassumendo:. i punti z consentono di calcolare in modo immediato la probabilità di accadimento di un dato valore in una distribuzione di cui se ne conoscano i parametri;. inoltre, i punti z, che come altre scale standardizzate (es. percentili, decili, ecc.), consentono di trasformare su una metrica comune punteggi che appartengono a distribuzioni differenti, possono anche essere utilizzati per confrontare i diversi punteggi. ALTRI PUNTEGGI STANDARDIZZATI 9
10 t di Student La forma della distribuzione t varia secondo la numerosità delle osservazioni (n). Ciascuna distribuzione t è definita da tre parametri:, e (ni gradi di libertà). PROPRIETÀ: INFINITA SIMMETRICA UNIMODALE ASINTOTICA Famiglia di distribuzioni legate a. v ( n ) Distribuzione Normale = 30 = 5 t F FISHER E CHI-QUADRATO Y Distribuzioni: Chi-quadrato e F di Fisher Definite dai gradi di libertà ( nella F)
11 DISTRIBUZIONI TEORICHE Mediante le distribuzioni teoriche è possibile confrontare e interpretare qualsiasi valore osservato. In questo modo non soltanto è possibile confrontare un valore (campione) con la popolazione, ma anche le popolazioni tra loro. LA DISTRIBUZIONE CAMPIONARIA DELLA MEDIA (DCM) La DISTRIBUZIONE CAMPIONARIA DELLA MEDIA (DCM) è una distribuzione teorica di primaria importanza nella metodologia della ricerca psicologica. Consente di svolgere due operazioni importanti: )descrivere probabilisticamente le caratteristiche di un campione; )stimare la probabilità associata ai parametri della popolazione di provenienza.
12 LA DISTRIBUZIONE CAMPIONARIA DELLA MEDIA (DCM) La DCM è una distribuzione di valori medi. Può essere definita come la distribuzione di tutte le medie ottenibili da n campioni casuali di ampiezza k, estratti a partire da una popolazione. Es. k = n = 6 POPOLAZIONE A n n n 3 n 4 n 5 n 6 LA DISTRIBUZIONE CAMPIONARIA DELLA MEDIA (DCM) media DCM N i N x i = media del campione i-esimo N = numerosità totale dei campioni
13 LA DISTRIBUZIONE CAMPIONARIA DELLA MEDIA (DCM) In base al teorema del limite centrale sappiamo che tale distribuzione è approssimata alla normale. LA DISTRIBUZIONE CAMPIONARIA DELLA MEDIA (DCM) Se la popolazione è infinita o se il campionamento è con reinserimento: la media della distribuzione campionaria è uguale alla media della popolazione. DCM l errore standard è uguale alla deviazione standard della popolazione fratto la radice di n: DCM n 3
14 LA DISTRIBUZIONE CAMPIONARIA DELLA MEDIA (DCM) Se la popolazione è finita (N) o se il campionamento è senza reinserimento: la media della distribuzione campionaria è uguale alla media della popolazione: DCM l errore standard è uguale alla deviazione standard della popolazione fratto la radice di n moltiplicato un fattore di correzione: N n DCM n N LA DISTRIBUZIONE CAMPIONARIA DELLA MEDIA (DCM) Se non è nota la varianza (o la ds) della popolazione: la media della distribuzione campionaria è uguale alla media della popolazione: DCM l errore standard è stimabile a partire dalla varianza del campione e quindi: sˆ s n DCM sˆ n s n n 4
15 LA DISTRIBUZIONE CAMPIONARIA DELLA MEDIA (DCM) Usando la DCM, mediante la trasformazione in punti z è possibile stimare la probabilità di osservare una data media ( ) calcolata su di un campione. z X x n x media del campione media della popolazion ds della popolazion e n ampiezza del campione e LA DISTRIBUZIONE CAMPIONARIA DELLA MEDIA (DCM) La trasformazione in punti z consente di esprimere lo scarto tra il VALORE ATTESO (media della popolazione) e il VALORE OSSERVATO (media del campione) in una UNITÀ DI MISURA STANDARD. In questo modo è possibile conoscere e interpretare la probabilità di accadimento del valore osservato. 5
16 LA DISTRIBUZIONE CAMPIONARIA DELLA MEDIA (DCM) Quando il campione è piccolo (n < 30) la distribuzione delle medie dei campioni che si usa non è quella dei punti z ma è quella t di Student. t x s n x media del campione media della popolazion s ds del campione n ampiezza del campione e LA DISTRIBUZIONE CAMPIONARIA DELLA DIFFERENZA TRA MEDIE Supponiamo che siano date due popolazioni (N e N ) dalle quali vengano estratti due sottocampioni (n e n ). POPOLAZIONE A POPOLAZIONE A CAMPIONE a CAMPIONE a 6
17 S S S S 05/0/06 LA DISTRIBUZIONE CAMPIONARIA DELLA DIFFERENZA TRA MEDIE Se per ciascun campione estratto calcoliamo la statistica S (S e S ) e calcoliamo lo scarto tra S e S. Otteniamo una distribuzione delle differenze che è detta distribuzione delle differenze delle statistiche campionarie. S S S S S S S S S S S S LA DISTRIBUZIONE CAMPIONARIA DELLA DIFFERENZA TRA MEDIE Se S e S sono le medie campionarie delle due popolazioni allora la distribuzione delle differenze avrà come media: X X X X mentre come deviazione standard: X X X X N N 7
18 INFERENZA STATISTICA Sul campione si calcolano le STATISTICHE (ad es., x, s,...) per conoscere i PARAMETRI (ad es.,,, ) della popolazione. Questo passaggio dalle statistiche ai parametri si basa sulla conoscenza delle proprietà delle DISTRIBUZIONI CAMPIONARIE dei parametri e viene detto INFERENZA STATISTICA. INFERENZA STATISTICA Insieme dei metodi basati sulla teoria della probabilità che consentono di formulare delle conclusioni sulla variabile casuale associata ad una certa caratteristica di una popolazione, riferendosi all osservazione di un campione di osservazioni. Le conclusioni a cui si può giungere si distinguono in due classi: verifica di ipotesi stima dei parametri 8
19 LA VERIFICA DI IPOTESI Nella ricerca, una volta definito un problema di interesse si definisce l ipotesi generale. Essa rappresenta un grappolo di problemi che non sono mai direttamente osservabili a meno che non vengano concretizzati in un ipotesi scientificamente osservabile: le ipotesi di ricerca. Un ipotesi di ricerca è un affermazione su uno o più parametri relativi alla distribuzione di probabilità di una popolazione. Pertanto la verifica delle ipotesi si basa sulle distribuzioni teoriche di volta in volta chiamate in causa. LA VERIFICA DI IPOTESI Nelle ipotesi di ricerca si suppone una relazione tra una variabile Y con una o più variabili X. L ipotesi di ricerca tipicamente è formulata come: - se X, allora ne consegue che Y - se X, allora probabilmente Y Generalmente X è una variabile indipendente mentre Y è una variabile dipendente. 9
20 LA VERIFICA DI IPOTESI L ipotesi di ricerca: () deve essere formulata in termini operativi () deve considerare tutti i possibili risultati (3) deve essere empiricamente verificabile Un ipotesi si ritiene verificata quando è stata sottoposta alla prova dei fatti. Al termine della verifica l ipotesi può essere: (a) confermata (b) respinta LA VERIFICA DI IPOTESI La prima tappa del processo di verifica consiste nel definire l ipotesi nulla (H 0 ). L ipotesi nulla è una ipotesi di non effetto e dovrebbe rappresentare la negazione dell ipotesi che si vuole verificare. Quando si respinge l ipotesi nulla si supporta l ipotesi alternativa (H ). L ipotesi alternativa è l espressione dell ipotesi di ricerca da cui parte lo sperimentatore 0
21 Supponiamo che una teoria socio-psicologica porti a prevedere che due gruppi di persone (es., uomini e donne) differiscono tra loro per il tempo dedicato alla cura dei figli. Questa supposizione potrebbe trasformarsi in un ipotesi di ricerca. Più specificamente l ipotesi di ricerca potrebbe essere: se è vero che le due popolazioni (di cui i due gruppi sono rappresentativi) sono diverse, allora dovrebbero differire nel tempo medio giornaliero dedicato a giocare con i figli ( G ). Le ipotesi allora potrebbero essere: H H 0 G G G G ESEMPIO H G G G G LA VERIFICA DI IPOTESI L ipotesi alternativa (H ) o sperimentale si definisce: si fissa un unico valore del parametro SEMPLICE H 50 G COMPOSTA - BIDIREZIONALE - MONODIREZIONALE H G H si fissano diversi valori del parametro G G G G G
22 LA VERIFICA DI IPOTESI Accettare l ipotesi nulla o l ipotesi alternativa non è mai una decisione assoluta. La decisione è sempre soggetta ad errore. Come vedremo i dati permettono solo di fare affermazioni probabilistiche riguardo alle ipotesi (basate sulle distribuzioni di probabilità di volta in volta utilizzate). L ipotesi nulla (H 0 ) serve a specificare la distribuzione campionaria sulla quale si basa la verifica. LA VERIFICA DI IPOTESI Dopo aver formulato le ipotesi di ricerca la fase successiva è relativa alla scelta del test statistico da utilizzare per la verifica delle ipotesi. Per operare una giusta scelta è necessario conoscere i principi e le proprietà dei diversi test statistici utili alla loro applicabilità.
23 LA VERIFICA DI IPOTESI Definito il test appropriato il passo successivo è la scelta del criterio di significatività ( e ) e della dimensione campionaria (N). Il livello di significatività rappresenta il criterio in base al quale decido se confermare l ipotesi nulla (H 0 ) o rifiutarla in favore dell ipotesi alternativa (H ). ERRORE DI I TIPO Si definisce errore di I tipo la probabilità di rifiutare l ipotesi nulla (H 0 ) quando è vera. La probabilità di questo errore è simboleggiata con la lettera greca. Nella verifica delle ipotesi i valori di e N si fissano anticipatamente. 3
24 ERRORE DI I TIPO La scelta del livello di significatività implica la definizione del grado di sicurezza con il quale si vuole prendere la decisione. Per convenzione si adottano come livelli critici per la decisione: =.05 rischio di sbagliare rifiutando H 0 quando essa è vera 5 volte su 00 =.0 rischio di sbagliare rifiutando H 0 quando essa è vera volta su 00 =.00 rischio di sbagliare rifiutando H 0 quando essa è vera volta su 000 LA VERIFICA DI IPOTESI Supponiamo di avere stimato una statistica, che i valori di questa statistica siano regolati dalla distribuzione normale, di avere un ipotesi monodirezionale e di aver scelto come livello critico =.05. Trasformando la statistica in punti z è possibile conoscere il livello di probabilità associato con il valore osservato e confrontarlo con il livello critico: =.05 z =.64 H 0 z =.64 Zona di conferma H 0 Zona di rifiuto H 0 p <
25 LA VERIFICA DI IPOTESI Ipotesi monodirezionale, =.0 =.0 z =.3 H 0 z =.3 Zona di conferma H 0 Zona di rifiuto H 0 p < LA VERIFICA DI IPOTESI Ipotesi bidirezionale, =.05 =.05 =.05/ =.05 z =.96 z = -.96 H 0 z =.96 Zona di conferma H 0 Zona di rifiuto H 0 p s <
26 EFFECT SIZE Si definisce grandezza dell effetto (effect size) la forza della relazione tra due variabili. V. Ind. H 0 H Effect size r d Pearson Cohen z x z i N M M s yi - + ERRORE DI II TIPO E POTENZA Si definisce errore di II tipo la probabilità di accettare l ipotesi nulla (H 0 ) quando è falsa. La probabilità di questo errore è simboleggiata con la lettera greca. Nella verifica delle ipotesi il valore di non viene scelto arbitrariamente ma si calcola in base ai parametri, n e alla grandezza dell effetto. La potenza statistica (power) è collegata all errore di II tipo: è la probabilità di prendere la decisione giusta. Vale a dire: rifiutare l ipotesi nulla (H 0 ) quando è falsa 6
27 ERRORE DI I e II TIPO In ogni inferenza statistica esiste il rischio di commettere uno dei due tipi di errori alternativi. Se diminuisce aumenta. Evitare errori di I tipo può portare ad una elevata probabilità di commettere errori di II tipo. H 0 =.05 H - + ERRORE DI I e II TIPO In ogni inferenza statistica esiste il rischio di commettere uno dei due tipi di errori alternativi. Se diminuisce aumenta. Evitare errori di I tipo può portare ad una elevata probabilità di commettere errori di II tipo. H 0 =.0 H - + 7
28 ERRORE DI I e II TIPO Anche l effect size influenza l errore di II tipo. Maggiore è il suo valore minore è la probabilità di incorrere in un errore di II tipo. Effect size H 0 =.0 H H b A parità di parametri, per ridurre entrambi gli errori si deve aumentare l N - + ERRORE DI I e II TIPO Per poter interpretare correttamente i risultati di un analisi, un indice necessario è la potenza statistica che esprime la capacità di trovare un effetto quando quest effetto esiste realmente. La potenza dovrebbe essere almeno uguale a.80. H 0 H =.0 potenza statistica p = - + 8
29 LA DECISIONE STATISTICA 05/0/06 Es. POTENZA ERRORE DI I e II TIPO LA REALTÀ NELLA POPOLAZIONE H 0 VERA H 0 FALSA H 0 CONFERMATA H RIFIUTATA H 0 RIFIUTATA H CONFERMATA Decisione corretta nessun errore Prob.: Decisione errata errore di I tipo Prob.: Decisione errata errore di II tipo Prob.: Decisione corretta nessun errore Prob.: 9
30 STIMA DEI PARAMETRI Si definisce corretta la statistica il cui valore stimato sul campione corrisponde al rispettivo parametro della popolazione. In caso contrario la statistica si definisce stimatore distorto. Es. La media campionaria è uno stimatore corretto della media della popolazione, essendo: E( X ) Es. La deviazione standard campionaria è uno stimatore distorto della ds della popolazione, essendo: E(s) STIMA DEI PARAMETRI Una stima è tanto più efficiente quanto minore è la varianza (o la ds) della propria distribuzione campionaria. Una stima è detta PUNTUALE quando la stima del parametro è data da un valore unico. Una stima è detta INTERVALLARE quando viene definito un intervallo entro il quale è compreso il valore del parametro reale
31 STIMA DEI PARAMETRI Nella stima intervallare è possibile definire la precisione della stima. Questo le rende preferibili alle stime puntuali. Es. se dopo aver somministrato un test di intelligenza ( = 00; = 5) affermiamo che il soggetto i ha un QI pari a 0 produciamo una stima puntuale. Es. se affermiamo che allo stesso test il medesimo soggetto i ha un QI compreso tra 95 e 5, produciamo una stima intervallare, che (in base alla distribuzione normale) è vera al 68.3% ( ). IC[ 68.3%] 0 5 3
Statistica Inferenziale
Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione
Distribuzioni campionarie
1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari
STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA
Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE
Teoria e tecniche dei test
Teoria e tecniche dei test Lezione 9 LA STANDARDIZZAZIONE DEI TEST. IL PROCESSO DI TARATURA: IL CAMPIONAMENTO. Costruire delle norme di riferimento per un test comporta delle ipotesi di fondo che è necessario
Approssimazione normale alla distribuzione binomiale
Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N
Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.
5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema
Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1
Campionamento La statistica media campionaria e la sua distribuzione 1 Definisco il problema da studiare: es. tempo di percorrenza tra abitazione e università Carattere: tempo ossia v.s. continua Popolazione:
Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
Gli errori nella verifica delle ipotesi
Gli errori nella verifica delle ipotesi Nella statistica inferenziale si cerca di dire qualcosa di valido in generale, per la popolazione o le popolazioni, attraverso l analisi di uno o più campioni E
Intervallo di confidenza
Intervallo di confidenza Prof. Giuseppe Verlato, Prof. Roberto de Marco Sezione di Epidemiologia e Statistica Medica, Università di Verona campione inferenza popolazione Media Riportare sempre anche Stima
Distribuzioni e inferenza statistica
Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione
Schema lezione 5 Intervalli di confidenza
Schema lezione 5 Intervalli di confidenza Non centrerò quella barca, ne sono convinto al 95% COMPRENDERE: Significato di intervallo di confidenza Uso degli stimatori come quantità di pivot per stime intervallari
standardizzazione dei punteggi di un test
DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano [email protected] standardizzazione dei punteggi di un test serve a dare significato ai punteggi che una persona ottiene ad un test, confrontando la
Distribuzione Gaussiana - Facciamo un riassunto -
Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura
Teoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni
La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con
PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI
PSICOMETRIA Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI CAMPIONI INDIPENDENTI Campioni estratti casualmente dalla popolazione con caratteristiche omogenee Assegnazione
N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.
N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume
Esercitazione 8 maggio 2014
Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un
DISTRIBUZIONE NORMALE (1)
DISTRIBUZIONE NORMALE (1) Nella popolazione generale molte variabili presentano una distribuzione a forma di campana, bene caratterizzata da un punto di vista matematico, chiamata distribuzione normale
Test d Ipotesi Introduzione
Test d Ipotesi Introduzione Uno degli scopi più importanti di un analisi statistica è quello di utilizzare i dati provenienti da un campione per fare inferenza sulla popolazione da cui è stato estratto
Il confronto fra medie
L. Boni Obiettivo Verificare l'ipotesi che regimi alimentari differenti non producano mediamente lo stesso effetto sulla gittata cardiaca Ipotesi nulla IPOTESI NULLA La dieta non dovrebbe modificare in
le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:
DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano [email protected] si basano su tre elementi: le scale di misura sistema empirico: un insieme di entità non numeriche (es. insieme di persone; insieme
Il campionamento e l inferenza. Il campionamento e l inferenza
Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento
Un esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione
La verifica delle ipotesi In molte circostanze il ricercatore si trova a dover decidere quale, tra le diverse situazioni possibili riferibili alla popolazione, è quella meglio sostenuta dalle evidenze
Teorema del limite centrale TCL
Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazione lineare di N variabili aleatorie le cui funzioni
STATISTICA ESERCITAZIONE
STATISTICA ESERCITAZIONE Dott. Giuseppe Pandolfo 1 Giugno 2015 Esercizio 1 Una fabbrica di scatole di cartone evade il 96% degli ordini entro un mese. Estraendo 300 campioni casuali di 300 consegne, in
Esercitazione 8 del corso di Statistica 2
Esercitazione 8 del corso di Statistica Prof. Domenico Vistocco Dott.ssa Paola Costantini 6 Giugno 8 Decisione vera falsa è respinta Errore di I tipo Decisione corretta non è respinta Probabilità α Decisione
L indagine campionaria Lezione 3
Anno accademico 2007/08 L indagine campionaria Lezione 3 Docente: prof. Maurizio Pisati Variabile casuale Una variabile casuale è una quantità discreta o continua il cui valore è determinato dal risultato
b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):
ESERCIZIO 1 Una grande banca vuole stimare l ammontare medio di denaro che deve essere corrisposto dai correntisti che hanno il conto scoperto. Si seleziona un campione di 100 clienti su cui si osserva
STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE
STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono sovente
Intervalli di confidenza
Probabilità e Statistica Esercitazioni a.a. 2006/2007 C.d.L.: Ingegneria per l Ambiente ed il Territorio, Ingegneria Civile, Ingegneria Gestionale, Ingegneria dell Informazione C.d.L.S.: Ingegneria Civile
LA DISTRIBUZIONE NORMALE
LA DISTRIBUZIONE NORMALE Italo Nofroni Statistica medica - Facoltà di Medicina Sapienza - Roma La più nota ed importante distribuzione di probabilità è, senza alcun dubbio, la Distribuzione normale, anche
STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE
1 STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze, assolute o percentuali. Osservazioni cliniche conducono
Concetti principale della lezione precedente
Corso di Statistica medica e applicata 9 a Lezione Dott.ssa Donatella Cocca Concetti principale della lezione precedente I concetti principali che sono stati presentati sono: Variabili su scala nominale
Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 05-Deviazione standard e punteggi z vers. 1.1 (22 ottobre 2014) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca
3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
Esercizi di Probabilità e Statistica
Esercizi di Probabilità e Statistica Samuel Rota Bulò 6 giugno 26 Statistica Esercizio Sia {X n } n una famiglia di v.a. di media µ e varianza σ 2. Verificare che X = n n X i σ 2 = n (X i µ) 2 S 2 = n
FENOMENI CASUALI. fenomeni casuali
PROBABILITÀ 94 FENOMENI CASUALI La probabilità si occupa di fenomeni casuali fenomeni di cui, a priori, non si sa quale esito si verificherà. Esempio Lancio di una moneta Testa o Croce? 95 DEFINIZIONI
STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
Capitolo 8. Probabilità: concetti di base
1 Capitolo 8 Probabilità: concetti di base Statistica - Metodologie per le scienze economiche e sociali 2/ed S. Borra, A. Di Ciaccio Copyright 2008 The McGraw-Hill Companies srl 2 Concetti primitivi di
Test di ipotesi su due campioni
2/0/20 Test di ipotesi su due campioni Confronto tra due popolazioni Popolazioni effettive: unità statistiche realmente esistenti. Esempio: Confronto tra forze lavoro di due regioni. Popolazioni ipotetiche:
Esercizi riassuntivi di Inferenza
Esercizi riassuntivi di Inferenza Esercizio 1 Un economista vuole stimare il reddito medio degli abitanti di una cittadina mediante un intervallo al livello di confidenza del 95%. La distribuzione del
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e
DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.
Corso di Laurea Specialistica in Biologia Sanitaria, Universita' di Padova C.I. di Metodi statistici per la Biologia, Informatica e Laboratorio di Informatica (Mod. B) Docente: Dr. Stefania Bortoluzzi
Note sulla probabilità
Note sulla probabilità Maurizio Loreti Dipartimento di Fisica Università degli Studi di Padova Anno Accademico 2002 03 1 La distribuzione del χ 2 0.6 0.5 N=1 N=2 N=3 N=5 N=10 0.4 0.3 0.2 0.1 0 0 5 10 15
Statistica Metodologica Avanzato Test 1: Concetti base di inferenza
Test 1: Concetti base di inferenza 1. Se uno stimatore T n è non distorto per il parametro θ, allora A T n è anche consistente B lim Var[T n] = 0 n C E[T n ] = θ, per ogni θ 2. Se T n è uno stimatore con
Campionamento La statistica media campionaria e la sua distribuzione
Campionamento La statistica media campionaria e la sua distribuzione 1 Definisco il problema da studiare: es. tempo di percorrenza tra abitazione e università Carattere: tempo ossia v.s. continua Popolazione:
Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva
Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.
Statistica. Matematica con Elementi di Statistica a.a. 2015/16
Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati
STIMA DELLA VARIANZA CAMPIONARIA
STIMA DELLA VARIANZA CAMPIONARIA Abbiamo visto che una stima puntuale corretta per il valore atteso µ delle variabili aleatorie X i è x n = (x 1 +.. + x n )/n. Una stima puntuale della varianza σ 2 delle
Analisi della varianza
Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.
Statistica. Lezione 4
Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 4 a.a 2011-2012 Dott.ssa Daniela
Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)
STATISTICA (2) ESERCITAZIONE 5 26.02.2014 Dott.ssa Antonella Costanzo Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota) Il responsabile del controllo qualità di un azienda che
Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 13-Il t-test per campioni indipendenti vers. 1.1 (12 novembre 2014) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di
Capitolo 11 Test chi-quadro
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara Docenti: Dott.
Distribuzioni campionarie. Antonello Maruotti
Distribuzioni campionarie Antonello Maruotti Outline 1 Introduzione 2 Concetti base Si riprendano le considerazioni fatte nella parte di statistica descrittiva. Si vuole studiare una popolazione con riferimento
Esercitazione: La distribuzione NORMALE
Esercitazione: La distribuzione NORMALE Uno dei più importanti esempi di distribuzione di probabilità continua è dato dalla distribuzione Normale (curva normale o distribuzione Gaussiana); è una delle
Statistica Un Esempio
Statistica Un Esempio Un indagine sul peso, su un campione di n = 100 studenti, ha prodotto il seguente risultato. I pesi p sono espressi in Kg e sono stati raggruppati in cinque classi di peso. classe
DISTRIBUZIONI DI PROBABILITA
DISTRIBUZIONI DI PROBABILITA La distribuzione di probabilità e un modello matematico, uno schema di riferimento, che ha caratteristiche note e che può essere utilizzato per rispondere a delle domande derivate
LE DISTRIBUZIONI CAMPIONARIE
LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria
Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016
Esercitazione 12 maggio 2016 ESERCIZIO 1 Si supponga che in un sondaggio di opinione su un campione di clienti, che utilizzano una carta di credito di tipo standard (Std) o di tipo business (Bsn), si siano
Statistica Inferenziale
Statistica Inferenziale Prof. Raffaella Folgieri Email: [email protected] aa 2009/2010 Esercizio 1 (stima puntuale) In un processo di controllo di qualità, siamo interessati al numero mensile di guasti
Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi
Esercitazione 14 Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () 1 / 14 Ex.1: Verifica Ipotesi sulla media (varianza nota) Le funi prodotte da un certo macchinario hanno una
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi
ISTOGRAMMI E DISTRIBUZIONI:
ISTOGRAMMI E DISTRIBUZIONI: i 3 4 5 6 7 8 9 0 i 0. 8.5 3 0 9.5 7 9.8 8.6 8. bin (=.) 5-7. 7.-9.4 n k 3 n k 6 5 n=0 =. 9.4-.6 5 4.6-3.8 3 Numero di misure nell intervallo 0 0 4 6 8 0 4 6 8 30 ISTOGRAMMI
Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016
Esame di Statistica 0 o CFU) CLEF febbraio 06 Esercizio Si considerino i seguenti dati, relativi a 00 clienti di una banca a cui è stato concesso un prestito, classificati per età e per esito dell operazione
Scheda Corso di STATISTICA (D.M. 270 per 9 CFU) Anno Accademico 2014/2015 (versione in Italiano)
Scheda Corso di STATISTICA (D.M. 270 per 9 CFU) Anno Accademico 2014/2015 (versione in Italiano) FACOLTA :ECONOMIA CORSI DI LAUREA: Economia e Commercio, Psicoeconomia e Scienze Bancarie ed Assicurative
Distribuzione Normale
Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di
Corso di Psicometria Progredito
Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione
Analisi degli Errori di Misura. 08/04/2009 G.Sirri
Analisi degli Errori di Misura 08/04/2009 G.Sirri 1 Misure di grandezze fisiche La misura di una grandezza fisica è descrivibile tramite tre elementi: valore più probabile; incertezza (o errore ) ossia
Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.
Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza. Misure ripetute forniscono dati numerici distribuiti attorno ad un valore centrale indicabile con un indice (indice
Elementi di Psicometria
Elementi di Psicometria 7-Punti z e punti T vers. 1.0a (21 marzo 2011) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2010-2011 G. Rossi (Dip. Psicologia)
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
Il test (o i test) del Chi-quadrato ( 2 )
Il test (o i test) del Chi-quadrato ( ) I dati: numerosità di osservazioni che cadono all interno di determinate categorie Prima di tutto, è un test per confrontare proporzioni Esempio: confronto tra numero
Capitolo 6 La distribuzione normale
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 6 La distribuzione normale Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
Distribuzioni di probabilità
Distribuzioni di probabilità Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione
TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo
TOPOGRAFIA 2013/2014 L operazione di misura di una grandezza produce un numero reale che esprime il rapporto della grandezza stessa rispetto a un altra, a essa omogenea, assunta come unità di misura. L
CAMPIONAMENTO - ALCUNI TERMINI CHIAVE
CAMPIONAMENTO - ALCUNI TERMINI CHIAVE POPOLAZIONE = qualsiasi insieme di oggetti (unità di analisi) di ricerca N = ampiezza della popolazione PARAMETRI = caratteristiche della popolazione [media, proporzione
Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura
INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI
Capitolo 5 Confidenza, significatività, test di Student e del χ 2
Capitolo 5 Confidenza, significatività, test di Student e del χ 5.1 L inferenza Se conosciamo la legge di probabilità di un evento (a priori o a posteriori) possiamo fare delle previsioni su come l evento
Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)
Sintesi dei dati in una tabella Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6) Sintesi dei dati Spesso si vuole effettuare una sintesi dei dati per ottenere indici
MISURAZIONE. Sistema empirico (SE): ciò che si vuole misurare; costituito da elementi legati tra loro da relazioni
Attendibilità Misurazione I problemi di misurazione degli oggetti di studio sono comuni a tutte le discipline scientifiche. In psicologia il problema è solo più evidente, non più grave. I costrutti che
Vedi: Probabilità e cenni di statistica
Vedi: http://www.df.unipi.it/~andreozz/labcia.html Probabilità e cenni di statistica Funzione di distribuzione discreta Istogrammi e normalizzazione Distribuzioni continue Nel caso continuo la probabilità
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
UNIVERSITÀ DEGLI STUDI DI PERUGIA
SIGI, Statistica II, esercitazione n. 3 1 UNIVERSITÀ DEGLI STUDI DI PERUGIA FACOLTÀ DI ECONOMIA CORSO DI LAUREA S.I.G.I. STATISTICA II Esercitazione n. 3 Esercizio 1 Una v.c. X si dice v.c. esponenziale
Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.
Statistica inferenziale La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Verifica delle ipotesi sulla medie Quando si conduce una
