Il confronto tra due campioni
|
|
- Lisa Leo
- 7 anni fa
- Visualizzazioni
Transcript
1 DECIMA UNITA Il confronto tra due campioni Nell unità precedente abbiamo approfondito come si può procedere nello stimare i parametri di una popolazione a partire dalle statistiche di un suo campione. Il teorema di limite centrale, in particolare, ci ha fornito i mezzi per giungere a stime per le quali potevano anche indicare gli intervalli di confidenza. In altre parole, identificare la probabilità che le nostre conclusioni fossero esatte o anche controllare la probabilità di compiere un errore di stima. Quando si conoscono i parametri della popolazione, e in particolare s, è possibile ricorrere alla distribuzione di z per poter giungere a valutazioni adeguate e prendere decisioni in condizioni di incertezza controllata. Tuttavia, si è anche constatato che quando non si conoscono i parametri di una popolazione e ancor più quando l ampiezza del campione considerato è modesta, occorre ricorrere a un nuovo tipo di distribuzione, o meglio a una famiglia di distribuzioni, quella del t di Student. In questa unità esamineremo più da vicino le opportunità che offre questa distribuzione per affrontare le seguenti situazioni: a) confrontare la media delle differenze tra due campioni dipendenti (cioè correlati tra di loro) e la media attesa; b) confrontare tra loro le medie di due campioni indipendenti, cioè non correlati tra di loro. In particolare ci interessa affrontare un insieme di questioni assai interessante e denso di applicazioni nel campo delle scienze dell educazione. Esso può essere espresso in questi termini. Abbiamo due campioni dei quali possiamo elaborare le loro statistiche. A partire da questi dati è possibile stimare se essi provengono da una medesima popolazione o se, invece, essi mettono in evidenza l esistenza di due distinte popolazioni? Quale grado di fiducia possiamo assegnare alle conclusioni raggiunte? 1. Il caso relativo al confronto tra le medie di due campioni indipendenti, cioè non correlati tra di loro. E questo il caso più frequente nelle indagini svolte nell ambito delle scienze dell educazione. Si vuole infatti chiarire se le medie individuate in due campioni differiscano tra loro in modo significativo e se su questa base è possibile inferire che essi sono tratti da due popolazioni diverse. Si tratta, cioè, di trovare le strade per ottenere informazioni tali che ci garantiscano, almeno a un sufficiente livello di fiducia, cioè di probabilità, che i campioni presi in considerazione provengono da una stessa o da differenti popolazioni. Se utilizziamo un certo metodo di intervento psicologico a un gruppo sperimentale e confrontiamo i risultati ottenuti con quelli di un gruppo paragonabile di controllo, le differenze che riscontriamo sono tali che possiamo affermare di essere di fronte a due popolazioni diverse dal punto di vista adottato? Con quale grado di fiducia? Oppure in realtà si tratta della stessa popolazione, cioè il trattamento adottato nel gruppo sperimentale non dà risultati significativamente diversi da quelli che riscontriamo in quello di controllo. Inoltre, questi risultati sono generalizzabili a tutta la popolazione di riferimento? Con quale grado di fiducia? 97
2 Per affrontare problematiche di questo tipo è stato utile, come per quelle considerate nell unità precedente, ricorrere a una distribuzione ideale di riferimento, che, come si può facilmente pensare, è proprio quella normale. Vediamo come si può procedere. Invece di considerare la distribuzione delle medie dei campioni estraibili da una popolazione, in questo caso si prende in considerazione la distribuzione delle differenze tra le medie di due campioni. E facile pensare che alcune di queste differenze saranno minime, qualcuna potrà anche essere uguale a zero, ma altre potrebbero essere anche assai ampie. L insieme delle differenze di tutte le possibili coppie estraibili viene a costituire un nuovo tipo di distribuzione di frequenze. Se i campioni estratti sono sufficientemente grandi quanto a numero di unità statistiche e i campioni provengono dalla stessa popolazione la distribuzione delle differenze tra le medie delle coppie di campioni assumerà approssimativamente la forma normale. La media di questa distribuzione sappiamo che è zero. Otteniamo così quella che si chiama la distribuzione campionaria delle differenze tra le medie. Mentre la sua media è zero, la sua dispersione dipende dalla dispersione della popolazione. La deviazione standard di questa distribuzione è denominata errore standard delle differenze tra le medie. A esempio, immaginiamo di estrarre a caso due campioni alla volta (senza reimmissione) da una popolazione, per la quale si abbia µ = 5,0 e s = 0,99. Estraiamo due unità per il primo campione (cioè, n 1 = 2) e tre unità per il secondo campione (cioè, n 2 = 3). Per esempio, possiamo estrarre 5 e 6 per il primo campione e 4, 4, 7 per il nostro secondo campione. Ora, poiché X 1 = 5,5 e X 2 = 5,0, sarà X 1 - X 2 = 0,5. Supponiamo adesso di continuare a estrarre campioni con n 1 = 2 e n 2 = 3, finché non abbiamo ottenuto un gran numero di coppie di campioni. Se calcoliamo le differenze tra le medie delle coppie di campioni e trattiamo ciascuna differenza come un punteggio, possiamo costruire una distribuzione di frequenza delle differenze stesse. Quale dovrebbe essere intuitivamente la forma di questa distribuzione di frequenza? Avendo selezionato coppie di campioni dalla stessa popolazione, con una procedura casuale, ci dovremmo aspettare una distribuzione normale con media uguale 0. Facendo un passo in più, possiamo descrivere la distribuzione della differenza tra coppie di medie campionarie, anche nel caso in cui i campioni non sono estratti dalla stessa popolazione. Avremo infatti una distribuzione normale con media (µ x1-x2 ) uguale a µ 1 µ 2 e deviazione standard (s x1-x2 ) denominata anche errore standard della differenza tra le medie uguale a Così la distribuzione campionaria della statistica: è una distribuzione normale che ci consente pertanto di ricorrere a una curva normale standardizzata per la verifica statistica delle ipotesi. La statistica z viene impiegata solamente allorché sono noti i parametri della popolazione. Poiché solo raramente essi sono noti, siamo costretti ancora una volta a stimare l errore standard, che nel nostro caso è s x1-x2. 98
3 Se estraiamo un campione di n 1 individui da una popolazione con varianza incognita ed un secondo campione di n 2 individui da un altra popolazione con varianza incognita, l errore standard della differenza tra le medie, può essere calcolato mediante la formula oppure Tuttavia, se n 1 e n 2 = n, le formule si possono semplificare: dove n è il numero di elementi appartenenti a ciascuno dei due campioni. Le precedenti formule rappresentano stime distorte dell errore standard della differenza tra le medie. Tuttavia al crescere di n, esse tendono a divenire stime corrette. La stima corretta, che suppone i due campioni estratti da popolazioni con la stessa varianza, cumula la somma dei quadrati, nonché i gradi di libertà dei due campioni al fine di ottenere una stima globale dell errore standard della differenza. Pertanto: Tuttavia, se n 1 e n 2 = n, la formula si semplifica e diventa: Per ottenere la somma dei quadrati nei due gruppi, possiamo applicare una formula già incontrata per ogni campione e quindi ottenere: Allorché gli n sono uguali le varie formule sono algebricamente identiche. Così, per n uguale in ambedue i campioni, una qualunque di esse può essere utilizzata a seconda delle condizioni disponibili per il loro calcolo. La statistica utilizzata per la verifica delle ipotesi, quando la deviazione standard della popolazione non è nota, è il rapporto t 99
4 in cui (µ 1 µ 2 ) è il valore atteso sulla base dell ipotesi nulla. La t di Student richiede una stima corretta di s x1-x2 perciò le formule precedentemente introdotte possono essere usate per calcolare s x1-x2 La tavola fornisce i valori critici della t, necessari per determinare la significatività del test ai vari livelli di a. Poiché i gradi di libertà di ogni campione sono pari rispettivamente ad n 1-1 e n 2-1, il numero totale di gl sarà pari ad n 1 + n 2 2. Problema Un ricercatore è interessato a determinare se un dato farmaco ha effetto sul rendimento di alcuni soggetti impegnati in un compito di coordinazione psico-motoria. Si scelgono 9 soggetti per il gruppo 1 (gruppo sperimentale) ai quali prima della prova si somministra il farmaco. Contemporaneamente i 10 soggetti del gruppo 2 (gruppo di controllo) ricevono del placebo. Poniamo questo problema in termini statistici. I risultati dell esperimento sono presentati nella tabella 10.1 Tab Punteggio di due gruppi di soggetti in un test di coordinazione psico-motoria. Ipotesi nulla (H 0 ): Non c è alcuna differenza a livello di popolazione tra le medie del gruppo di coloro che hanno assunto il farmaco nel test di coordinazione psico-motoria; cioè µ 1 = µ 2 o µ 1 µ 2 = 0. Ipotesi alternativa (H 1 ): Esiste una qualche differenza a livello di popolazione tra le medie dei punteggi ottenuti dai due gruppi nel test di coordinazione psico-motoria. Noterete che la nostra ipotesi alternativa è non direzionale. Pertanto, dovremo usare un test di significatività di tipo bidirezionale, cioè µ 1? µ 2. Test statistico: Dovendo confrontare due medie campionarie, nella presunzione che esse provengano da popolazioni distribuite normalmente e con uguale varianza, è appropriato l uso del test della t di Student, relativamente al caso di due campioni. Livello di significatività: a = 0,05. Distribuzione campionaria: La distribuzione campionaria è data dalla distribuzione della t di 100
5 Student con gl n 1 + n 2 2, cioè = 17. Regione critica: Poiché H 1 è un ipotesi non direzionale, la regione critica è costituita da tutti i valori di t minori o uguali a -2,110 e maggiori o uguali a 2,110. Essendo n 1? n ed avendo supposto le varianze uguali, utilizzeremo la formula per stimare l errore standard della differenza tra le medie. La somma dei quadrati del gruppo 1 è: Analogamente, la somma dei quadrati nel gruppo 2 è: Pertanto il valore di t è dato da Decisione: Poiché la t che abbiamo ottenuto cade entro le regione critica, respingiamo l ipotesi H 0. Il valore negativo di t sta semplicemente ad indicare che la media del gruppo 2 è maggiore della media del gruppo 1. Nell utilizzare la Tavola B, non teniamo conto del segno di t. 2. Il caso relativo al confronto tra le medie di due campioni dipendenti, cioè correlati tra di loro. Uno dei maggiori problemi che deve affrontare lo studioso del comportamento è l estrema variabilità dei suoi dati. In effetti, è proprio a causa di questa variabilità che egli è costretto a far ricorso agli strumenti dell inferenza statistica. Allorché un esperimento viene effettuato e quindi si ottengono i dati relativi a due o più gruppi ed inoltre si trova una certa differenza dei valori medi nei due gruppi stessi, ci si pone la seguente domanda: «La differenza che noi abbiamo osservato è così grande da risultare improbabile la sua attribuzione a fattori puramente casuali?» Come abbiamo visto, la semplice ispezione visiva dei dati non è generalmente sufficiente per rispondere alla domanda precedente, proprio a causa di una certa sovrapposizione dei gruppi sperimentali, dal punto di vista delle risposte. Questa sovrapposizione, d altra parte, è da attribuire al fatto che i soggetti stessi rispondono in maniera estremamente variabile alle condizioni sperimentali. In un dato esperimento, i punteggi di ciascun soggetto sulla variabile risposta possono essere considerati come la risultante di tre fattori: (1) l attitudine del soggetto stesso e/o la sua abilità nel compito assegnatogli; (2) gli effetti della variabile sperimentale; e (3) l errore casuale dovuto ad un ampia gamma di differenti cause, quali la variabilità delle condizioni sperimentali 101
6 stesse, da esperimento ad esperimento, oppure le fluttuazioni momentanee di elementi, quali possono essere, l attenzione del soggetto, le motivazioni del soggetto stesso nell esperimento, e così via. Per quanto riguarda l errore casuale non c è gran che da fare, se non cercare di controllare al massimo le condizioni sperimentali stesse. Per quanto riguarda invece gli effetti della variabile sperimentale, essa costituisce proprio l oggetto della nostra ricerca. Nella maggior parte delle ricerche, la differenza individuale tra i soggetti costituisce di gran lunga il fattore più importante dell intrinseca variabilità dei punteggi sulla variabile risposta. Tutto ciò che possiamo fare in questo caso è di tenere conto di questo tipo di variabilità cercando di rimuoverla per quanto è possibile, così da poter evidenziare l effetto della variabile sperimentale stessa sulla risposta dei soggetti. Questo capitolo è dedicato alle tecniche comunemente impiegate per raggiungere questo obiettivo e che possiamo comprendere nel termine di: campioni correlati. Nella nostra precedente discussione sulla t di Student abbiamo presentato la formula per la stima dell errore standard della differenza tra le medie, cioè In effetti questa non è la formula più generale per il calcolo dell errore standard della differenza, in quanto essa è la seguente: L ultimo termine della precedente formula viene eliminato ogni qual volta i soggetti del campione sono assegnati con una procedura casuale alle varie condizioni sperimentali; questo fatto comporta che allorché i punteggi vengono associati in maniera puramente casuale la correlazione tra i due campioni dovrà essere zero. Qualunque correlazione che si potrà ritrovare in questi casi dovrà essere considerata come spuria, nella misura in cui l associazione tra i punteggi è stata effettuata in maniera puramente casuale. Conseguentemente, allorché i soggetti sono assegnati alle condizioni sperimentali in maniera puramente casuale, l ultimo termine si riduce a zero (in quanto si ha r = 0). Tuttavia si danno parecchie situazioni sperimentali in cui noi non assegniamo i soggetti in maniera casuale alle condizioni sperimentali La maggior parte di queste situazioni può essere classificata in due gruppi. 1. Piano sperimentale del tipo prima - dopo. L osservazione su un soggetto viene effettuata sia prima che dopo l introduzione della variabile sperimentale. L assunzione fondamentale è che ciascun individuo rimanga relativamente coerente con se stesso nel corso di tutto l esperimento. In questo caso esisterà indubbiamente una correlazione tra il campione dei punteggi rilevati prima ed il campione dei punteggi rilevati dopo l introduzione della variabile sperimentale. 2. Piano sperimentale per gruppi appaiati. Gli individui appartenenti sia al gruppo sperimentale che al gruppo di controllo vengono accoppiati sulla base di una stessa variabile che risulta essere correlata alla variabile dipendente, cioè alla variabile risposta. Così se siamo interessati a determinare l effetto di un certo farmaco sulla capacità degli individui di risolvere un problema matematico, possiamo appaiare gli individui sulla base della stima del loro quoziente di intelligenza, oppure in base al loro addestramento in matematica oppure in base all anno di iscrizione ad una data facoltà od anche in base al loro rendimento nella soluzione di altri problemi matematici. Un tale piano sperimentale presenta due vantaggi: a) Ci assicura che i gruppi sperimentali si trovino nelle stesse condizioni, per quanto riguarda le 102
7 loro capacità di base; b) Consente di avvantaggiarsi della correlazione della variabile risposta con le capacità di base suddette, e pertanto ci dà l opportunità di rimuovere in concreto una sorgente di errore nelle nostre misurazioni. Al fine di comprendere i vantaggi dell uso di campioni correlati, prendiamo in considerazione un problema di campionamento e calcoliamo l errore standard della differenza tra le medie, utilizzando la formula basata su gruppi non appaiati e utilizzando, poi, la formula che prende invece in considerazione la correlazione tra i gruppi. Tab Punteggi di due gruppi di soggetti in un esperimento basato su un piano a gruppi appaiati. La Tabella 10.2 ci presenta i dati relativi a due gruppi di soggetti appaiati sulla base di una variabile notoriamente correlata alla variabile risposta. I membri di ciascuna coppia sono assegnati, con una procedura casuale, alle condizioni sperimentali. I seguenti passi sono utilizzati nel calcolo dell errore standard della differenza tra le medie nel caso di campioni non appaiati. PASSO 1 - La somma dei quadrati del gruppo 1 PASSO 2 - La deviazione standard del gruppo 1 è PASSO 3 - L errore standard della media del gruppo 1 è PASSO 4 - Analogamente l errore standard della media del gruppo 2 è PASSO 5 - L errore standard della differenza tra le medie per campioni indipendenti è 103
8 Per calcolare l errore standard della differenza tra le medie nel caso di campioni appaiati, dobbiamo utilizzare il seguente procedimento. PASSO 1 - Utilizzando la formula per trovare il coefficiente di correlazione troviamo che la correlazione tra i due gruppi è PASSO 2 - L errore standard della differenza tra le medie, per il caso di gruppi appaiati è Si può notare che la formula, in cui un termine è caratterizzato dalla presenza del coefficiente di correlazione, ci dà una netta riduzione dell errore standard stesso. In altri termini essa ci fornisce un test più sensibile alla differenza tra le medie e quindi ci dà una maggior opportunità di arrivare al rifiuto dell ipotesi nulla, quando questa è falsa. Nel linguaggio dell inferenza statistica diciamo che è un test più potente. Naturalmente la maggior potenza, o sensibilità della formula, è direttamente correlata alla nostra capacità di associare i soggetti su una variabile che sia correlata con la variabile risposta. In effetti se r tende a crescere, s x1-x2 tenderà a diventare, in corrispondenza, piuttosto piccolo, mentre se r si avvicina allo zero, il vantaggio di usare campioni correlati tende progressivamente a svanire. Un bilanciamento della migliore sensibilità dell errore standard della differenza tra le medie, per r molto grande, è dato dalla perdita dei gradi di libertà. Infatti mentre il numero di gradi di libertà nel caso di campioni non appaiati è n 1 + n 2 2, il numero dei gradi di libertà di un campione costituito da due sottogruppi correlati è dato dal numero delle coppie 1, cioè n = 1. Questa differenza nei gradi di libertà può risultare critica allorché il loro numero diventa eccessivamente piccolo, in quanto, come abbiamo visto, sono necessari dei valori della t di Student molto più alti per ottenere un test significativo. 104
STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA
Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE
DettagliCONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI
CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI ipotesi sul confronto tra le medie di due campioni indipendenti Obiettivo: decidere, attraverso il confronto tra le medie dei due campioni indipendenti,
DettagliDistribuzioni campionarie. Antonello Maruotti
Distribuzioni campionarie Antonello Maruotti Outline 1 Introduzione 2 Concetti base Si riprendano le considerazioni fatte nella parte di statistica descrittiva. Si vuole studiare una popolazione con riferimento
DettagliCapitolo 11 Test chi-quadro
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara Docenti: Dott.
DettagliEsercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
DettagliConcetti principale della lezione precedente
Corso di Statistica medica e applicata 9 a Lezione Dott.ssa Donatella Cocca Concetti principale della lezione precedente I concetti principali che sono stati presentati sono: Variabili su scala nominale
DettagliVerifica delle ipotesi
Statistica inferenziale Stima dei parametri Verifica delle ipotesi Concetti fondamentali POPOLAZIONE o UNIVERSO Insieme degli elementi cui si rivolge il ricercatore per la sua indagine CAMPIONE Un sottoinsieme
DettagliNOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI
NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI I METODI PER IL CONFRONTO DI MEDIE (Campioni non indipendenti) Prof.ssa G. Serio, Prof. P. Trerotoli, Cattedra di Statistica Medica, Università di Bari
DettagliCAMPIONAMENTO - ALCUNI TERMINI CHIAVE
CAMPIONAMENTO - ALCUNI TERMINI CHIAVE POPOLAZIONE = qualsiasi insieme di oggetti (unità di analisi) di ricerca N = ampiezza della popolazione PARAMETRI = caratteristiche della popolazione [media, proporzione
DettagliCapitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
DettagliPSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI
PSICOMETRIA Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI CAMPIONI INDIPENDENTI Campioni estratti casualmente dalla popolazione con caratteristiche omogenee Assegnazione
DettagliTeorema del Limite Centrale
Teorema del Limite Centrale Problema. Determinare come la media campionaria x e la deviazione standard campionaria s misurano la media µ e la deviazione standard σ della popolazione. È data una popolazione
DettagliElementi di Psicometria (con laboratorio software 1)
Elementi di Psicometria (con laboratorio software 1) 05-La verifica delle ipotesi con le medie dei campioni (v. 1.0, 15 aprile 2019) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,
DettagliCapitolo 7. Distribuzioni campionarie. Statistica. Levine, Krehbiel, Berenson
Levine, Krehbiel, Berenson Statistica Capitolo 7 Distribuzioni campionarie Insegnamento: Statistica Applicata Corsi di Laurea in "Scienze e tecnologie Alimentari" Unità Integrata Organizzativa Agraria,
DettagliLa distribuzione t. Federico Plazzi. 7 Novembre 2015
La distribuzione t Federico Plazzi 7 Novembre 2015 Popolazione e campioni Popolazione e campioni Definizioni ed assunzioni di partenza Campione: l insieme di individui che abbiamo potuto osservare. Popolazione
DettagliLaboratorio di Probabilità e Statistica
Laboratorio di Probabilità e Statistica lezione 5 Massimo Guerriero Ettore Benedetti Indice Lezione Prerequisiti dalla lezione scorsa Media e varianza campionaria Legge dei grandi numeri Teorema del limite
DettagliMatematica con elementi di Informatica
Statistica descrittiva ed inferenziale Matematica con elementi di Informatica Tiziano Vargiolu Dipartimento di Matematica vargiolu@math.unipd.it Corso di Laurea Magistrale in Chimica e Tecnologie Farmaceutiche
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 4.1 I principali test statistici per la verifica di ipotesi: Il test t Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico
DettagliINDICE PARTE METODOLOGICA
INDICE PARTE METODOLOGICA 1. Il processo di ricerca 1.1.Individuazione di un problema e formulazione delle ipotesi 1.2.Individuazione e definizione operativa delle variabili 1.2.1. Le variabili definite
DettagliUniversità degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1
Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1 Lezione 1 - Mercoledì 27 Settembre 2017 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 28-Intervalli di confidenza vers. 1.1 (21 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliLa statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati.
RICHIAMI DI STATISTICA La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati. Quale è la media della distribuzione del reddito dei neolaureati? Per rispondere dovremmo
DettagliStatistica Inferenziale
Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione
DettagliCampionamento e stima di parametri
Sia X una variabile aleatoria associata a un dato esperimento. Ripetiamo l esperimento n volte, ottenendo una famiglia di valori sperimentali della v.a. X : X = (X 1, X 2,..., X n ) ogni X i é una v.a.
Dettaglilezione 4 AA Paolo Brunori
AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente
DettagliEsercitazioni di statistica
Esercitazioni di statistica Intervalli di confidenza Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 10 Dicembre 2014 Stefania Spina Esercitazioni di statistica 1/43 Stefania Spina
DettagliCarta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016
Esercitazione 12 maggio 2016 ESERCIZIO 1 Si supponga che in un sondaggio di opinione su un campione di clienti, che utilizzano una carta di credito di tipo standard (Std) o di tipo business (Bsn), si siano
DettagliInferenza su una popolazione
Inferenza su una popolazione La distribuzione di x(m) ha media pari a μ, quindi x(m) è uno stimatore non distorto della media della popolazione μ. Per fare inferenza sulla media dobbiamo avere un CCS,
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 9-Introduzione alla statistica inferenziale (vers. 1.2, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università
DettagliIl test (o i test) del Chi-quadrato ( 2 )
Il test (o i test) del Chi-quadrato ( ) I dati: numerosità di osservazioni che cadono all interno di determinate categorie Prima di tutto, è un test per confrontare proporzioni Esempio: confronto tra numero
DettagliDistribuzione normale
Distribuzione normale istogramma delle frequenze di un insieme di misure relative a una grandezza che varia con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata
DettagliUniversità degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1
Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1 Lezione 1 - Martedì 23 Settembre 2014 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,
DettagliUniversità degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1
Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Lezione 1 - Mercoledì 28 Settembre 2016 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,
DettagliDISTRIBUZIONI DI PROBABILITA (parte 3) 1 / 34
DISTRIBUZIONI DI PROBABILITA (parte 3) 1 / 34 Distribuzione Binomiale 2 / 34 La più importante distribuzione di probabilità per variabili casuali discrete è la distribuzione binomiale. Questa distribuzione
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 10-Significatività statistica per la correlazione vers. 1.0 (5 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università
DettagliIntervallo di confidenza.
Intervallo di confidenza annarita.vestri@uniroma1.it campione inferenza popolazione Media Riportare sempre anche la deviazione standard Stima puntuale di Media, dev.standard, numerosità Qualche semplice
DettagliSTATISTICA INDUTTIVA: STIMA DI PARAMETRI STIMA PUNTUALE
S.S.I.S TOSCANA F.I.M. -II anno STATISTICA INDUTTIVA: STIMA DI PARAMETRI STIMA PUNTUALE PROBLEMA 1 Vogliamo valutare la percentuale p di donne fumatrici tra le donne in età fertile. Procediamo all estrazione
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
Dettagliassuma valori in un determinato intervallo è data dall integrale della sua densità ( = )=
VARIABILI ALEATORIE CONTINUE Esistono parecchi fenomeni reali per la cui descrizione le variabili aleatorie discrete non sono adatte. Per esempio è necessaria una variabile aleatoria continua ovvero una
DettagliStatistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill
- metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 8 home - indice In base agli arrotondamenti effettuati nei calcoli, si
DettagliEsercizi di statistica inferenziale
Dipartimento di Fisica SMID a.a. 004/005 Esercizi di statistica inferenziale Prof. Maria Antonietta Penco tel. 0103536404 penco@fisica.unige.it 6/1/005 Esercizio1 E noto che un grande numero di pazienti
DettagliTest per una media - varianza nota
Situazione Test per una media - varianza nota Popolazione N(µ,σ 2 ); varianza σ 2 nota. µ 0 numero reale fissato. Test di livello α per µ Statistica: Z n = X n µ 0 σ/ n. H 0 H 1 Rifiutiamo H 0 se p-value
DettagliEffettuazione di un TEST D IPOTESI. = stima del parametro di interesse calcolata sui dati campionari
Effettuazione di un TEST D IPOTESI 1. Formulazione H 0 e H 1 2. Scelta del test statistico 3. Calcolo del test statistico ˆ 0 test ES[ˆ] dove ˆ = stima del parametro di interesse calcolata sui dati campionari
Dettagli07/01/2016. Scalisi - Tecniche Psicometriche LA VERIFICA DELLE IPOTESI. La verifica delle ipotesi. Popolazioni e campioni
LA VERIFICA DELLE IPOTESI Popolazioni, campioni, parametri ed indicatori 1 2 3 Popolazioni e campioni Viene definita popolazione o universo l insieme completo di tutti gli elementi che hanno in comune
DettagliIl confronto fra medie
L. Boni Obiettivo Verificare l'ipotesi che regimi alimentari differenti non producano mediamente lo stesso effetto sulla gittata cardiaca Ipotesi nulla IPOTESI NULLA La dieta non dovrebbe modificare in
DettagliDipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli
Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 7 1. Utilizzando le tavole della distribuzione
DettagliTRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative
TRACCIA DI STUDIO Un indice di tendenza centrale non è sufficiente a descrivere completamente un fenomeno. Gli indici di dispersione assolvono il compito di rappresentare la capacità di un fenomeno a manifestarsi
DettagliLaboratorio di Chimica Fisica. Analisi Statistica
Università degli Studi di Bari Dipartimento di Chimica 9 giugno F.Mavelli- Laboratorio Chimica Fisica - a.a. 3-4 F.Mavelli Laboratorio di Chimica Fisica a.a. 3-4 Analisi Statistica dei Dati Analisi Statistica
DettagliTeorema del Limite Centrale
Teorema del Limite Centrale Teorema. Sia data una popolazione numerica infinita di media µ e deviazione standard σ da cui vengono estratti dei campioni casuali formati ciascuno da n individui, con n abbastanza
DettagliCorso in Statistica Medica
Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Intervalli di confidenza Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico
DettagliLE DISTRIBUZIONI CAMPIONARIE
LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria
DettagliStatistica inferenziale
Statistica inferenziale Problema Nello studio delle distribuzioni teoriche di probabilità si suppone di conoscere i principali parametri della popolazione che esaminiamo (ad esempio la media, varianza).
DettagliCorso di Laurea in Informatica Applicata Esame di Calcolo delle Probabilità e Statistica Prova scritta dell 11 gennaio 2007
Corso di Laurea in Informatica Applicata Esame di Calcolo delle Probabilità e Statistica Prova scritta dell 11 gennaio 007 Primo esercizio Per una certa stampante S 1, la probabilità che un generico foglio
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
Dettagli05. Errore campionario e numerosità campionaria
Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,
DettagliIl processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni
La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con
DettagliTest di significatività
Test di significatività I test di significatività hanno come scopo quello di comprendere se la rilevazione da noi fatta sul campione può essere considerata un evento straordinario o la norma. Quantificare
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliEconometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA 2014-2015 Paolo Brunori
AA 2014-2015 Paolo Brunori popolazione studiata e popolazione di interesse - popolazione studiata: popolazione da cui è stato estratto il campione - popolazione di interesse: popolazione per la quale ci
DettagliQuanti soggetti devono essere selezionati?
Quanti soggetti devono essere selezionati? Determinare una appropriata numerosità campionaria già in fase di disegno dello studio molto importante è molto Studi basati su campioni troppo piccoli non hanno
DettagliModelli e procedure per l educazione degli adulti
CdL SEAFC a.a. 2016-2017 II semestre Pedagogia sperimentale. Modelli e procedure per l educazione degli adulti francesco.agrusti@uniroma3.it T6. Modelli e procedure di valutazione Ultimo appuntamento con
DettagliProbabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva
Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.
DettagliModelli descrittivi, statistica e simulazione
Modelli descrittivi, statistica e simulazione Master per Smart Logistics specialist Roberto Cordone (roberto.cordone@unimi.it) Statistica inferenziale Cernusco S.N., giovedì 25 febbraio 2016 (9.00/13.00)
DettagliQuesto calcolo richiede che si conoscano media e deviazione standard della popolazione.
Università del Piemonte Orientale Corso di laurea in biotecnologie Corso di Statistica Medica La distribuzione t - student 1 Abbiamo visto nelle lezioni precedenti come il calcolo del valore Z, riferito
DettagliPROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE
PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE 1. Distribuzione congiunta Ci sono situazioni in cui un esperimento casuale non si può modellare con una sola variabile casuale,
DettagliStatistica Elementare
Statistica Elementare 1. Frequenza assoluta Per popolazione si intende l insieme degli elementi che sono oggetto di una indagine statistica, ovvero l insieme delle unità, dette unità statistiche o individui
DettagliOD TEST DI IPOTESI 50
TEST DI IPOTESI 50 TEST D'IPOTESI È possibile ipotizzare che la durata media del ricovero ospedaliero al Policlinico San Matteo, negli ultimi 3 anni, è stata di 3 giorni? È possibile ipotizzare che un
DettagliParametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori.
Parametri e statistiche Popolazione Parametri Valori fissi, spesso non noti Campione Statistiche o Stimatori Variabili casuali, le cui determinazioni dipendono dalle particolari osservazioni scelte Parametri
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 13-Il t-test per campioni indipendenti vers. 1.1 (12 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 09-Campione e popolazione vers. 1.0 (31 ottobre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliDistribuzioni campionarie
1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari
DettagliUniversità del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student
Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica La distribuzione t - student 1 Abbiamo visto nelle lezioni precedenti come il calcolo del valore Z,
DettagliEsercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017
Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 3/5/017 Contents 1 Intervalli di confidenza 1 Intervalli su un campione 1.1 Intervallo di confidenza per la media................................
DettagliTeorema del limite centrale TCL
Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazione lineare di N variabili aleatorie le cui funzioni
DettagliModelli matematici di fenomeni aleatori Variabilità e casualità
Modelli matematici di fenomeni aleatori Variabilità e casualità La casualità è alla base della scelta degli individui che compongono un campione ai fini di un indagine statistica. La casualità è alla base
DettagliLA LUNGHEZZA DEI GENI UMANI (Es4.1)
STATISTICA INFERENZIALE: le caratteristiche della popolazione complessiva sono indotte da quelle osservate su un campione estratto dalla popolazione stessa(esempio exit poll) PROBLEMA: dato un campione
DettagliApprossimazione normale alla distribuzione binomiale
Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N
DettagliEsercitazione 8 maggio 2014
Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un
DettagliParametri statistici
SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Parametri statistici 24/1/2005 Deviazione standard della media La variabilità di una distribuzione può quindi essere espressa da un indice
DettagliUlteriori Conoscenze di Informatica e Statistica. Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie.
Ulteriori Conoscenze di Informatica e Statistica Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 (I piano) tel.: 06 55 17 72 17 meneghini@fis.uniroma3.it I risultati di un esperimento
DettagliIl campionamento e l inferenza. Il campionamento e l inferenza
Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento
DettagliVerifica delle ipotesi. Verifica delle ipotesi
Con la procedura di stima intervallare si cerca definire in modo verosimile il valore di un parametro incognito a partire dalle osservazioni campionarie Valore campionario Procedura di stima intervallare
DettagliModelli probabilistici variabili casuali
Modelli probabilistici variabili casuali Le variabili casuali costituiscono il legame tra il calcolo della probabilità e gli strumenti di statistica descrittiva visti fino ad ora. Idea: pensiamo al ripetersi
DettagliTRACCIA DI STUDIO. Test di confronto per misure qualitative. Verifica di ipotesi
TRACCIA DI STUDIO Verifica di ipotesi Nelle analisi statistiche di dati sperimentali riguardanti più gruppi di studio (talvolta più variabili) si pone come ipotesi da verificare la cosiddetta ipotesi zero:
DettagliSTATISTICA. Esercitazione 5
STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei
DettagliRisoluzione di problemi ingegneristici con Excel
Risoluzione di problemi ingegneristici con Excel Problemi Ingegneristici Calcolare per via numerica le radici di un equazione Trovare l equazione che lega un set di dati ottenuti empiricamente (fitting
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta
DettagliUniversità degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A
Università degli Studi di Padova Corso di Laurea in Medicina e Chirurgia - A.A. 015-16 Corso Integrato: Statistica e Metodologia Epidemiologica Disciplina: Statistica e Metodologia Epidemiologica Docenti:
DettagliIntervallo di confidenza
Intervallo di confidenza Sezione di Epidemiologia e Statistica Medica, Università di Verona campione inferenza popolazione Media Riportare sempre anche Stima puntuale di µ la deviazione standard Media,
Dettagliper togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione
Rapporti statistici di composizione la parte rispetto al tutto percentuali di derivazione per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione di frequenza (tassi) rapporti
DettagliParte 1 : Inferenza. Varianza nota test Z. Distribuzioni asintotiche dei test. Varianza ignota test t ad un campione
! Test d'ipotesi Parte 1 : Inferenza! Intervalli di confidenza! Test parametrici! Calcoli di potenza! Test non parametrici Distribuzioni asintotiche dei test A seconda dei casi il nostro test può convergere
DettagliContenuto del capitolo
Capitolo 8 Stima 1 Contenuto del capitolo Proprietà degli stimatori Correttezza: E(Stimatore) = parametro da stimare Efficienza Consistenza Intervalli di confidenza Per la media - per una proporzione Come
DettagliGli errori nella verifica delle ipotesi
Gli errori nella verifica delle ipotesi Nella statistica inferenziale si cerca di dire qualcosa di valido in generale, per la popolazione o le popolazioni, attraverso l analisi di uno o più campioni E
DettagliEsercizio 1. Durante un inchiesta su 500 studenti frequentanti i corsi di Algebra (A), Fisica (F) e Statistica è stato rilevato che:
Esercizio 1 Durante un inchiesta su 500 studenti frequentanti i corsi di Algebra (A), Fisica (F) e Statistica è stato rilevato che: A 329 F 186 S 295 AS 217 AF 83 FS 63 AFS 53 Determinare la partizione
DettagliDISTRIBUZIONI DI PROBABILITA
PSICOMETRIA Corso di laurea triennale (classe 34) DISTRIBUZIONI DI PROBABILITA DISTRIBUZIONE DI PROBABILITA I possibili risultati di un esperimento costituiscono uno spazio campionario di n eventi A ciascun
DettagliCampionamento. Una grandezza fisica e' distribuita secondo una certa PDF
Campionamento Una grandezza fisica e' distribuita secondo una certa PDF La pdf e' caratterizzata da determinati parametri Non abbiamo una conoscenza diretta della pdf Possiamo determinare una distribuzione
DettagliMetodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale
DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliCasa dello Studente. Casa dello Studente
Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino
Dettagli