Il test di Student. F. Scotti. 23 maggio Introduzione ai test statistici di significatività: ipotesi nulla e livello di significatività
|
|
- Corrado Farina
- 7 anni fa
- Visualizzazioni
Transcript
1 Il test di Student F. Scotti 23 maggio 2006 Indice 1 Introduzione ai test statistici di significatività: ipotesi nulla e livello di significatività deltest 1 2 IltestdidiStudent Introduzione al test di Student La variabile aleatoria t e la forma della distribuzione di Student Ipotesi per la validità del test di Student e le 4 modalità diimpiego Confronto fra le medie di due campioni Un esperimento tipico L ipotesi nulla nel caso in esame La variabile aleatoria da usare in questo caso Test di Student ad una coda ed a due code Applichiamo il test di Student per il confronto di due medie Un comune fraintendimento di cosa sia P Cosa fare quando il test è non significativo? Conclusioni Introduzione ai test statistici di significatività: ipotesi nulla e livello di significatività del test Tutti i test statistici di significatività assumono inizialmente la cosiddetta ipotesi zero, anche chiamata ipotesi nulla. Quando si effettua il confronto fra due o più gruppi di dati (campioni), l ipotesi zero prevede sempre che non esista alcuna differenza tra i gruppi riguardo al parametro considerato. Quindi se l ipotesi nulla è valida, i campioni vengono dalla stessa popolazione e le eventuali differenze osservate nei campioni (il parametro considerato) vanno attribuite al solo caso. Una decisione di respingere l ipotesi nulla (presa sulla base del test statistico) è probabilmente giusta, ma potrebbe anche essere errata. La probabilità di commettere questo errore si chiama livello di significatività del test. Il livello di significatività di un test può essere scelto a piacere dallo sperimentatore. Questa probabilità, chiamata anche valore P, di solito viene fissata ai valori tipi di 0.05 (5%) o di 0.01 (1%). Ricordiamo quindi che questa probabilità rappresenta una stima quantitativa della probabilità che le differenze osservate siano dovute al caso. Gli statistici definiscono questo concetto in un modo più preciso dicendo: il valore P è la probabilità di ottenere un risultato altrettanto estremo o più estremodi quello osservato se la diversità è interamente dovuta alla sola variabilità campionaria, assumendo quindi che l ipotesi iniziale nulla sia vera. 1
2 2 Il test di di Student Se il parametro che andiamo a considerare dei due campioni è la media e vogliamo sapere se la eventuale differenza fra medie è significativa useremo il test di Student. 2.1 Introduzione al test di Student Vediamo ora il contesto nel quale è nato il test di Student (Alias William Sealy Gosset, ). La preoccupazione di Gosset era questa: Posso usare le mie nozioni di statistica applicabili agli esperimenti con grandi campioni (quindi usare la distribuzione normale nei conti) anche con campioni di dimensioni ridotte, oppure la distribuzione che meglio descrive i fenomeni è un altra?. Gosset era un chimico inglese assunto dalla famosa birreria Guinness di Dublino ed eseguiva analisi statistiche su campioni dei prodotti per la mansione che oggi verrebbe chiamata controllo di qualità. In generale, rilevare un campione costa sempre tempo e denaro. Per questo motivo, spesso Gosset era costretto ad usare per le sue indagini statistiche un numero ridotto di campioni. Similmente al contesto lavorativo di Gosset, anche durante il nostro normale lavoro in laboratorio, assai raramente la mole di dati rilevati permette di inferire ipotesi sulla media campionaria ˆX di un campione avendo la sua varianza σ 2. 1 Di solito infatti, quando non e nota la media di una popolazione, nemmeno la sua varianza σ 2 lo è. Solitamente, quello che può essere fatto, è semplicemente sostituire nei conti la varianza vera della popolazione (σ 2 ) con quello del campione (S 2 ). Effettuando questa sostituire occorre tenere presente che la distribuzione delle probabilità non èpiùfornita dalla distribuzione normale, ma da quella del t, detta tdistudent.pertantoèquesta la distribuzione che dovremo usare se vogliamo che i nostri test sulle medie di due serie di campioni siano corretti. 2.2 La variabile aleatoria t e la forma della distribuzione di Student Gosset si rispose da solo dimostrando che per piccoli campioni, lo scarto tra le medie dei campioni estratti dalla stessa popolazione e la media dell universo, in rapporto all errore standard, non è distribuito da una normale (come accadrebbe per campioni di grandezza infinita) ma bensì da una distribuzione diversa. Usando le formule al posto delle parole, possiamo scrivere la variabile casuale studiata da Gosset in questo modo: t = MediaDelCampione MediaDellaPopolazione ErroreStandardDelCampione = ( ˆX µ) S/ n, (1) dove il numero campioni n viene chiamato da Gosset con il termine gradi di libertà. La distribuzione di probabilità della variabile aleatoria t è mostrata nella figura 1. Essa è a forma di campana e simmetrica, ma con una dispersione che diminuisce con il numero di gradi di libertà. Pertanto non vi è una sola curva t ma, a differenza di quanto avviene per la distribuzione Normale, esiste una intera famiglia di distribuzioni t, una per ogni grado di libertà. Questo significa che la variabile aleatoria t ha una sua distribuzione per gli esperimenti con 5 campioni (n =5), per 6 (n = 6), ecc. Aumentando il numero di campioni n, la distribuzione di Student tende a una distribuzione Normale (disegnata in Figura 1 con n = ). 2.3 Ipotesi per la validità del test di Student e le 4 modalità diimpiego Quando la distribuzione t di Student è applicata a test di verifica delle ipotesi, è necessario rispettare le seguenti ipotesi: la distribuzione dei dati deve essree una distribuzione Normale; 1 Confrontare due medie avendo la loro varianza sarebbe piuttosto diretto. Ad esempio è possibile calcolare le due deviazioni standard (la radice quadrata della varianza) e controllare se le due medie distano più della metà della somma delle due deviazioni standard. 2
3 Figura 1: Distribuzione di Student. Sull asse x abbiamo la variabile aleatoria t, mentre sull asse y abbiamo la densità di probabilità. Le tre curve si riferiscono agli esperimenti con numero di gradi di libertà pari a 1, 4 ed. le osservazioni devono essere raccolte in modo indipendente. La seconda condizione dipende dalla modalità di organizzazione della raccolta dei dati. Ad esempio, le osservazioni non sono indipendenti se entro un gruppo di persone delle quali si misura il peso esistono più fratelli. Similmente l indipendenza dei campioni non è rispettata se, in un esperimento sulla conducibilità elettrica di un metallo a temperature diverse, si utilizzano campioni di metallo diversi ma un campione è misurato più volte. Rispetto alla condizione di normalità la distribuzione t è robusta, ovvero rimane approssimativamente valida, anche quando le distribuzioni di dati non rispettano esattamente la condizione di normalità. Nelle attività tecniche e di laboratorio, il test di Student è impiegato in quattro casi, ovvero per il confronto tra: 1. la media di un campione e la media delluniverso o una generica media attesa; 2. un singolo dato e la media di un campione, per verificare se possono appartenere alla stessa popolazione; 3. la media delle differenze di due campioni dipendenti con una differenza attesa; 4. le medie di due campioni indipendenti. 3 Confronto fra le medie di due campioni Fra le 4 modalità di impiego del test di Student che abbiamo elencato, il confronto fra le medie di due campioni è la modalità più frequente nella attività di laboratorio. 3.1 Un esperimento tipico Immaginiamo una ditta che produce birra impiegando una miscela di malti che chiameremo A. Vogliamo verificare se una nuova miscela di malti B usando gli stessi procedimenti produttivi produce una birra più gradevole. Per ottenere questa risposta occorre creare un esperimento statistico. Facciamo assaggiare a N assaggiatori la birra prodotta con la miscela di malti A, poichiederemo ad ogni assaggiatore di dare un voto alla birra da 0 a 10. A questo punto, prendiamo altri M assaggiatori e gli facciamo assaggiare la birra prodotta con la miscela di malti B. 3
4 Nell ipotesi che gli assaggiatori ben rappresentino la popolazione di consumatori di birra, allora è ovvio che metteremo in produzione la birra fatta con la miscela con il voto medio più alto. Attenzione però, lo faremo solo quando questa media sarà significativamente diversa! La riposta verrà proprio dalla applicazione del test di Student. Il problema è che usando pochi assaggiatori, le medie sono sempre un poco diverse. Questo accadrebbe addirittura anche nel caso nel quale faremmo assaggiare al gruppo di assaggiatori M e N la stessa miscela di malti! Il test di Student ci dice quanto questa differenza fra le medie è significativa, oppure dipende solo da fluttuazioni casuali dovute al fatto che usiamo dei campioni di dimensioni ridotte (ovvero non un numero infinito di assaggiatori). 3.2 L ipotesi nulla nel caso in esame In questo caso l ipotesi nulla del test presuppone che la birra fatta con i malti di tipo A o di tipo B sia mediamente buona uguale. Esprimendo la stessa affermazione, uno statistico direbbe che l ipotesi nulla presuppone che le due medie a confronto siano estratte dalla stessa popolazione (quindi si presuppone che siano identiche) Facciamo chiarezza: lo statistico intende che se potesse fare assaggiare la birra fatta con i malti A a infinite persone otterrebbe un voto medio µ 1 ese potesse far assaggiare la birra fatta con i malti B a infinite persone otterrebbe un voto medio µ 2. Se la birra fatta con i malti A ed i malti B è mediamente buona uguale allora deve essere µ 1 = µ 2, e questa, per lui, è l ipotesi nulla. Nel caso dell ipotesi nulla, le differenze effettivamente riscontrate nelle medie campionarie X 1 e X 2 sarebbero imputabili a variazioni casuali, come effetti dovuti al campionamento, cioè alla estrazione casuale di alcuni dati da un universo teoricamente infinito, formato da valori tra loro diversi e con una distribuzione normale intorno alla loro media. Usando il test di Student possiamo calcolare la probabilità che l ipotesi nulla non sia vera (cioè che le medie µ 1 e µ 2 in realtà sono diverse e quindi le medie campionarie X 1 e X 2 sono diversi non solo per fattori casuali dovuti alla estrazione del campione). Di solito si considera il test come significativo se la probabilità èminoredel5%. 3.3 La variabile aleatoria da usare in questo caso Nel confronto fra due medie di campioni (indipendenti e distribuiti come una normale, dicono le ipotesi del test di Student) si usa le distribuzione della variabile casuale t definita invece in questo modo DifferenzaFraLeMedieCampionarie t = ErroreStandardDellaDifferenzaFraLeMedieCampionarie. (2) La forma della distribuzione è sempre uguale a quella generale mostrata in Figura 1. Usando questa curva con i parametri corretti (che possiamo estrarre dai dati degli assaggiatori) è possibile trovare la nostra risposta alla domanda sulla significatività della differenza fra le medie. 3.4 Test di Student ad una coda ed a due code Il test di Student parte dalla analisi della distribuzione mostrata in Figura 1 e può essere applicato in due modi: Vogliamo sapere se le medie sono uguali o diverse In questo caso si una il test di Student nella forma bilaterale (anche detta a due code). Vogliamo sapere se una media è maggiore dell altra (e posso escludere che sia minore) In questo caso si una il test di Student nella forma unilaterale (anche detta aunacoda). Tenendo conto di questa distinzione, nel caso della birra fatta con i due malti diversi dovremo quindi usare il test di Student a due code. Anche quando non sono sicuro di poter affermare che una media possa essere solo uguale o maggiore dell altra, ma non minore, uso sempre il test a due code. 4
5 3.5 Applichiamo il test di Student per il confronto di due medie Immaginiamo di aver rilevato i voti degli assaggiatori delle birre ottenute con i malti A e di tipo B in una tabella come questa # A B Partendo dai dati è possibile effettuare il test di Student usando delle tabelle, oppure utilizzando uno strumento informatico. Noi scegliamo questa seconda possibilità. Usando la funzione copia ed incolla possiamo incollare questi dati in un foglio Excel. A questo punto sotto la voce di menù Tools possiamo cliccare su Data analysis e scegliere a questo punto t- Test: Two-Sample Assuming equal variances (ovvero il test a due code). Notiamo che usando questa funzione stiamo assumento che anche che la varianza dei voti dei gradimenti degli assaggiatori abbia la stessa varianza con le due birre. Così facendo appare una finestra di dialogo nella quale dobbiamo immettere: Il range1 di celle del primo campione (la colonna dei voti del malto A: 7, 8, 9, 8, 8,...); Il range2 di celle del secondo campione (la colonna dei voti del malto B: 7, 8, 7, 8, 9,...); Alpha (il livello di significatività del test che vogliamo, ad esempio il 5%, ovvero 0,05 ); Output range (a partire da quale cella vogliamo stampare i risultati del test). Il test di Student permette di confrontare medie anche di gruppi il cui numero dei campioni è diverso, proprio come nel nostro caso: nel gruppo A abbiamo 20 voti, nel gruppo B abbiamo 18 voti. La stampa dei risultati che otteniamo è piuttosto interessante: t-test: Two-Sample Assuming Equal Variances Variable 1 Variable 2 Mean 7,35 7, Variance 0, , Observations
6 Pooled Variance 0, Hypothesized Mean Difference 0 df 36 t Stat -1, P(T<=t) one-tail 0, t Critical one-tail 1, P(T<=t) two-tail 0, t Critical two-tail 2, Le medie sono diverse ed apparentemente ci dicono che la miscela di malti B produce una media sui voti più alta (7,78 contro 7,35). I risultati ci dicono però che non era vero che le varianze dei dati erano uguali (0,66 contro 0,89). Quindi riapplichiamo il test usando questa volta la funzione più corretta: t-test: Two-Sample Assuming Unequal variances. Immettendo ancora gli stessi parametri range1, range2, Alpha e Output range questa volta otteniamo: t-test: Two-Sample Assuming Unequal Variances Variable 1 Variable 2 Mean 7,35 7, Variance 0, , Observations Hypothesized Mean Difference 0 df 34 t Stat -1, P(T<=t) one-tail 0, t Critical one-tail 1, P(T<=t) two-tail 0, t Critical two-tail 2, Il parametro che a noi interessa (P (T <= t)) è la probabilità della ipotesi nulla (ovvero della ipotesi le medie sono uguali ), ovvero 0,14. Questo valore è troppo alto, di solito si considera come accettabile un valore almeno sotto 0,05. Cosa possiamo dire quindi delle due miscele di birre? Possiamo dire che esiste una differenza delle medie che sembra favorire la miscela di malti B, ma il test di Student considera questa differenza fra le medie come non significativa. Questo significa che la differenza dipende da fattori casuali e non è dimostrabile che dipenda dal fatto che la miscela di malti B sia meglio di quella A Un comune fraintendimento di cosa sia P Molti tecnici fraintendono cosa sia veramente questa probabilità P. Se la probabilità P vale 0.03 significa che c e il 3% delle possibilità di osservare una differenza fra le medie maggiore a quella trovata nei dati quando le medie delle popolazioni sono uguali (ovvero se fossimo nel caso delle birre fatte con gli stessi malti e con lo stesso procedimento)(affermazione A). Si è tentati quindi di dire (sbagliando) che c è quindi il 97% di probabilità che la differenza fra le medie misurata rifletta una differenza reale fra le medie e che sia del 3% la probabilità che possa dipendere solo dal caso (Affermazione B). Questa affermazione è sbagliata! L unica cosa che invece potremmo dire avendo trovato P = 0.03 è solo l affermazione A Cosa fare quando il test è non significativo? L unica cosa che è possibile fare è ripetere il test aumentando il numero di campioni (ossia aumentando il numero degli assaggi). A questo punto si controlla di nuovo se le medie sono diverse e se la probabilità P (T <= t) < 0, 05. Negli esercizi del corso possiamo regolarci in questo modo: se il numero di dati totali supera le due centinaia in totale e la probabilità P (T <= t) continua a non scendere sotto 0,05, si considerano 6
7 Medie campionarie molto simili P>0.05 Aggiungere Campioni (test non significativo) P 0.05 Test significativo, ma il farmaco influisce poco Medie campionarie molto diverse Aggiungere Campioni (test non significativo) Test significativo ed il farmaco influisce molto Tabella 1: Esempio di impiego del test di Student le medie come non significativamente diverse. L esperienza mostra invece che, se le medie sono significativamente diverse, bastano poche decine di dati per vedere la probabilità P (T <= t) andare ben al di sotto del valore 0,05 che noi abbiamo scelto come soglia. La tabella 1 riassume come potremmo comportarci in un caso pratico. 3.6 Conclusioni Per tutti questi motivi, quando durante la nostra attività lavorativa dovremo confrontare fra loro due medie di valori ottenuti da esperimenti, non guarderemo semplicemente se le medie sono diverse, ma applicheremo sempre anche il test di Student per vedere se la differenza è significativa o meno. 7
Il test di Student. F. Scotti. 25 febbraio Introduzione ai test statistici di significatività: ipotesi nulla e livello di significatività
Il test di Student F. Scotti 25 febbraio 2006 Indice 1 Introduzione ai test statistici di significatività: ipotesi nulla e livello di significatività deltest 2 2 IltestdidiStudent 2 2.1 Introduzione al
Distribuzione Gaussiana - Facciamo un riassunto -
Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura
Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.
Statistica inferenziale La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione. Verifica delle ipotesi sulla medie Quando si conduce una
Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva
Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI
PSICOMETRIA Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI CAMPIONI INDIPENDENTI Campioni estratti casualmente dalla popolazione con caratteristiche omogenee Assegnazione
CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
Distribuzioni e inferenza statistica
Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione
La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci
La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni
Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student
Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica La distribuzione t - student 1 Abbiamo visto nelle lezioni precedenti come il calcolo del valore Z,
Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni
La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con
Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)
Sintesi dei dati in una tabella Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6) Sintesi dei dati Spesso si vuole effettuare una sintesi dei dati per ottenere indici
N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.
N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume
Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo
Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo 1. Gli studi di simulazione possono permetterci di apprezzare alcune delle proprietà di distribuzioni campionarie ricavate
Esercizi riassuntivi di Inferenza
Esercizi riassuntivi di Inferenza Esercizio 1 Un economista vuole stimare il reddito medio degli abitanti di una cittadina mediante un intervallo al livello di confidenza del 95%. La distribuzione del
Il test (o i test) del Chi-quadrato ( 2 )
Il test (o i test) del Chi-quadrato ( ) I dati: numerosità di osservazioni che cadono all interno di determinate categorie Prima di tutto, è un test per confrontare proporzioni Esempio: confronto tra numero
Ulteriori Conoscenze di Informatica e Statistica
ndici di forma Ulteriori Conoscenze di nformatica e Statistica Descrivono le asimmetrie della distribuzione Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 ( piano) tel.: 06 55 17 72 17
Distribuzioni di probabilità
Distribuzioni di probabilità Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione
Statistica Inferenziale
Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione
DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.
Corso di Laurea Specialistica in Biologia Sanitaria, Universita' di Padova C.I. di Metodi statistici per la Biologia, Informatica e Laboratorio di Informatica (Mod. B) Docente: Dr. Stefania Bortoluzzi
Approssimazione normale alla distribuzione binomiale
Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N
È possibile trovare la popolazione di origine conoscendone un campione? o meglio. partendo dalla conoscenza di n, x e d.s.?
Statistica6-06/10/2015 È possibile trovare la popolazione di origine conoscendone un campione? o meglio. È possibile conoscere σ e μ partendo dalla conoscenza di n, x e d.s.? 1 A partire da un campione
Test d Ipotesi Introduzione
Test d Ipotesi Introduzione Uno degli scopi più importanti di un analisi statistica è quello di utilizzare i dati provenienti da un campione per fare inferenza sulla popolazione da cui è stato estratto
Analisi della varianza
Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.
Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.
5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema
Gli errori nella verifica delle ipotesi
Gli errori nella verifica delle ipotesi Nella statistica inferenziale si cerca di dire qualcosa di valido in generale, per la popolazione o le popolazioni, attraverso l analisi di uno o più campioni E
Schema lezione 5 Intervalli di confidenza
Schema lezione 5 Intervalli di confidenza Non centrerò quella barca, ne sono convinto al 95% COMPRENDERE: Significato di intervallo di confidenza Uso degli stimatori come quantità di pivot per stime intervallari
Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 13-Il t-test per campioni indipendenti vers. 1.1 (12 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di
Esercitazione 8 del corso di Statistica 2
Esercitazione 8 del corso di Statistica Prof. Domenico Vistocco Dott.ssa Paola Costantini 6 Giugno 8 Decisione vera falsa è respinta Errore di I tipo Decisione corretta non è respinta Probabilità α Decisione
Il confronto fra medie
L. Boni Obiettivo Verificare l'ipotesi che regimi alimentari differenti non producano mediamente lo stesso effetto sulla gittata cardiaca Ipotesi nulla IPOTESI NULLA La dieta non dovrebbe modificare in
STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA
Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE
X Lezione Analisi della varianza Esempi e esercizi CPS - Corso di studi in Informatica II parte: Statistica
Corso di Calcolo delle Probabilità e Statistica II Parte - STATISTICA X Lezione Analisi della varianza Esempi e esercizi 1 Argomenti della X Lezione Tests per il confronto di più medie: ANOVA Utilità e
Americani Inglesi Firenze Roma Provare l ipotesi che la nazionalità non influisca sulla scelta della meta.
TEST D IPOTESI 1 Le resistenze alla rottura delle funi prodotte da una fabbrica hanno una media pari a µ = 1800N ed uno scarto quadratico medio di σ = 100N Immettendo una nuova tecnica nel processo produttivo,
UNIVERSITÀ di ROMA TOR VERGATA
UNIVERSITÀ di ROMA TOR VERGATA Corso di Laurea Magistrale in Scienze della Nutrizione Umana Corso di Statistica Medica, anno 2015-16 P.Baldi Lista di esercizi 4, 11 febbraio 2016. Esercizio 1 Una v.a.
Proprietà della varianza
Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Intermezzo: ma perché dovremmo darci la pena di studiare come calcolare la varianza nel caso di somme,
Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali
Università degli studi della Tuscia Principi di Statistica dr. Luca Secondi A.A. 014/015 Esercitazione di riepilogo Variabili casuali ESERCIZIO 1 Il peso delle compresse di un determinato medicinale si
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e
Statistica. Lezione 4
Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 4 a.a 2011-2012 Dott.ssa Daniela
http://www.biostatistica.unich.it 1 STATISTICA DESCRITTIVA Le misure di tendenza centrale 2 OBIETTIVO Individuare un indice che rappresenti significativamente un insieme di dati statistici. 3 Esempio Nella
Statistica4-29/09/2015
Statistica4-29/09/2015 Raccogliere i dati con il maggior numero di cifre significative ed arrotondare eventualmente solo al momento dei calcoli (min. 3); nella grande maggioranza delle ricerche biologiche
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi
Casa dello Studente. Casa dello Studente
Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino
3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
STATISTICA AZIENDALE Modulo Controllo di Qualità
STATISTICA AZIENDALE Modulo Controllo di Qualità A.A. 009/10 - Sottoperiodo PROA DEL 14 MAGGIO 010 Cognome:.. Nome: Matricola:.. AERTENZE: Negli esercizi in cui sono richiesti calcoli riportare tutte la
Cenni di Statistica Inferenziale
Cenni di Statistica Inferenziale Teorema del limite centrale Data una variabile, qualsiasi sia la sua distribuzione, la media di tutti i suoi campioni di ampiezza n ha una distribuzione normale: dove:
STATISTICHE DESCRITTIVE Parte II
STATISTICHE DESCRITTIVE Parte II INDICI DI DISPERSIONE Introduzione agli Indici di Dispersione Gamma Differenza Interquartilica Varianza Deviazione Standard Coefficiente di Variazione introduzione Una
Intervalli di confidenza
Probabilità e Statistica Esercitazioni a.a. 2006/2007 C.d.L.: Ingegneria per l Ambiente ed il Territorio, Ingegneria Civile, Ingegneria Gestionale, Ingegneria dell Informazione C.d.L.S.: Ingegneria Civile
Analisi degli Errori di Misura. 08/04/2009 G.Sirri
Analisi degli Errori di Misura 08/04/2009 G.Sirri 1 Misure di grandezze fisiche La misura di una grandezza fisica è descrivibile tramite tre elementi: valore più probabile; incertezza (o errore ) ossia
L indagine campionaria Lezione 3
Anno accademico 2007/08 L indagine campionaria Lezione 3 Docente: prof. Maurizio Pisati Variabile casuale Una variabile casuale è una quantità discreta o continua il cui valore è determinato dal risultato
Il campionamento e l inferenza. Il campionamento e l inferenza
Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento
LE DISTRIBUZIONI CAMPIONARIE
LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria
Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
Teoria e tecniche dei test
Teoria e tecniche dei test Lezione 9 LA STANDARDIZZAZIONE DEI TEST. IL PROCESSO DI TARATURA: IL CAMPIONAMENTO. Costruire delle norme di riferimento per un test comporta delle ipotesi di fondo che è necessario
Esercizi di Probabilità e Statistica
Esercizi di Probabilità e Statistica Samuel Rota Bulò 6 giugno 26 Statistica Esercizio Sia {X n } n una famiglia di v.a. di media µ e varianza σ 2. Verificare che X = n n X i σ 2 = n (X i µ) 2 S 2 = n
Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione
Consentono di descrivere la variabilità all interno della distribuzione di requenza tramite un unico valore che ne sintetizza le caratteristiche CAMPO DI VARIAZIONE DIFFERENZA INTERQUARTILE SCOSTAMENTO
Il Corso di Fisica per Scienze Biologiche
Il Corso di Fisica per Scienze Biologiche Ø Prof. Attilio Santocchia Ø Ufficio presso il Dipartimento di Fisica (Quinto Piano) Tel. 75-585 278 Ø E-mail: attilio.santocchia@pg.infn.it Ø Web: http://www.fisica.unipg.it/~attilio.santocchia/
Distribuzioni campionarie
1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari
Campo di Variazione Costituisce la misura di
Statistica2 22/09/2015 I Parametri di dispersione Campo di Variazione Costituisce la misura di PESO ALLA NASCITA DEI BOVINI matricola PESO SESSO 7 38,00 F 8 38,00 F 1 40,00 F 2 40,00 F 5 40,00 F 10 42,00
Ulteriori applicazioni del test del Chi-quadrato (χ 2 )
Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello
Strumenti informatici Realizzare un test z, un test t e un test F per campioni indipendenti con Excel e SPSS
Strumenti informatici 5.2 - Realizzare un test z, un test t e un test F per campioni indipendenti con Excel e SPSS Sia Excel che SPSS consentono di realizzare in modo abbastanza rapido il test sulle medie
Capitolo 5 Confidenza, significatività, test di Student e del χ 2
Capitolo 5 Confidenza, significatività, test di Student e del χ 5.1 L inferenza Se conosciamo la legge di probabilità di un evento (a priori o a posteriori) possiamo fare delle previsioni su come l evento
I TEST STATISTICI. dott.ssa Gabriella Agrusti
I TEST STATISTICI dott.ssa Gabriella Agrusti Dulcis in fundo.. come scegliere un test statistico in base all ipotesi come stabilire se due variabili sono associate (correlazione di Pearson) come stabilire
Istituzioni di Statistica e Statistica Economica
Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 1 A. I dati riportati nella seguente tabella si riferiscono
Distribuzioni campionarie. Antonello Maruotti
Distribuzioni campionarie Antonello Maruotti Outline 1 Introduzione 2 Concetti base Si riprendano le considerazioni fatte nella parte di statistica descrittiva. Si vuole studiare una popolazione con riferimento
Esercitazione 8 maggio 2014
Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un
Note sulla probabilità
Note sulla probabilità Maurizio Loreti Dipartimento di Fisica Università degli Studi di Padova Anno Accademico 2002 03 1 La distribuzione del χ 2 0.6 0.5 N=1 N=2 N=3 N=5 N=10 0.4 0.3 0.2 0.1 0 0 5 10 15
Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi
Esercitazione 14 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 14 Ex.1: Verifica Ipotesi sulla media (varianza nota) Le funi prodotte da un certo macchinario hanno una
Intervallo di confidenza
Intervallo di confidenza Prof. Giuseppe Verlato, Prof. Roberto de Marco Sezione di Epidemiologia e Statistica Medica, Università di Verona campione inferenza popolazione Media Riportare sempre anche Stima
Verifica delle ipotesi: Binomiale
Verifica delle ipotesi: Binomiale Esercizio Nel collegio elettorale di una città, alle ultime elezioni il candidato A ha ottenuto il 4% delle preferenze mentre il candidato B il 6%. Nella nuova tornata
STATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Esercizio: si consideri una generica popolazione X con media µ e varianza σ 2 Siano T 1 =(X 1 +X 2 +X 3 +X 4 )/4 e T 2 =(3X 1 +4X
PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07
PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 006/07 Esercizio 1 Prova scritta del 16/1/006 In un ufficio postale lavorano due impiegati che svolgono lo stesso compito in maniera indipendente, sbrigando
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA
PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA
Test delle ipotesi sulla media.
. Caso di un singolo campione. Varianza nota.. Ipotesi alternativa bilaterale Test delle ipotesi sulla media. Valore medio η e deviazione standard σ della popolazione note. η è il valore stimato dal nostro
Premessa: la dipendenza in media
Premessa: la dipendenza in media Supponiamo di avere K diversi livelli di un fattore che potrebbero influire su una determinata variabile. Per esempio supponiamo di domandarci se la diversificazione (intesa
ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1
. Verifica di ipotesi: parte seconda.. Verifica di ipotesi per due campioni. Quando abbiamo due insiemi di dati possiamo chiederci, a seconda della loro natura, se i campioni sono simili oppure no. Ci
Esercitazione: La distribuzione NORMALE
Esercitazione: La distribuzione NORMALE Uno dei più importanti esempi di distribuzione di probabilità continua è dato dalla distribuzione Normale (curva normale o distribuzione Gaussiana); è una delle
b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):
ESERCIZIO 1 Una grande banca vuole stimare l ammontare medio di denaro che deve essere corrisposto dai correntisti che hanno il conto scoperto. Si seleziona un campione di 100 clienti su cui si osserva
C.I. di Metodologia clinica
C.I. di Metodologia clinica Modulo 5. I metodi per la sintesi e la comunicazione delle informazioni sulla salute Quali errori influenzano le stime? L errore casuale I metodi per la produzione delle informazioni
Un esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione
La verifica delle ipotesi In molte circostanze il ricercatore si trova a dover decidere quale, tra le diverse situazioni possibili riferibili alla popolazione, è quella meglio sostenuta dalle evidenze
Misure Meccaniche e Termiche. punti massa. Valore atteso: Varianza:
Fenomeni aleatori Misure Meccaniche e Termiche Sezione di Misure e Tecniche Sperimentali I fenomeni aleatori (o casuali) sono fenomeni empirici il cui risultato non è prevedibile a priori, caratterizzati
DISTRIBUZIONI DI PROBABILITA
DISTRIBUZIONI DI PROBABILITA La distribuzione di probabilità e un modello matematico, uno schema di riferimento, che ha caratteristiche note e che può essere utilizzato per rispondere a delle domande derivate
Modulo di Statistica e Tecnologia (Dott. Giorgio Poletti
Laurea in Scienze dell Educazione Insegnamento di Pedagogia Sperimentale (Prof. Paolo Frignani) Modulo di Statistica e Tecnologia (Dott. Giorgio Poletti giorgio.poletti@unife.it) MEDIA aritmetica semplice
Teoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
PROVA SCRITTA DI STATISTICA. cod CLEA-CLAPI-CLEFIN-CLELI cod CLEA-CLAPI-CLEFIN-CLEMIT. 5 Novembre 2003 SOLUZIONI MOD.
PROVA SCRITTA DI STATISTICA cod. 4038 CLEA-CLAPI-CLEFIN-CLELI cod. 5047 CLEA-CLAPI-CLEFIN-CLEMIT 5 Novembre 003 SOLUZIONI MOD. A In 8 facoltà di un ateneo italiano vengono rilevati i seguenti dati campionari
Statistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme
DISTRIBUZIONE NORMALE (1)
DISTRIBUZIONE NORMALE (1) Nella popolazione generale molte variabili presentano una distribuzione a forma di campana, bene caratterizzata da un punto di vista matematico, chiamata distribuzione normale
Distribuzione Normale
Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di
Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica
13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in
Test di ipotesi su due campioni
2/0/20 Test di ipotesi su due campioni Confronto tra due popolazioni Popolazioni effettive: unità statistiche realmente esistenti. Esempio: Confronto tra forze lavoro di due regioni. Popolazioni ipotetiche:
UNIVERSITÀ di ROMA TOR VERGATA
UNIVERSITÀ di ROMA TOR VERGATA Corso di Statistica, anno 2010-11 P.Baldi Lista di esercizi 3. Corso di Laurea in Biotecnologie Esercizio 1 Una v.a. X segue una legge N(2, ). Calcolare a1) P(X 1) a2) P(2
Lezione 4 a - Misure di dispersione o di variabilità
Lezione 4 a - Misure di dispersione o di variabilità Abbiamo visto che la media è una misura della localizzazione centrale della distribuzione (il centro di gravità). Popolazioni con la stessa media possono
ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti
UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE a.a. 007/008 ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti A cura di: Ing.
si tratta del test del chi-quadro di adattamento e di quello di indipendenza. 1 l ipotesi che la popolazione segua una legge fissata;
di : dado : normale Finora abbiamo visto test d ipotesi per testare ipotesi differenti, ma tutte concernenti il valore atteso di una o due popolazioni. In questo capitolo vediamo come testare 1 l ipotesi
Esercitazione n. 3 - Corso di STATISTICA - Università della Basilicata - a.a. 2011/12 Prof. Roberta Siciliano
Esercitazione n. 3 - Corso di STATISTICA - Università della Basilicata - a.a. 2011/12 Prof. Roberta Siciliano Esercizio 1 Una moneta viene lanciata 6 volte. Calcolare a) La probabilità che escano esattamente
Statistica ARGOMENTI. Calcolo combinatorio
Statistica ARGOMENTI Calcolo combinatorio Probabilità Disposizioni semplici Disposizioni con ripetizione Permutazioni semplici Permutazioni con ripetizioni Combinazioni semplici Assiomi di probabilità
UNIVERSITÀ DEGLI STUDI DI PERUGIA
SIGI, Statistica II, esercitazione n. 3 1 UNIVERSITÀ DEGLI STUDI DI PERUGIA FACOLTÀ DI ECONOMIA CORSO DI LAUREA S.I.G.I. STATISTICA II Esercitazione n. 3 Esercizio 1 Una v.c. X si dice v.c. esponenziale
Capitolo 11 Test chi-quadro
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara Docenti: Dott.
Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica
Indicatori di Posizione e di Variabilità Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Indici Sintetici Consentono il passaggio da una pluralità
ISTOGRAMMI E DISTRIBUZIONI:
ISTOGRAMMI E DISTRIBUZIONI: i 3 4 5 6 7 8 9 0 i 0. 8.5 3 0 9.5 7 9.8 8.6 8. bin (=.) 5-7. 7.-9.4 n k 3 n k 6 5 n=0 =. 9.4-.6 5 4.6-3.8 3 Numero di misure nell intervallo 0 0 4 6 8 0 4 6 8 30 ISTOGRAMMI