La verifica delle ipotesi

Documenti analoghi
NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI CONFRONTO DI PIU MEDIE IL METODO DI ANALISI DELLA VARIANZA

Ministero della Salute D.G. della programmazione sanitaria --- GLI ACC - L ANALISI DELLA VARIABILITÀ METODOLOGIA

LA STATISTICA: OBIETTIVI; RACCOLTA DATI; LE FREQUENZE (EXCEL) ASSOLUTE E RELATIVE

Esercitazioni del corso di Relazioni tra variabili. Giancarlo Manzi Facoltà di Sociologia Università degli Studi di Milano-Bicocca

LA COMPATIBILITA tra due misure:

3. Esercitazioni di Teoria delle code

Esame di Statistica Corso di Laurea in Economia

A. AUMENTO DELLA SPESA PUBBLICA FINANZIATO ESCLUSIVAMENTE TRAMITE INDEBITAMENTO

STATISTICA DESCRITTIVA CON EXCEL

STATISTICA SOCIALE Corso di laurea in Scienze Turistiche, a.a. 2007/2008 Esercizi 16 novembre2007

Relazioni tra variabili: Correlazione e regressione lineare

Esame di Statistica tema A Corso di Laurea in Economia Prof.ssa Giordano Appello del 15/07/2011

ANALISI DI TABELLE DI CONTINGENZA

MACROECONOMIA A.A. 2014/2015

1) Dato un carattere X il rapporto tra devianza entro e devianza totale è 0.25 e la devianza totale è 40. La devianza tra vale: a) 10 b) 20 c) 30

TITOLO: L INCERTEZZA DI TARATURA DELLE MACCHINE PROVA MATERIALI (MPM)

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 17/09/2012

Regressione Multipla e Regressione Logistica: concetti introduttivi ed esempi

Università degli Studi di Urbino Facoltà di Economia

Variabili statistiche - Sommario

Scienze Geologiche. Corso di Probabilità e Statistica. Prove di esame con soluzioni

Strutture deformabili torsionalmente: analisi in FaTA-E

C.I. di Metodologia clinica

Metodi e Modelli per l Ottimizzazione Combinatoria Progetto: Metodo di soluzione basato su generazione di colonne

Relazione funzionale e statistica tra due variabili Modello di regressione lineare semplice Stima puntuale dei coefficienti di regressione

* * * Nota inerente il calcolo della concentrazione rappresentativa della sorgente. Aprile 2006 RL/SUO-TEC 166/2006 1

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

STATISTICA DESCRITTIVA - SCHEDA N. 5 REGRESSIONE LINEARE

Leggere i dati da file

I SINDACATI E LA CONTRATTAZIONE COLLETTIVA. Il ruolo economico del sindacato in concorrenza imperfetta, in cui:

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Analisi di dati di frequenza

Introduzione al Machine Learning

Misure di dispersione. Introduzione. Statistica descrittiva. Distribuzioni di probabilità e funzioni di ripartizione. Indici di posizione

Soluzione esercizio Mountbatten

Studio grafico-analitico di una funzioni reale in una variabile reale

INDICI STATISTICI MEDIA, MODA, MEDIANA, VARIANZA

La retroazione negli amplificatori

Grafico di una serie di dati sperimentali in EXCEL

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

PROCEDURA INFORMATIZZATA PER LA COMPENSAZIONE DELLE RETI DI LIVELLAZIONE. (Metodo delle Osservazioni Indirette) - 1 -

Analisi di mercurio in matrici solide mediante spettrometria di assorbimento atomico a vapori freddi

Soluzione attuale ONCE A YEAR. correlation curve (ISO10155) done with, at least 9 parallel measurements

Analisi statistica di dati biomedici Analysis of biologicalsignals

Transcript:

La verfca delle potes In molte crcostanze l rcercatore s trova a dover decdere quale, tra le dverse stuazon possbl rferbl alla popolazone, è quella meglo sostenuta dalle evdenze emprche. Ipotes statstca: supposzone rguardante: un parametro della popolazone la forma della dstrbuzone della popolazone Un potes è un affermazone che vene consderata vera a meno che l evdenza emprca port ad avere ser dubb sulla sua valdtà e suggersca che essa è falsa

Il test ch-quadrato sull ndpendenza L ndce ch-quadrato χ osservato Il valore dell ndce è sgnfcatvamente dverso da zero? Ipotes H0 : ndpendenza H1 : no ndpendenza Lvello d sgnfcatvtà Statstca test α=0.05 Regola d decsone: Rfutamo H0, con una probabltà d errore par a α, se χoss> χc χc è l valore crtco che s trova nella coda d destra della dstrbuzone con (r-1(c-1 gdl χ = (n nˆ ˆ n

La dstrbuzone della statstca test Tavola della dstrbuzone Grad d lbertà χ Area nella coda destra 0,995 0,990 0,975 0,950 0,900 0,750 0,50 0,100 0,050 0,05 0,010 0,004 0,103 0,35 0,711 1,145 1,635,167,733 3,35 3,940 0,016 0,11 0,584 1,064 1,610,04,833 3,490 4,168 4,865 0,10 0,575 1,13 1,93,675 3,455 4,55 5,071 5,899 6,737 1,33,773 4,108 5,385 6,66 7,841 9,037 10, 11,389 1,549,6 4,605 6,51 7,779 9,36 10,645 1,017 13,36 14,684 15,987 3,841 5,991 7,815 9,488 11,0 1,59 14,067 15,507 16,9 18,307 5,04 7,378 9,348 11,143 1,833 14,449 16,013 17,535,03 0,483 6,635 9,10 11,345 13,77 15,086 16,81 18,475 0,090 1,666 3,09 1 3 4 5 6 7 8 9 10 0,07 0,07 0,41 0,676 0,989 1,344 1,735,156 0,115 0,97 0,554 0,87 1,39 1,646,088,558 0,001 0,051 0,16 0,484 0,831 1,37 1,690,180,0 3,47 11 1 13 14 15 16 17 18 0,603 3,074 3,565 4,075 4,601 5,14 5,697 6,65 6,844 7,434 3,053 3,571 4,107 4,660 5,9 5,81 6,408 7,015 7,633 8,60 3,816 4,404 5,009 5,69 6,6 6,908 7,564 8,31 8,907 9,591 4,575 5,6 5,89 6,571 7,61 7,96 8,67 9,390 10,117 10,851 5,578 6,304 7,04 7,790 8,547 9,31 10,085 10,865 11,651 1,443 7,584 8,438 9,99 10,165 11,037 11,91 1,79 13,675 14,56 15,45 13,1 14,845 15,984 17,117 18,45,369 0,489 1,605,718 3,88 17,75 18,549,81 1,064,307 3,54 4,769 5,989 7,04 8,41,675 1,06,36 3,685 4,996 6,96 7,587 8,869 30,144 31,410 1,90 3,337 4,736 6,1 7,488 8,845 30,1 31,56 3,85 34,1 4,75 6,17 7,688 9,141 30,578 3,000 33,409 34,805 36,1 37,566 1 8,034 8,643 8,897 9,54 10,83 10,98 11,591 1,338 13,40 14,041 16,344 17,40 4,935 6,039 9,615 30,813 3,671 33,94 35,479 36,781 38,93 40,89

Il test ch-quadrato sull ndpendenza VOTO Meno d 96 VOTO 96-105 106-110 110 e lode OCCUPAZIONEATTUALE ATTUALE OCCUPAZIONE Non occupato Precaro Occ. stable 9 61 57 51 5 3 5 0 8 130 1 133 α = 0,05 169 73 38 VOTO Meno d 96 96-105 106-110 110 e lode 3,84 (n n n χ = ( n n n =3,84 OCCUPAZIONE ATTUALE Non occupato Precaro Occ. stable 9 31,4 7,1 41,4 61 57 51 36,1 33,7 30, 5 3 5 34, 31,5 34, 0 8 31,4 8,6 40,0 130 1 133 34,0 31, 34,8 100,0 169 100,0 73 100,0 100,0 38 100,0

Il test ch-quadrato sull ndpendenza Tavola della dstrbuzone Grad d lbertà χ Area nella coda destra 0,995 0,990 0,975 0,950 0,900 0,750 0,50 0,100 0,050 0,05 0,010 0,004 0,103 0,35 0,711 1,145 1,635,167,733 3,35 3,940 0,016 0,11 0,584 1,064 1,610,04,833 3,490 4,168 4,865 0,10 0,575 1,13 1,93,675 3,455 4,55 5,071 5,899 6,737 1,33,773 4,108 5,385 6,66 7,841 9,037 10, 11,389 1,549,6 4,605 6,51 7,779 9,36 10,645 1,017 13,36 14,684 15,987 3,841 5,991 7,815 9,488 11,0 1,59 14,067 15,507 16,9 18,307 5,04 7,378 9,348 11,143 1,833 14,449 16,013 17,535,03 0,483 6,635 9,10 11,345 13,77 15,086 16,81 18,475 0,090 1,666 3,09 1 3 4 5 6 7 8 9 10 0,07 0,07 0,41 0,676 0,989 1,344 1,735,156 0,115 0,97 0,554 0,87 1,39 1,646,088,558 0,001 0,051 0,16 0,484 0,831 1,37 1,690,180,0 3,47 11 1 13 14 15 16 17 18 0,603 3,074 3,565 4,075 4,601 5,14 5,697 6,65 6,844 7,434 3,053 3,571 4,107 4,660 5,9 5,81 6,408 7,015 7,633 8,60 3,816 4,404 5,009 5,69 6,6 6,908 7,564 8,31 8,907 9,591 4,575 5,6 5,89 6,571 7,61 7,96 8,67 9,390 10,117 10,851 5,578 6,304 7,04 7,790 8,547 9,31 10,085 10,865 11,651 1,443 7,584 8,438 9,99 10,165 11,037 11,91 1,79 13,675 14,56 15,45 13,1 14,845 15,984 17,117 18,45,369 0,489 1,605,718 3,88 17,75 18,549,81 1,064,307 3,54 4,769 5,989 7,04 8,41,675 1,06,36 3,685 4,996 6,96 7,587 8,869 30,144 31,410 1,90 3,337 4,736 6,1 7,488 8,845 30,1 31,56 3,85 34,1 4,75 6,17 7,688 9,141 30,578 3,000 33,409 34,805 36,1 37,566 1 8,034 8,643 8,897 9,54 10,83 10,98 11,591 1,338 13,40 14,041 16,344 17,40 4,935 6,039 9,615 30,813 3,671 33,94 35,479 36,781 38,93 40,89

Il test ch-quadrato sull ndpendenza VOTO Meno d 96 VOTO 96-105 106-110 110 e lode OCCUPAZIONEATTUALE ATTUALE OCCUPAZIONE Non occupato Precaro Occ. stable 9 61 57 51 5 3 5 0 8 130 1 133 VOTO α = 0,05 χ0,05;6 96-105 106-110 110 e lode α 1,59 (n Zona d accettazone Meno d 96 = 1,59 1-α 3,84 169 73 38 Zona d rfuto n n χ = ( n n n =3,84 OCCUPAZIONE ATTUALE Non occupato Precaro Occ. stable 9 31,4 7,1 41,4 61 57 51 36,1 33,7 30, 5 3 5 34, 31,5 34, 0 8 31,4 8,6 40,0 130 1 133 34,0 31, 34,8 Non rfuto l potes H0 d ndpendenza fra le mutabl 100,0 169 100,0 73 100,0 100,0 38 100,0

Il test ch-quadrato sull ndpendenza VOTO Meno d 96 VOTO 96-105 106-110 110 e lode OCCUPAZIONEATTUALE ATTUALE OCCUPAZIONE Non occupato Precaro Occ. stable 9 61 57 51 5 3 5 0 8 130 1 133 169 73 38 VOTO Meno d 96 α = 0,05 χ0,05;6 106-110 = 1,59 1-α 3,84 96-105 110 e lode α 1,59 (n Zona d accettazone Zona d rfuto n n χ = ( n n n =3,84 OCCUPAZIONE ATTUALE Non occupato Precaro Occ. stable 9 31,4 7,1 41,4 61 57 51 36,1 33,7 30, 5 3 5 34, 31,5 34, 0 8 31,4 8,6 40,0 130 1 133 34,0 31, 34,8 100,0 169 100,0 73 100,0 100,0 38 100,0 Supponamo che, sulla base d questo rsultato camponaro, o decda comunque d rfutare l potes d ndpendenza e concluda per l assocazone tra le mutabl consderate. Qual è la probabltà che sta commettendo un errore?

Il test ch-quadrato sull ndpendenza VOTO Meno d 96 VOTO 96-105 106-110 110 e lode OCCUPAZIONEATTUALE ATTUALE OCCUPAZIONE Non occupato Precaro Occ. stable 9 61 57 51 5 3 5 0 8 130 1 133 169 73 38 VOTO Meno d 96 p-value 96-105 106-110? 3,84 110 e lode (n n n Il p-value è la probabltà d commettere un errore nel rfutare l potes H0 sulla base del valore camponaro osservato. Quanto pù è pccolo, tanto pù tenderemo a rfutare H0. χ = ( n n n =3,84 OCCUPAZIONE ATTUALE Non occupato Precaro Occ. stable 9 31,4 7,1 41,4 61 57 51 36,1 33,7 30, 5 3 5 34, 31,5 34, 0 8 31,4 8,6 40,0 130 1 133 34,0 31, 34,8 100,0 169 100,0 73 100,0 100,0 38 100,0

Il test ch-quadrato sull ndpendenza Tavola della dstrbuzone Grad d lbertà χ Area nella coda destra 0,995 0,990 0,975 0,950 0,900 0,750 0,50 0,100 0,050 0,05 0,010 0,004 0,103 0,35 0,711 1,145 1,635,167,733 3,35 3,940 0,016 0,11 0,584 1,064 1,610,04,833 3,490 4,168 4,865 0,10 0,575 1,13 1,93,675 3,455 4,55 5,071 5,899 6,737 1,33,773 4,108 5,385 6,66 7,841 9,037 10, 11,389 1,549,6 4,605 6,51 7,779 9,36 10,645 1,017 13,36 14,684 15,987 3,841 5,991 7,815 9,488 11,0 1,59 14,067 15,507 16,9 18,307 5,04 7,378 9,348 11,143 1,833 14,449 16,013 17,535,03 0,483 6,635 9,10 11,345 13,77 15,086 16,81 18,475 0,090 1,666 3,09 1 3 4 5 6 7 8 9 10 0,07 0,07 0,41 0,676 0,989 1,344 1,735,156 0,115 0,97 0,554 0,87 1,39 1,646,088,558 0,001 0,051 0,16 0,484 0,831 1,37 1,690,180,0 3,47 11 1 13 14 15 16 17 18 0,603 3,074 3,565 4,075 4,601 5,14 5,697 6,65 6,844 7,434 3,053 3,571 4,107 4,660 5,9 5,81 6,408 7,015 7,633 8,60 3,816 4,404 5,009 5,69 6,6 6,908 7,564 8,31 8,907 9,591 4,575 5,6 5,89 6,571 7,61 7,96 8,67 9,390 10,117 10,851 5,578 6,304 7,04 7,790 8,547 9,31 10,085 10,865 11,651 1,443 7,584 8,438 9,99 10,165 11,037 11,91 1,79 13,675 14,56 15,45 13,1 14,845 15,984 17,117 18,45,369 0,489 1,605,718 3,88 17,75 18,549,81 1,064,307 3,54 4,769 5,989 7,04 8,41,675 1,06,36 3,685 4,996 6,96 7,587 8,869 30,144 31,410 1,90 3,337 4,736 6,1 7,488 8,845 30,1 31,56 3,85 34,1 4,75 6,17 7,688 9,141 30,578 3,000 33,409 34,805 36,1 37,566 1 8,034 8,643 8,897 9,54 10,83 10,98 11,591 1,338 13,40 14,041 16,344 17,40 4,935 6,039 9,615 30,813 3,671 33,94 35,479 36,781 38,93 40,89

Il test ch-quadrato sull ndpendenza VOTO Meno d 96 VOTO 96-105 106-110 110 e lode OCCUPAZIONEATTUALE ATTUALE OCCUPAZIONE Non occupato Precaro Occ. stable 9 61 57 51 5 3 5 0 8 130 1 133 169 73 38 VOTO Meno d 96 96-105 p-value 106-110 110 e lode? 3,84 (n n n χ = ( n n n =3,84 OCCUPAZIONE ATTUALE Non occupato Precaro Occ. stable 9 31,4 7,1 41,4 61 57 51 36,1 33,7 30, 5 3 5 34, 31,5 34, 0 8 31,4 8,6 40,0 130 1 133 34,0 31, 34,8 100,0 169 100,0 73 100,0 100,0 38 100,0 Il p-value è la probabltà d commettere un errore nel rfutare l potes H0 sulla base del valore camponaro osservato. Quanto pù è pccolo, tanto pù tenderemo a rfutare H0. Ch-quadrato Ch-quadrato d Pearson Valore 3,835 df 6 Sg.,699

Il test ch-quadrato sull ndpendenza VOTO VOTO FREQ. FREQ. <30 delle lez. 30-50 delle lez. Meno d 96 43 5,7 7 17,0 >50 delle lez. 18,3 96-105 8 49,1 68 4,8 33,9 169 44, 106-110 9 17,4 31,5 13 3, 73,1 110 e lode 13 7,8 33 0,8 4 4,9 18,3 167 100,0 159 100,0 56 100,0 38 100,0 χ = ( n n n = 47,56 Ch-quadrato Ch-quadrato d Pearson (n n n Valore 47,559 47,56 df 6 Sg.,000

Eserczo1 In un' ndagne d mercato sulle preferenze de consumator per succh d frutta pocalorc, rspetto a succh d frutta tradzonal, s selezonano 50 masch e 50 femmne all nterno d un supermercato. Al campone così estratto s chede d esprmere una preferenza per uno de due succh. Dec masch e vent femmne dcharano d preferre l succo d frutta pocalorco. Esste una dfferenza sgnficatva nelle preferenze per succh tra masch e femmne? S scelga α = 0,05 Ipocalorco Normale Masch 10 40 50 Femmne 0 30 50 30 100

Eserczo1 Ipocalorco Normale Masch 10 40 50 Femmne 0 30 50 30 100 L potes nulla d ndpendenza è: H0 : p = p p contro l potes alternatva: H1 : p p p H K n n$ χ = La statstca test utlzzata è: n$ =1 =1 ( che, sotto l potes nulla, s dstrbusce come un Ch- quadrato con (H- 1(K- 1 grad d lbertà. χ χα La regone d rfiuto è:

Eserczo1 Ipocalorco Normale Masch 10 40 50 Femmne 0 30 50 30 100 nˆ = Frequenze teorche d ndpendenza Ipocalorco Normale n. * n. Masch 15 35 50 Femmne 15 35 50 30 100 n

Eserczo1: soluzone F_ osservate F_teorche (oss- teo /teo (oss- teo (oss- teo 10 15-5 5 1,66 0 40 30 15 35 35 5 5-5 5 5 5 1,66 0,71 0,71 4,76 χ 0, 05 ;1 = 3,84 χ oss >χ Ch osservato 0, 05 ;1 S rfiuta l'potes nulla d ndpendenza tra l genere e la preferenza per l tpo d succo d frutta.

Eserczo Il capo del personale d una grande azenda vuole verficare se le assenze dal lavoro s dstrbuscano n manera unforme nell'arco della settmana lavoratva (d 5 gorn. Per farlo, osserva le assenze regstrate nell'ultmo mese e l gorno n cu queste s sono verficate, ottenendo rsultat rportat sotto. Cosa s può concludere sulla base de dat? Gorno della settmana F_osservate 1 3 3 4 5 1 0 4

Eserczo: soluzone Se è vera H0 le frequenze osservate e teorche dovrebbero essere molto sml, a tal fine per verficare l potes d adattamento s utlzza l seguente test: ( n np χ c = χ (α,k 1 np =1 k c RC (α : χ > χ (α,k 1 α 0 RA χ α,k-1 RC χ

Eserczo: soluzone Frequenze Frequenze teorche Frequenze Gorno della osservate relatve assolute X p settmana teorche np (X- np/np 1 3 0, 0,5 1 0, 0,5 3 0 0, 4 0, 0 5 4 0, 10 1 10 5 X U (5 P( X = x = p = χ 0,05; 4 = 9,5 1 = 0, 5 χ oss < χ 0, 05 ;1 non s rfiuta l'potes nulla, qund la dstrbuzone teorca s adatta alla dstrbuzone emprca.

Eserczo 3 da Pccolo Utlzzando un campone d n=303 untà statstche s vuole msurare l ndpendenza tra le varabl Fumo e Sesso, dat sono rportat n tabella Masch Femmne Fuma 38 74 11 Non fuma 45 146 1 83 9 303

Eserczo 3 Masch Femmne Fuma 38 74 11 Non fuma 45 146 1 83 9 303 Frequenze teorche d ndpendenza nˆ = Masch Femmne Fuma 30,68 81,3 11 Non fuma 5,3 138,68 1 83 9 303 n. * n. n

Eserczo 3 χ = ( n n n χ = 3.841 0,05 = 3.8159 χ = 6.635 0,01

Eserczo 4 In uno studo avente come obettvo la verca dell'esstenza d una relazone fra l'occupazone e l lvello d struzone e stato consderato l seguente campone d 500 ndvdu: Almeno 5 ann d scuola superore Meno d 5 ann d scuola superore Impegat nell ndustra opera Impegat ne Lavorator servz agrcol 4 146 7 10 18 79 18 8 Vercare tramte l test l'ndpendenza fra le varabl.

Eserczo 5 Vercare tramte l test l'ndpendenza fra le varabl. N uscto 1 3 4 5 6 frequenza 5 17 15 3 4 16 Provare l potes che l dado non sa truccato usando un lvello d sgnfcatvtà del 5

Eserczo 6 Per stablre l effcaca d un vaccno antnfluenzale è stata condotta una rcerca che ha dato seguent rsultat Nessuna nfluenza Una nfluenza Pù d una nfluenzaa vaccnat 5 145 103 Non vaccnat 4 136 140 S può rtenere che l vaccno sa effcace?