Positivo Negativo Non Gravidanza falso-positivo vero-negativo



Documenti analoghi
si definisce Funzione Integrale; si chiama funzione integrale in quanto il suo * x

3. Funzioni iniettive, suriettive e biiettive (Ref p.14)

lim lim lim + Nome.Cognome Classe 4D 7 Aprile 2011 Verifica di matematica Problema (punti 3) Sono date le funzioni: f ( x)

Introduzione all algebra

Il lemma di ricoprimento di Vitali

AUTOVALORI ED AUTOVETTORI. Sia V uno spazio vettoriale di dimensione finita n.

Stabilità dei sistemi di controllo in retroazione

Esercizi sulle serie di Fourier

Integrali de niti. Il problema del calcolo di aree ci porterà alla de nizione di integrale de nito.

INTEGRALI IMPROPRI. f(x) dx. e la funzione f(x) si dice integrabile in senso improprio su (a, b]. Se tale limite esiste ma

Siano α(x), β(x) due funzioni continue in un intervallo [a, b] IR tali che. α(x) β(x).

Il volume del cilindro è dato dal prodotto della superficie di base per l altezza, quindi

( X, Y ) che danno un livello costante di utilità (curva di livello). Fissando per esempio il valore U 0 per

Ing. Alessandro Pochì

1 b a. f(x) dx. Osservazione 1.2. Se indichiamo con µ il valore medio di f su [a, b], abbiamo che. f(x) dx = µ(b a) =

Anno 5. Applicazione del calcolo degli integrali definiti

2 x = 64 (1) L esponente (x) a cui elevare la base (2) per ottenere il numero 64 è detto logaritmo (logaritmo in base 2 di 64), indicato così:

ANALISI REALE E COMPLESSA a.a

Acidi Deboli. Si definisce acido debole un acido con K a < 1 che risulta perciò solo parzialmente dissociato in soluzione. Esempi di acidi deboli:

Nome.Cognome classe 5D 18 Marzo Verifica di matematica

Il calcolo letterale

La parabola. Fuoco. Direttrice y

" Osservazione. 6.1 Integrale indefinito. R Definizione (Primitiva) E Esempio 6.1 CAPITOLO 6

Capitolo 2. Il problema del calcolo delle aree

Equivalenza tra equazioni di Lagrange e problemi variazionali

CORSO ZERO DI MATEMATICA

Daniela Tondini

Metodi statistici per l analisi dei dati

Corso di Analisi Matematica Calcolo integrale per funzioni di una variabile

Il calcolo letterale

a con base a maggiore di 1 Dominio Codominio Crescenza/decrescenza Funz Crescente in Concavità/convessità Strettamente convessa in

Teoria in sintesi ESPONENZIALI. Potenze con esponente reale. La potenza. Sono definite: Non sono definite: Casi particolari :

Imparare: cosa, come, perché.

Integrale Improprio. f(x) dx =: Osserviamo che questa definizione ha senso dal momento che per ogni y è ben definito l integrale b

Il calcolo letterale

n volte m volte n+m volte n volte n volte n volte } = a n + n + n = a n m

corrispondenza dal piano in sé, che ad ogni punto P del piano fa corrispondere il punto P' in

Capitolo 6. Integrali di funzioni di una variabile

COME SOPRAVVIVERE ALLA MATEMATICA. 1. La funzione matematica e la sua utilità in economia

Metodi statistici per l analisi dei dati

FUNZIONI MATEMATICHE. Una funzione lineare è del tipo:

Manuale Generale Sintel Guida alle formule di aggiudicazione

Elettronica dei Sistemi Digitali Il test nei sistemi elettronici: guasti catastrofici e modelli di guasto (parte I)

Facoltà di Economia - Università di Sassari Anno Accademico Dispense Corso di Econometria Docente: Luciano Gutierrez.

POTENZA CON ESPONENTE REALE

UNITÀ DI GUIDA E SLITTE

La parabola LA PARABOLA È IL LUOGO DEI PUNTI DEL PIANO EQUIDI- STANTI DA UN PUNTO DETTO FUOCO E DA UNA RETTA CHE NON LO CONTIENE DETTA DIRETTRICE.

ESPONENZIALI E LOGARITMI

RAPPRESENTAZIONE GRAFICA DELLA PARABOLA a ( ) { } f con, è la parabola di equazione y = ax + bx + c. Vogliamo disegnarla. 2

, x 2. , x 3. è un equazione nella quale le incognite appaiono solo con esponente 1, ossia del tipo:

B8. Equazioni di secondo grado

Il Primo Principio della Termodinamica non fornisce alcuna indicazione riguardo ad alcuni aspetti pratici.

Il problema delle aree. Metodo di esaustione.

Liceo Scientifico Sperimentale anno Problema 1 Bernardo Pedone. ESAME DI STATO DI LICEO SCIENTIFICO CORSO SPERIMENTALE PNI anno

Titolazione Acido Debole Base Forte. La reazione che avviene nella titolazione di un acido debole HA con una base forte NaOH è:

Successioni di funzioni

IL CALCOLO LETTERALE: I MONOMI Conoscenze. per a = - 2 vale:

Variabili Casuali e Distribuzioni di Probabilità Definizione: VARIABILI CASUALI VARIABILI CASUALI PROBABILITÀ

Figura 47: i ponti termici possono essere causati da discontinuità dei materiali o da discontinuità geometriche.

1 Lavoro sperimentale (di Claudia Sortino)

Tassi di cambio, prezzi e

Verifica di Fisica 04/12/2014 Argomenti trattati durante il corso:

1 Integrali generalizzati su intervalli illimitati

IL CALCOLO LETTERALE: I MONOMI Conoscenze. per a = - 2 vale:

Regime di sconto commerciale. S = sconto ; K = somma da scontare ; s = tasso di sconto unitario V a = valore attuale ; I = interesse ; C = capitale

AMMORTAMENTO PERDITE ESERCIZIO

VERSO L ESAME DI STATO LA DERIVATA DI UNA FUNZIONE

Area di una superficie piana o gobba 1. Area di una superficie piana. f x dx 0 e quindi :

ESERCIZI DI CALCOLO NUMERICO

METODO VOLTAMPEROMETRICO

Rendite (2) (con rendite perpetue)

14 - Integrazione numerica

13 - Integrali Impropri

Propagazione degli Errori e regressione lineare. Note e consigli d uso. -Termine covariante -- estrapolazione e/o interpolazione

13. EQUAZIONI ALGEBRICHE

Integrale definito. Introduzione: il problema delle aree

Definizione (primitiva, integrale indefinito). Data una funzione f diremo che una funzione F è una primitiva di f se

CALCOLO NUMERICO. Francesca Mazzia. a.a. 2008/2009. Integrazione. Dipartimento Interuniversitario di Matematica. Università di Bari

BREVE APPENDICE SULLE UNITA' LOGARITMICHE

30 quesiti. 1 Febbraio Scuola... Classe... Alunno... Copyright 2011 Zanichelli Editore SpA, Bologna

ESAME DI STATO DI LICEO SCIENTIFICO CORSO DI ORDINAMENTO 2002 Sessione straordinaria

FORMULE DI AGGIUDICAZIONE

Variazioni di sviluppo del lobo frontale nell'uomo

Misure ed incertezze di misura

ESERCIZI ESERCIZI. Test di autoverifica Prova strutturata conclusiva ESERCIZI

Statistica. Lezione 6

a cura di Luca Cabibbo e Walter Didimo

3. Il calcolo a scuola (2): l uso della calcolatrice 1

CORSO DI RAGIONERIA A.A. 2013/2014

Esercizi di Informatica Teorica Pumping lemma e proprietà di

CALCOLO NUMERICO. Francesca Mazzia. Integrazione. Dipartimento Interuniversitario di Matematica. Università di Bari

Vediamo quindi l elenco dei limiti fondamentali, il cui risultato daremo per noto d ora in avanti e lo utilizzeremo ogni volta che sarà necessario.

Appunti di Matematica 1 - I polinomi - Polinomi. I vari monomi che compongono il polinomio si chiamano termini del polinomio.

2 Generalità sulle matrici

Esercizi estivi per la classe seconda

26/03/2012. Integrale Definito. Calcolo delle Aree. Appunti di analisi matematica: Il concetto d integrale nasce per risolvere due classi di problemi:

5.4 Il teorema fondamentale del calcolo integrale

Transcript:

Diz - Appunti di Sttistic - AA 2001/2002 - edizione 29/11/01 Cp. 2 - Pg. 1 Cpitolo 2. Ipotesi e test sttistici. Distriuzione t. Vriilità dell medi ed errore stndrd. Test t per cmpioni indipendenti e ppiti. Limiti fiducili dell medi. Grndezz del cmpione. I test sttistici Il termine test è sinonimo di prov, verific, ccertmento, ecc. Tutti i test (test di grvidnz, test elettorle, test di mmissione, test sttistico, ecc.) si sno sull verific di un cert condizione ipotizzt. L verific non vviene in modo diretto, m ttrverso l vlutzione di fenomeni strettmente correlti con l condizione ipotizzt. Pertnto, poiché mnc l evidenz dirett, non vremo certezz m solo un fiduci più o meno grnde nel ftto che l condizione esist. Le proposizioni di questo rgionmento sono normlmente sottointese, nscoste nelle pieghe dell nostr mente. Ad esempio, dire test di grvidnz vuol dire:. verificre l condizione di grvidnz ttrverso. due ipotesi mutulmente esclusive: grvidnz sì / grvidnz no c. non in modo diretto, es. riconoscendo l'emrione, m vlutndo un fenomeno strettmente correlto con l condizione di grvidnz (l positività di un rezione per le gondotropine corioniche HCG nelle urine). Quindi l'esito del test non d certezz, m solo un fiduci vlutile in termini di proilità. Nell'esempio citto, il test per le HCG - per qunto ffidile - può essere influenzto dlle condizioni dei regenti (es., ml conservti), dell'miente (es., tempertur fuori rnge), del cmpione iologico (es., lterto), ecc. Per cui potremo vere i seguenti risultti: Risultto del test Condizione rele ignot Positivo Negtivo Non Grvidnz flso-positivo vero-negtivo Grvidnz vero-positivo flso-negtivo Si definisce sensiilità o potenz di un test l frequenz di risultti veri-positivi specificità del test l frequenz di veri-negtivi l frequenz di flsi-positivi (detti nche errori del 1 tipo) l frequenz di flsi-negtivi (detti nche errori del 2 tipo) e inoltre ipotesi zero (H0) o ipotesi null(hn), l ipotesi di non novità o di non vrizione ipotesi 1 (H1) o ipotesi lterntiv (HA), l ipotesi di novità o di vrizione

Diz - Appunti di Sttistic - AA 2001/2002 - edizione 29/11/01 Cp. 2 - Pg. 2 Specificità e α sono complementri. Sono quindi complementri veri-negtivi e flsi-positivi. Inftti se un test è sempre giustmente negtivo sulle donne non grvide (100% di veri-negtivi) non segnlerà mi positività sulle stesse donne per errore (0% di flsi-positivi). Sensiilità e β sono complementri. Sono quindi complementri veri positivi e flsi negtivi. Inftti se un test è sempre giustmente positivo sulle donne grvide (100% di veri-positivi) non segnlerà mi negtività sulle stesse donne per errore (0% di flsi negtivi). Quindi dire che un test è specifico è come dire che h un ss proilità di flsi positivi, come nche che α è piccolo. Dire che un test è sensiile è come dire che h un ss proilità di flsi negtivi, come nche che β è piccolo. Rissumendo possimo indicre: Risultto del test Condizione H0: Non Grvidnz G- rele ignot H1: Grvidnz G+ Positivo T+ Negtivo T- totle qunti qunti 100% flsi positivi veri negtivi dei csi di non errore α specificità grvidnz T+/G- T-/G- T+/G- + T-/G- qunti veri positivi sensiilità T+/G+ qunti flsi negtivi errore β T-/G+ 100% dei csi di grvidnz T+/G+ + T-/G+ Un test per essere uono deve possedere si un'lt specificità che un'lt sensiilità. Non h lcun senso un test ltmente sensiile m niente specifico (come d esempio un test sempre positivo nel cso di grvidnz m nche positivo nel cso di non grvidnz). Anlogmente non h lcun senso un test ltmente specifico m niente sensiile (d esempio, un test sempre negtivo in cso di non grvidnz, m nche negtivo in cso di grvidnz). Cmimo esempio ed immginimo il risultto di indgini di polizi crico di un sospetto. Immginimo nche che le indgini rccolgno un serie di indizi m non delle prove così sicure che rivelino con certezz l colpevolezz o l innocenz dell indgto (nche se il confine estto tr indizio e prov rest soggettivo). Notre che in inglese il termine tril signific si processo giudizirio che esperimento controllto. Possimo considerre nche in questo cso i quttro risultti:

Diz - Appunti di Sttistic - AA 2001/2002 - edizione 29/11/01 Cp. 2 - Pg. 3 Risultto delle indgini Indizi grvi Condnnto Indizi lievi Assolto Condizione rele ignot Innocente flso-positivo vero-negtivo Colpevole vero-positivo flso-negtivo Le mggiori differenze rispetto ll'esempio precedente rigurdno: le conseguenze del risultto del test: qui si trtt di lscire in liertà o mndre in prigione un individuo l ripetiilità del test: l indgine di polizi non può essere ripetut con disinvoltur, può durre mesi e costre molti soldi (mentre un test di grvidnz può essere ripetuto diverse volte senz eccessivo sforzo) Questi ultimi spetti impongono l giudice di considerre con estrem ttenzione tutti i ftti prim di emettere il verdetto. Considerimo or il ftto che gli indizi possono essere più o meno lievi o più o meno grvi. In ltre prole gli indizi possono essere di qulsisi genere. Possimo quindi considerre un scl che rppresenti l grvità degli indizi. Ciò ci consente di nlizzre meglio il cso del giudizio cosiddetto grntist e quello del giudizio cosiddetto sommrio. Il giudizio grntist tende d emettere condnn solo nel cso in cui esistno grvissimi indizi. Il giudizio sommrio invece tende d emettere condnn nche nei csi in cui gli indizi sino semplici sospetti. Queste diverse decisioni fnno vrire l frequenz di flsi positivi (cioè innocenti condnnti). Il giudizio grntist limit l mssimo il rischio di condnnre un innocente mentre il giudizio sommrio non si preoccup troppo di tle prolem. In tl modo il giudizio grntist comport un umento di flsi negtivi (cioè colpevoli ssolti) mentre il giudizio sommrio riduce tle rischio. Per decidere qule metodo si il migliore occorre porsi il quesito: l'errore che si commette condnnndo un innocente è pri quello che si commette ssolvendo un colpevole? Tutte le persone di uon senso sono in grdo di ffermre che, tr le due, è meglio ssolvere un colpevole che condnnre un innocente.

Diz - Appunti di Sttistic - AA 2001/2002 - edizione 29/11/01 Cp. 2 - Pg. 4 risultto delle indgini = grvità degli indizi ❿❾❽❼❻❺❹❸❷❶⓿ condnn ssoluzione sogli di decisione di un giudizio grntist Condizione rele ignot Innocente Colpevole α piccolo β grnde risultto delle indgini = grvità degli indizi ❿❾❽❼❻❺❹❸❷❶⓿ condnn ssoluzione sogli di decisione di un giudizio sommrio Condizione rele ignot Innocente Colpevole α grnde β piccolo Or occorre considerre nche che i metodi per dimostrre l colpevolezz sono diversi di metodi per dimostrre l innocenz. Ad es., un impront dimostr l colpevolezz, un lii dimostr l innocenz, ecc. ecc. Quindi, essendo diversi i metodi sono nche diversi gli errori α e β. Potremmo prdosslmente vere si α che β grndi (se simo un po tonti e sceglimo dei metodi sgliti) oppure si α che β piccoli (se invece simo rvi). Ecco perché α e β, cioè specificità e sensiilità, sono stnz indipendenti. In effetti quell line verticle che sepr le due colonne dell tell dovree essere un line di spessore vriile, che lsci liertà di vere α e β più o meno mpi. E quindi ene utilizzre i migliori metodi che riducono si l'errore di 1 tipo (α) che quello di 2 tipo (β). Per questo il giudice deve essere estremmente scrupoloso, ttento e pziente nel vlutre tutti gli elementi del processo. Tuttvi, l termine del dittimento, possono restre dei dui. Occorre quindi decidere qule tipo di errore si più grve e qule livello di rischio si vogli ccettre: più

Diz - Appunti di Sttistic - AA 2001/2002 - edizione 29/11/01 Cp. 2 - Pg. 5 grnzi per l'innocente può significre più rischio che un colpevole si ssolto, e vicevers. Questo è il difficile mestiere del giudice. Tutto è più semplice qundo è queste vlutzioni sono frontte in form quntittiv col supporto dell sttistic. Anlizzimo quindi i possiili risultti di un esperimento di lortorio. Risultto dell'esperimento Positivo Negtivo Condizione rele ignot Trttmento non efficce Trttmento efficce flso-positivo fls scopert o errore di 1 tipo vero-positivo ver scopert vero-negtivo nessun novità flso-negtivo scopert mnct o errore di 2 tipo L post in gioco è il riconoscimento di un scopert (ed eventuli finnzimenti, nnunci congressi, onori, ecc. ecc.). Domnd: qundo può si può riconoscere un scopert? Rispost: il risultto positivo di un esperimento può essere ccettto qundo l proilità che si positivo per cso (fsullo o flso-positivo, vlutto d α) è minore del 5%. Se α è ugule o mggiore del 5% è opportuno rinuncire l riconoscimento dell scopert. Se poi il ricerctore crede nell su ipotesi, potrà ffinre le tecniche e migliorre l esperimento in modo d giungere d un conclusione più mtur. Un scopert fsull non compromette solo l crediilità del ricerctore, m comport un serie di grvi conseguenze in termini di perdit di slute (es., nuovi frmci che non curno), dnri (investimenti per produrre i frmci fsulli, poi riconosciuti e nditi dl commercio) e perdit di tempo (il lvoro di ltri ricerctori ingnnti dlle informzioni sglite). Al proposito è interessnte citre il cso di un trsmissione televisiv in cui si discutev sull ntur umn o lien di un cdvere mostrto steso su un letto in un vecchio filmto. Il cdvere mostrv crtteristiche ntomiche tipiche m comunque riferiili certe ptologie genetiche. Nessun ltro dto - iochimico, microscopico, ecc. - er disponiile oltre le immgini. Senz entrre nel merito del modo in cui l trsmissione er condott, l situzione propost in TV può essere ffrontt con l logic di un test. Due sono le ipotesi: Ipotesi null: essere umno. Poché sppimo come è ftto un essere umno, possimo esttmente vlutre l proilità che qulcos si un essere umno = possimo vlutre l proilità dell'ipotesi null.

Diz - Appunti di Sttistic - AA 2001/2002 - edizione 29/11/01 Cp. 2 - Pg. 6 Ipotesi lterntiv: essere lieno non-umno. M poiché non conoscimo fftto gli esseri lieni (non imo il modello del mrzino, del venusino, ecc.) non possimo vlutre direttmente l proilità che qulcos si un essere lieno = non possimo vlutre direttmente le proilità fvore dell'ipotesi lterntiv. Or, stndo qundo visto e qunto ffermto d ptologi e genetisti, esistev qulche duio sull cus delle nomlie presenti nel cdvere, m non sul ftto che si trttsse di un uomo. Se vessero invitto un esperto di sttistic (o semplicemente uno studente iscritto l 2 nno di Medicin) l questione si sree risolt dicendo che non è lecito rifiutre l ipotesi null e quindi credere l mrzino sinché l'ipotesi null gode ncor di un proilità superiore o ugule l 5%. Nel cso specifico l proilità fvore dell'uomo er en più lt, potrei dire oltre il 95%. Per cui c è d suggerire gli ufologi di studire un po di sttistic prim che vengno i mrzini insegnrl loro. Proilità che si trtti di un uomo (immginndo di conoscere tutte le nomlie degli esseri umni, pur senz sper null degli lieni): 100% 95% 90% 80% 70% 10% 8% <5% Conclusione: uomo uomo uomo uomo uomo uomo uomo lieno Nel cso del ricerctore è stnz semplice osservre i fenomeni ttrverso mezzi e strumenti che forniscono misure quntittive oggettive. Questo consente l nlisi dell distriuzione dei dti, dei prmetri sttistici e l vlutzione dei flsi positivi e dei flsi negtivi. Lo schem del test sttistico è molto simile quello sinor considerto. Anche in sttistic conoscimo l distriuzione dei dti previst dell'ipotesi null, mentre ignorimo in prte o in tutto quell previst dll'ipotesi lterntiv. Per il ricerctore medico o iologo, L'ipotesi null è l'ipotesi dello scettico, quell che neg il risultto, ttriuendo le differenze osservte ll nturle vriilità dei fenomeni o l cpriccio del cmpionmento. L'ipotesi null mntiene le ttuli conoscenze negndo l novità, l scopert, il dto. L'ipotesi lterntiv sostiene invece che le differenze esistono e non sono ttriuiili ll nturle vriilità o l cso. L'ipotesi lterntiv sostiene l novità.

Diz - Appunti di Sttistic - AA 2001/2002 - edizione 29/11/01 Cp. 2 - Pg. 7 Risultto del test sttistico se < 5% H0 rifiutt Dto significtivo se >= 5% H0 ccettt Dto non significtivo Condizione rele ignot H0 H1 flso-positivo errore I tipo vlutto con α vero-positivo nessun errore vero-negtivo nessun errore flso-negtivo errore II tipo vlutto con β Occorre mntenere l'ipotesi null fino che le prove o i dti in nostro possesso non sino tli d costringerci rifiutrl (come ogni soggetto è ritenuto innocente sino che non si dimostri il contrrio). Concedimo quindi fiduci ll'ipotesi null, rifiutndol solo qundo l'evidenz dei risultti si mcroscopic, cioè qundo l proilità di flsi-positivi α si minore del 5%. Qundo α<0.05 il risultto del test è detto sttisticmente significtivo e si rifiut l'ipotesi null. Meglio ncor se α <0.01, o α<0.001 ecc. In tl cso l proilità di sglirci nel riconoscere l scopert è inferiore 1 cso su 100, o 1 cso su 1000, ecc. Si prl di risultto ltmente significtivo. I test sono sempre condotti sull'ipotesi null perché voglimo privilegire l evidenz dei flsi-positivi rispetto i flsi-negtivi. Nessun vlore β (proilità di flsi negtivi) per qunto lto, consente di rifiutre l'ipotesi null qundo α si mggiore o ugule 0.05. Tuttvi qundo si consider qulcos in dirett relzione con l slute dell uomo occorre prendere soprttutto considerzione il rischio di flsi-negtivi e soglie diverse dl 5%. Considerimo d esempio il moro dell cosiddett mucc pzz: non vi sono ncor dti sttisticmente significtivi circ il ftto che il moro dell mucc poss contgire l uomo (quindi, potremmo dire che α >5%). Tuttvi, ci può essere un certo rischio che il dto negtivo si flso (es., β>50%). Pertnto occorre rgionre su due inri: quello scientifico che per or non h dimostrto l contgiosità del moro e quello snitrio che, in ttes di dti scientifici più rousti, non consente di correre rischi.

Diz - Appunti di Sttistic - AA 2001/2002 - edizione 29/11/01 Cp. 2 - Pg. 8 Rissumendo: All se di ogni test vi sono due ipotesi lterntive: H0 e H1. Il test verte sull proilità di H0 (). Per decidere se rifiutre o ccettre H0 occorre quindi vlutre. A questo punto......ogni test clcol l su specific sttistic, es. t, r, F, q, z, t, c 2, ecc. Il vlore dell sttistic clcolt, confrontto con l su distriuzione (vedi: tell e vlori critici) consente di ottenere.

Diz - Appunti di Sttistic - AA 2001/2002 - edizione 29/11/01 Cp. 2 - Pg. 9 L sttistic t di Student In precedenz imo imprto stimre l vriilità dei dti medinte il prmetro dell devizione stndrd stimre l vrizione di un singolo dto rispetto ll medi medinte l stndrdizzzione: z = x - m s Prllelmente, livello di medie, or doimo stimre l vriilità delle medie di vri cmpioni rispetto ll medi ver dell popolzione medinte il prmetro dell devizione stndrd delle medie stimre l vrizione dell medi di un singolo cmpione rispetto ll medi ver dell popolzione medinte l stndrdizzzione: t = medi del cmpione medi ver dell popolzione devizione stndrd dell medi (del cmpione) Vriilità delle medie ed errore stndrd Se si vesse l possiilità di estrrre un certo numero di cmpioni d un stess popolzione, si troveree che ogni cmpione h un medi divers: Queste medie, nche se diverse e ottenute d cmpioni di differente numerosità, sono tutte stime dell stess medi dell popolzione. Esiste pertnto un vriilità dell medi del cmpione (d'or in poi dett medi cmpionri) ttorno ll ver medi dell popolzione che è per lo più sconosciut. Tle vriilità è stimile come devizione stndrd dell medi o errore stndrd, scritto col simolo s m (devizione stndrd dell medi) o con le lettere ES (errore stndrd) o SE (stndrd error) o SEM (stndrd error of the men). Bisogn ssolutmente specificre devizione stndrd dell medi per non confondersi con l devizione stndrd delle osservzioni. D questo punto di vist il termine di errore stndrd è meno miguo, nche se meno pproprito. Disponendo di diversi cmpioni potremmo clcolre le rispettive medie e quindi stimre l loro devizione stndrd, esttmente come potremmo clcolre l devizione stndrd di un cmpione di dti. In prtic invece disponimo qusi sempre di un solo cmpione, spesso nche piccolo, per cui sree impossiile clcolre l devizione stndrd dell medi in se ll vriilità di differenti medie. L medi clcolt è nche l'unic di cui disponimo. A questo punto ci

Diz - Appunti di Sttistic - AA 2001/2002 - edizione 29/11/01 Cp. 2 - Pg. 10 vengono in soccorso i mtemtici con un formul in grdo di stimre l devizione stndrd dell medi s m in se i dti di un solo cmpione: s m = s n Dll formul si ricv che l devizione stndrd dell medi vri col vrire dell grndezz del cmpione (n). Questo si comprende ene considerndo il ftto che un medi ottenut d 1,000,000 dti è senz'ltro più ffidile di un ottenut d 100 dti. In termini sttistici, dicimo che l devizione stndrd di un medi ottenut d un cmpione di 1,000,000 è molto più piccol dell devizione stndrd di un medi ottenut d un cmpione di soli 10 dti. A questo punto, distinguimo ene tr l devizione stndrd delle osservzioni del cmpione (s), che è un crtteristic dell popolzione, invrinte rispetto ll numerosità o grndezz del cmpione (n), e l devizione stndrd dell medi (s m ), che è un crtteristic del cmpione che dipende dll numerosità del cmpione (n). Per questo, qundo vlutimo un medi doimo sempre tener conto dell dispersione dell popolzione e dell grndezz del cmpione d cui imo trtto l medi. Quindi, second dell numerosità del cmpione (es., n=10, 20, 30, 100) l medi h un divers vriilità come indicto nel grfico:

Diz - Appunti di Sttistic - AA 2001/2002 - edizione 29/11/01 Cp. 2 - Pg. 11 Il test t di Student Il test sttistico che sggi l differenz tr due medie è il test t di Student. Le ipotesi ll se del test sono due: l'ipotesi null, che sostiene che le due medie provengno d cmpioni estrtti dll stess popolzione e quindi l loro differenz si ttriuiile cuse ccidentli inerenti l cmpionmento e/o lle misurzioni. l'ipotesi lterntiv, che sostiene che le due medie sino diverse in qunto rppresentno cmpioni provenienti d popolzioni diverse (nturli o sperimentli). Come si vlut l proilità di flsi-positivi? Occorre innnzi tutto un prmetro in grdo di vlutre l vrizione dell medi. Il ftto che s m, l devizione stndrd dell medi, vri in funzione di n, f sì che nche t dipend d n. Nei cmpioni numerosi (n>=100) t è distriuito in modo qusi normle ed h quindi gli stessi vlori critici di z (±1.96 di sciss includono il 95% dell're). Nei cmpioni più piccoli i vlori di t che includono l stess re sono più grndi proprio perché l distriuzione è più dispers. L tell riport i vlori critici di t per i diversi grdi di liertà. I grdi di liertà di t corrispondono i grdi di liertà del denomintore s m. Nel nostro cso il denomintore h n-1 grdi di liertà. Osservndo l tell, con 100 grdi di liertà imo meno di 5 proilità su 100 (p<0.05) di ottenere un medi cmpionri tnto divers dll medi dell popolzione d produrre un t superiore 1.96. In ltre prole, un t superiore 1.96 cpit per cso meno di 5 volte su cento. Le proilità scendono ll'1% (0.01) per un t superiore 2.58.

Diz - Appunti di Sttistic - AA 2001/2002 - edizione 29/11/01 Cp. 2 - Pg. 12 grdi di liertà zon dell non-significtività α (rischio di flsi positivi) sogli critic zon dell significtività.20.10.05.02.01.001 1 3.078 6.314 12.706 31.821 63.657 636.619 2 1.886 2.920 4.303 6.965 9.925 31.598 3 1.638 2.353 3.182 4.541 5.841 12.941 4 1.533 2.132 2.776 3.747 4.604 8.610 5 1.476 2.015 2.571 3.365 4.032 6.819 6 1.440 1.943 2.447 3.143 3.707 5.959 7 1.415 1.895 2.365 2.998 3.499 5.405 8 1.397 1.860 2.306 2.896 3.355 5.041 9 1.383 1.833 2.262 2.821 3.250 4.781 10 1.372 1.812 2.228 2.764 3.169 4.587 11 1.363 1.796 2.201 2.718 3.106 4.437 12 1.356 1.782 2.179 2.681 3.055 4.318 13 1.350 1.771 2.160 2.650 3.012 4.221 14 1.345 1.761 2.145 2.624 2.977 4.140 15 1.341 1.753 2.131 2.602 2.947 4.073 16 1.337 1.746 2.120 2.583 2.921 4.015 17 1.333 1.740 2.110 2.567 2.898 3.965 18 1.330 1.734 2.101 2.552 2.878 3.922 19 1.328 1.729 2.093 2.539 2.861 3.883 20 1.325 1.725 2.086 2.528 2.845 3.850 21 1.323 1.721 2.080 2.518 2.831 3.819 22 1.321 1.717 2.074 2.508 2.819 3.792 23 1.319 1.714 2.069 2.500 2.807 3.767 24 1.318 1.711 2.064 2.492 2.797 3.745 25 1.316 1.708 2.060 2.485 2.787 3.725 26 1.315 1.706 2.056 2.479 2.779 3.707 27 1.314 1.703 2.052 2.473 2.771 3.690 28 1.313 1.701 2.048 2.467 2.763 3.674 29 1.311 1.699 2.045 2.462 2.756 3.659 30 1.310 1.697 2.042 2.457 2.750 3.646 40 1.303 1.684 2.021 2.423 2.704 3.551 60 1.296 1.671 2.000 2.390 2.660 3.460 120 1.289 1.658 1.980 2.358 2.617 3.373 1.282 1.645 1.960 2.326 2.576 3.291 Notre che l'ultim rig dell tell h gli stessi vlori dell distriuzione normle. Questo vuol dire che per infiniti grdi di liertà l distriuzione t è identic ll distriuzione normle z. Nell prtic t si consider normlmente distriuito qundo i grdi di liertà sono >=100.

Diz - Appunti di Sttistic - AA 2001/2002 - edizione 29/11/01 Cp. 2 - Pg. 13 Ogniqulvolt si vlut t isogneree indicrlo come t p,gdl dove p st per il livello di proilità scelto (in genere 0.05 o 0.01) e gdl st per i grdi di liertà. Noi continueremo scrivere comunque semplicemente t =... intendendo però il vlore di t che corrisponde d un certo livello di proilità con determinti grdi di liertà. Il ftto di vere un tell d intervlli (se t super... llor p<...) nziché il vlore estto di p per ogni vlore di t clcolto dipende dl ftto che imo tr le mni un foglio e non un computer. E' impossiile fr stre in un tell i vlori di p per tutti i vlori di t per tutti i grdi di liertà. Il computer è invece in grdo di clcolre il vlore estto di p per ogni vlore di t clcolto. Comunque l perdit di informzione derivnte dll'uso dell tell è minim.

Diz - Appunti di Sttistic - AA 2001/2002 - edizione 29/11/01 Cp. 2 - Pg. 14 I cso: medie di due cmpioni indipendenti Si dicono cmpioni indipendenti (o non ppiti) quelli formti d individui diversi. Sono invece detti ppiti i cmpioni costituiti dgli stessi individui vlutti o osservti in tempi diversi (prim e dopo un cert prov) o in condizioni diverse (con o senz un certo trttmento). Il disegno sperimentle che utilizz cmpioni ppiti è senz'ltro più efficce di quello sto su cmpioni non ppiti o indipendenti. Tuttvi non sempre è possiile pplicrlo, si per prolemi prtici, di fttiilità, si per prolemi etici connessi con l sperimentzione clinic su pzienti. Il test t per cmpioni indipendenti o non ppiti è dto dl rpporto: differenz tr due medie t = = errore stndrd delle differenze tr le medie m s m m m = m m S + S n n n + n 2 + n n L'espressione l numertore non è tnto l differenz tr le due medie qunto l medi delle differenze tr i dti dei due gruppi, presi 2 2 (nche se le due espressioni dnno risultti equivlenti). Allo stesso modo, l espressione l denomintore non è tnto un pool dei due errori stndrd, m piuttosto l'errore stndrd di quest medi delle differenze tr i dti dei due gruppi. L formul sfrutt l proprietà che l vrinz delle (di tutte le possiili) differenze tr i dti di due popolzioni corrisponde ll somm delle due rispettive vrinze: 2 2 2 s = s + s Poiché nel nostro csi ci si riferisce distriuzioni di medie: 2 2 2 s s + s m m = m m d cui: s s + s m m 2 m m 2 = Dentro l rdice possimo sostituire i due termini ponendo vrinz dell medi = qudrto dell devizione stndrd dell medi = qudrto dell (devizione stndrd del cmpione diviso rdice di n), cioé: s s = ( sm) = = n 2 2 m 2 2 Il denomintore dell formul del t pertnto divent: s n 2 2 s s sm m sm s = + m = + n n 2 2...e così v ene. E' meglio però osservre che secondo l'ipotesi null H0 i due cmpioni provengono dll 2 2 stess popolzione, per cui s e s sreero sono stime dell stess vrinz dei dti dell medesim popolzione. Pertnto, è meglio sostituire ciscun delle due devizioni stndrd con un unic stim comint: somm devinze S S scom 2 + = = somm grdi di liertà n + n 2 Quindi, sostituendo e semplificndo, il denomintore dell formul del t divent finlmente:

Diz - Appunti di Sttistic - AA 2001/2002 - edizione 29/11/01 Cp. 2 - Pg. 15 2 2 s s sc sc sm m sm s = + m = + = + = n n n n n ( ) 2 2 2 2 2 om om sc om n + n n = S + S n n n + n + 2 n n L formul si semplific molto se i cmpioni sono ilnciti (qundo n = n ). Quell espost è preferiile perché generlizzt. Le ipotesi del test t per cmpioni indipendenti sono: H0: differenz tr le due medie = 0 H1: differenz tr le due medie 0 Si entr in tell con n + n 2 grdi di liertà. Poiché imo deciso di rifiutre l'ipotesi null che sostiene che le due medie provengno dll stess popolzione e d ccogliere l'ipotesi lterntiv solo qundo il rischio di flso-positivo è minore del 5%, riterremo l differenz non significtiv se il vlore di t non srà superiore quello tulto per α=0.05 (detto sogli critic di significtività). Solo qundo il vlore di t supererà tle vlore l differenz srà ritenut significtiv. A questo punto l proilità di sglirci, nell'ccettre l'ipotesi lterntiv, è minore del 5%.

Diz - Appunti di Sttistic - AA 2001/2002 - edizione 29/11/01 Cp. 2 - Pg. 16 test t per cmpioni non-ppiti (nche non ilnciti) H0: differenz tr medie=0 frequenz del ttito crdico in gruppi di nimli diversi (dti di pur fntsi) topi inchi topi neri 56 79 75 73 65 85 60 82 76 73 78 - n=6 n=5 m=68.33 m=78.40 S=429.33 S=115.20 t=2.138 gdl=9 p=0.061 (non significtivo) t = m topi neri m topi inchi S topi neri + S topi inchi n topi neri n n + n 2 + n n topi neri topi inchi topi neri topi inchi topi inchi = 68.33 78.4 429.33+ 115.2 6 + 5 6 + 5 2 6 5 = - 10.07 60.50 0.3666 = - 2.138 Il vlore di p=0.061 è stto fornito dl clcoltore. In mncnz di clcoltore, si confront il t clcolto (vlore ssoluto) con quello tulto per il livello minimo di significtività del 95% (α=0.05) con 9 grdi di liertà, che è pri 2.262. Poiché il t clcolto non super il t tulto si conclude che i vlori di frequenz di ttito crdico nei topi inchi e neri provengono dll stess popolzione e che l differenz riscontrt è ttriuiile lle normli fluttuzioni dei cmpioni.

Diz - Appunti di Sttistic - AA 2001/2002 - edizione 29/11/01 Cp. 2 - Pg. 17 II cso: medie di due cmpioni ppiti Il test t per cmpioni ppiti è dto dl rpporto: t differenz medi = errore stndrd dell differenz medi L'errore stndrd delle differenze si clcol come itulmente. Le ipotesi del test t per cmpioni ppiti sono: H0: differenz medi = 0 H1: differenz medi 0 Si entr in tell con n-1 grdi di liertà, ove n è il numero di coppie di dti. test t per cmpioni ppiti (necessrimente ilnciti) H0: differenz medi=0 frequenz del ttito crdico negli stessi tleti (dti di pur fntsi) prim di un cors dopo un cors differenze 66 69-3 70 77-7 65 95-30 76 89-13 70 78-8 65 74-9 n=6 coppie di dti m=-11.67 s m =3.896 t=-2.995 gdl=5 p=0.03 (significtivo) medi delle differenze t = errorestndrd delle differenze = 11.67 3.896 = 2.995 Il vlore di p=0.03 è stto fornito dl clcoltore. In mncnz di clcoltore, si confront il t clcolto con quello tulto per il livello minimo di significtività del 95% (α=0.05) con 5 grdi di liertà, che è pri 2.571. Poiché il t clcolto super il t tulto si conclude che l cors h modificto l distriuzione dei vlori di frequenz di ttito crdico, determinndone un significtivo incremento.

Diz - Appunti di Sttistic - AA 2001/2002 - edizione 29/11/01 Cp. 2 - Pg. 18 Esercizi Test t per cmpioni non-ppiti gruppo A gruppo B x A (x A -medi A ) 2 x B (x B -medi B ) 2 n A = S A = n B = S B = m A = m B = GDL = n A + n B - 2 = t = differenz trdue medie errorestndrd delle differenze trle medie = m S + S n + n - - m 2 n n + n n t = + + - 2 - + = t = H0: differenz tr le medie = 0 p = (vedi tell) risultto signifivtivo?

Diz - Appunti di Sttistic - AA 2001/2002 - edizione 29/11/01 Cp. 2 - Pg. 19 Test t per cmpioni ppiti con / prim senz / dopo differenze (d) (d medi d ) 2 n (coppie di dti) = m d = S d = s d 2 = s d = s md = t = medi delle differenze errorestndrd delle differenze = = t = H0: differenz medi = 0 p = (vedi tell) risultto signifivtivo?

Diz - Appunti di Sttistic - AA 2001/2002 - edizione 29/11/01 Cp. 2 - Pg. 20 Ultime considerzioni Nel test t l'ordine delle medie (-, -) è irrilevnte in qunto l distriuzione t è simmetric. Pertnto si prescinde dl segno. Nell tell del t sono riportti solo i vlori ssoluti. Poiché il test t vlut differenze tr medie, è pplicile solo condizione che i dti sino distriuiti normlmente ed ino vrinze uguli. Tuttvi si dice nche che il test t è rousto, è cioè in grdo di reggere nche in cso di piccole irregolrità rispetto queste norme. Lo schem seguente esemplific diverse situzioni: medie diverse, vrinze uguli: test t pplicile medie uguli, vrinze diverse: test t superfluo (t=0) test per l'omogeneità delle vrinze medie diverse, vrinze diverse: test t non pplicile (v. ltri test, es. Welch) test per l'omogeneità delle vrinze Se......le vrinze sono diverse m le distriuzioni sono comunque normli (condizione dett di eteroschedsticità) si deve pplicre un test t modificto che pss sotto il nome di test di Welch (o test t per vrinze diseguli)...le distriuzioni non sono normli si deve sempre pplicre un test nonprmetrico, es. il test di Wilcoxon (vedi cp. 8). L dozione del corretto tipo di test è fondmentle. Anche Excel (Microsoft) comprende tr le sue ppliczioni., oltre il test t di Student, il test di Welch ed il test di Wilcoxon. Controllte. Un'ultim vvertenz. Se nell'mito dello stesso studio si effettuno diversi test t tr diverse medie, il rischio glole di flsi positivi ument. Per cui il test t non è dtto qundo si pinific un esperimento con molti gruppi o trttmenti d confrontre tr loro. Per questo tipo di nlisi esistono deguti test che mntengono per tutti i confronti pinificti un vlore glole di α<0.05. L rgomento srà trttto nel prossimo cpitolo.

Diz - Appunti di Sttistic - AA 2001/2002 - edizione 29/11/01 Cp. 2 - Pg. 21 Limiti fiducili dell medi Avendo clcolto l medi di un cmpione di n osservzioni, ci interess spere qunto quest medi può differire dll medi non not dell popolzione, per un certo livello di proilità scelto d noi. Per fr questo cerchimo nell tell delle distriuzioni t l rig per gli n-1 grdi di liertà e l colonn per il livello di proilità p. In corrispondenz di n-1 e p leggeremo un vlore di t, che possimo indicre con t p,n-1. A questo punto possimo dire che, d un certo livello di proilità p, l medi dell popolzione è compres nell'intervllo medi cmpionri ± t s m. Questo è nche detto intervllo fiducile o intervllo di confidenz. Attenzione: il livello di proilità si riferisce ll proilità di str fuori di limiti fiducili (l proilità di trovre un vlore di t ugule o mggiore...). Ad es. il livello di proilità 0.05 (5%) consente di clcolre i limiti fiducili entro i quli si troverà l medi ver nel 95% dei csi, mentre nel 5% dei csi ess srà fuori dell'intervllo. p in ltre prole è il rischio che si vuole correre. In definitiv i limiti fiducili (LF) sono quindi: LF = m ± t s m Esempio, vendo un medi m=40, con s m =5 e n=21, scelto il livello di proilità di 0.05, si trov in tell il corrispondente vlore di t=2.09. Quindi i limiti fiducili dell medi srnno: 50.45 LF = 40 ± 2.09 5 = 29.55 Con un proilità di sglire 5 volte su 100, diremo che l medi ver è compres tr 29.55 e 50.45. Grndezz del cmpione (metodo prmetrico) L numerosità del cmpione è spesso nche dett grndezz del cmpione (per dire numerosità, in inglese si us il termine size che in itlino si trduce con grndezz ). Qunti dti occorre prendere per ottenere un uon medi, cioè un medi rppresenttiv? Spesso il prolem deriv dl ftto di vere troppi o troppo pochi dti d processre. Nel primo cso, perderemmo un scco di tempo vlutrli tutti; nel secondo cso, un scco di soldi per viggire o per fre costosi esperimenti supplementri. Il prolem può essere degutmente ffrontto medinte l distriuzione t. Se inftti si prte dl presupposto di voler ottenere un medi i cui limiti fiducili sino contenuti entro d es. il 5% del vlore stesso dell medi, possimo trovre un'eguglinz tr l'espressione generle: LF = m ± t s m e l nostr opzione che i LF sino pri l 5% dell medi (sopr e sotto): LF = m ± 0.05 medi Dlle due espressioni si evidenzi che

Diz - Appunti di Sttistic - AA 2001/2002 - edizione 29/11/01 Cp. 2 - Pg. 22 t s = 0.05 m m M poiché sppimo che: s s m = n possimo scrivere: s t = 0.05 m n D cui ottenimo finlmente: 2 2 t s n = 2 2 0.05 m Ovvimente, tle procedimento implic l'esecuzione di uno studio pilot per stimre in prim pprossimzione l medi e l devizione stndrd. Grndezz del cmpione (metodo grfico) Un metodo lterntivo è quello di fre uno studio pilot, controllndo il comportmento dell medi l crescere del numero di dti. L medi è di volt in volt riclcolt (si dice ppunto medi fluttunte o medi ggiornt o medi moile) dopo 2, 3, 4, 5... ecc. osservzioni. Succede che l medi clcolt per poche osservzioni vri ruscmente. Poi si stilizz per un semplice ftto di inerzi. A questo punto doimo stilire qule è l numerosità che consente di ottenere un medi ffidile. Per questo considerimo il primo punto del grfico oltre il qule le oscillzioni sono ppen un decimo (o un ventesimo, o ncor meno) dell'inter nd di oscillzione registrt ll'inizio del trccito. Oppure considerimo il primo punto del grfico oltre il qule le oscillzioni non superno del 10% o del 5% l medi stilizzt con l mssim numerosità (i due criteri si equivlgono). Rintrccito questo punto, trovimo in sciss il vlore di n che utilizzeremo nelle successive ppliczioni.

Diz - Appunti di Sttistic - AA 2001/2002 - edizione 29/11/01 Cp. 2 - Pg. 23 Esercizio Costruire il grfico dell medi ggiornt dell seguente serie di dti: 4, 15, 6, 3, 7, 8, 2, 5, 8, 16, 3, 7, 6, 4, 9, 12, 5, 6, 8, 10, 9, 3, 12, 8, 9, 6, 10 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 Un volt definit l medi stile utilizzndo tutti i dti, trccire l nd di confidenz del 10% sopr e sotto l medi stile vlutre qule è il numero minimo di dti l cui medi non esc dll nd di confidenz trccit