I TEST NON-PARAMETRICI PIU CITATI NELLE DISCIPLINE SCIENTIFICHE



Documenti analoghi
Relazioni tra variabili

INDICE PREFAZIONE VII

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al primo anno.

UNIVERSITÀ DEGLI STUDI DI MILANO-BICOCCA A. A FACOLTÀ DI ECONOMIA. Programma del modulo di STATISTICA I (6 crediti)

Indice Prefazione xiii 1 Probabilità

Correzione dell Esame di Statistica Descrittiva (Mod. B) 1 Appello - 28 Marzo 2007 Facoltà di Astronomia

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al secondo anno, primo semestre.

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)

1. Distribuzioni campionarie

LA CORRELAZIONE LINEARE

LEZIONI DI STATISTICA

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it

Elementi di Psicometria

Capitolo 12 La regressione lineare semplice

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici

PIANO DI LAVORO ANNUALE

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

3. Piano di lavoro: - applicazione di alcune semplici procedure, con il confronto tra le diverse soluzioni possibili nell ambito del programma SPSS

ANALISI DELLE FREQUENZE: IL TEST CHI 2

Strumenti informatici 13.1

Prova di autovalutazione Prof. Roberta Siciliano

Il confronto fra proporzioni

Corso di. Dott.ssa Donatella Cocca

CORSO DI STATISTICA ED ELEMENTI DI INFORMATICA

Introduzione alle relazioni multivariate. Introduzione alle relazioni multivariate

Capitolo 2 Distribuzioni di frequenza

Statistica inferenziale

FONDAMENTI DI PSICOMETRIA - 8 CFU

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.

Metodi Statistici di Controllo della Qualità Prof. Paolo Cozzucoli

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca

Automazione Industriale (scheduling+mms) scheduling+mms.

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Programmazione Disciplinare: Calcolo Classe: Quarte - Quinte

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria. Statistica descrittiva

Relazioni statistiche: regressione e correlazione

Statistica descrittiva

I Metodi statistici utili nel miglioramento della qualità 27

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr.

quarto ciclo di incontri per conoscere le professioni

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

Sommario. Capitolo 1 Impiego della statistica per la gestione dell azienda 1. Capitolo 2 Disponibilità e produzione delle informazioni statistiche 19

Slide Cerbara parte1 5. Le distribuzioni teoriche

In una tabella 2 x 2 il valore del chiquadrato, che quantifica la differenza fra i numero osservati e quelli attesi, è la somma delle quattro celle

Amministrazione, finanza e marketing - Turismo Ministero dell Istruzione, dell Università e della Ricerca PROGRAMMAZIONE DISCIPLINARE PER U. di A.

PROGRAMMA DELL EVENTO FORMATIVO

STATISTICA IX lezione

Esame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

STATISTICA e STATISTICO

Università degli Studi di Catania A.A Corso di laurea in Ingegneria Industriale

Regressione Logistica: un Modello per Variabili Risposta Categoriali

Metodologia epidemiologica

IL TEST DI ACCESSO AI CORSI DI STUDIO TRIENNALI DI PSICOLOGIA

Statistica. Lezione 6

ESAME DI STATISTICA Nome: Cognome: Matricola:

Corso di Automazione Industriale 1. Capitolo 4

1 Associazione tra variabili quantitative COVARIANZA E CORRELAZIONE

Temi di Esame a.a Statistica - CLEF

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

LEZIONE n. 5 (a cura di Antonio Di Marco)

Prefazione all edizione originale. Prefazione all edizione italiana

Docente: Anna Valeria Germinario. Università di Bari. A.V.Germinario (Università di Bari) Analisi Matematica ITPS 1 / 22

Opportunità e rischi derivanti dall'impiego massivo dell'informatica in statistica. Francesco Maria Sanna Roma, 3 maggio 2012

OSSERVAZIONI TEORICHE Lezione n. 4

E naturale chiedersi alcune cose sulla media campionaria x n

Il coefficiente di correlazione di Spearman per ranghi

Elementi di Psicometria con Laboratorio di SPSS 1

Prelazione. Lista delle Figure. Lista delle Tabelle

Lezione 1. Concetti Fondamentali

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

Tiziano Vargiolu. Elementi di Probabilità e Statistica

Indice generale. Prefazione...xi. Introduzione...1. Capitolo 1 Tabelle e prospetti...25

La distribuzione Gaussiana

Programmazione Matematica classe V A. Finalità

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

Regressione Mario Guarracino Data Mining a.a. 2010/2011

Inferenza statistica I Alcuni esercizi. Stefano Tonellato

Natura dei dati e della statistica

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

Alternanza Scuola-Lavoro Riferimenti per la compilazione delle schede di monitoraggio quantitativo

Capitolo 4 Probabilità

Corso di Politica Economica

Inferenza statistica. Statistica medica 1

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

Che cosa e come valutano le prove di matematica e con quali risultati. nell A.S

Facciamo qualche precisazione

Capitolo 11 Test chi-quadro

METODOLOGIA STATISTICA E CLASSIFICAZIONE DEI DATI

Statistica Medica. Verranno presi in esame:

MATEMATICA e SCIENZE

I libri di testo. Carlo Tarsitani

Test statistici non-parametrici

Transcript:

I TEST NON-PARAMETRICI PIU CITATI NELLE DISCIPLINE SCIENTIFICHE (Edizione 2008) Email: lamberto.soliani@unipr.it Tel.0521/905662 Fax 0521/905402 Lamberto Soliani DIPARTIMENTO DI SCIENZE AMBIENTALI UNIVERSITA DEGLI STUDI DI PARMA Il libro può essere ordinato al costo di Euro 55 rivolgendosi al dottor Pietro Lia - UNI.NOVA di Pietro Lia Via Fleming,7-431000 Parma - tel.: 0521-290245 cell. 335-8385704 - e-mail: libreria@gruppopegaso.it Le dispense (830 pagine in 10 capitoli) riportano i test non- parametrici di uso più comune nelle discipline scientifiche. Comprendono tutti quelli che sono inseriti nella maggior parte dei programmi informatici. La diffusione dell informatica permette di raccogliere con facilità molti dati. Per analizzarli, i tecnici, i ricercatori e i responsabili di strutture impegnate nei problemi della ricerca e delle professioni scientifiche chiedono gli strumenti per una conoscenza operativa delle metodologie statistiche. Ma l università italiana raramente ha fornito le competenze richieste nei confronti internazionali. Per tutti coloro che ricorrono alla statistica applicata, hanno un importanza relativa le dimostrazioni matematiche, mentre è necessaria un illustrazione chiara e semplice dei concetti sui quali sono fondati i test. Quando si utilizzano i programmi informatici, si trovano numerose opzioni. Ma quasi mai i manuali riportano spiegazioni chiare per scegliere il test adeguato. Nella stesura di questo testo-manuale, le linee guida sono state la completezza e l operatività, da raggiungere sempre con un linguaggio e una simbologia semplici. Ideato e scritto per la formazione e l aggiornamento, questo manuale si è dimostrato utile sia per la formazione nelle lauree specialistiche e nei master delle Università sia per l aggiornamento nelle Aziende. Tuttavia per raggiungere una visione complessiva della disciplina, per la scelta ragionata dei metodi e l interpretazione corretta degli output dei programmi informatici, lo studio personale molto spesso non è sufficiente. E indispensabile seguire un corso impostato su queste finalità. La logica della statistica, anche per i test non parametrici, non è ovvia né banale. Lo stesso problema può essere affrontato con metodi differenti, che non sempre forniscono risultati uguali. Si tratta di capire i limiti e le potenzialità dei vari approcci. Un punto particolarmente difficile è il passaggio dall analisi statistica all interpretazione disciplinare e infine alla decisione. I

Lamberto Soliani Attualmente, professore ordinario di Fondamenti di analisi dei sistemi ecologici (gruppo BIO 7). Già prof. ordinario di Demografia Investigativa all Università di Bari e all Università La Sapienza di Roma. Docente di Statistica applicata e Biometria presso l Università di Parma nei corsi di laurea in Scienze Ambientali, Agraria, Scienze Biotecnologiche e Biologia Ecologica, Scienze Naturali, Chimica, sia nelle lauree triennali che in quelle specialistiche della Facoltà di Scienze Matematiche, Fisiche e Naturali. Responsabile della formazione in statistica applicata - in vari master (Scienze Forensi, Analisi chimiche per gli alimenti e l inquinamento, ecc. ), - in corsi di formazione - aggiornamento presso aziende ed associazioni professionali (quali APAT, CTN, ARPA regionali, Aziende Farmaceutiche Italiane, Aziende Alimentari nazionali e internazionali, Enti regionali di ricerca in Agricoltura). Per qualsiasi informazione è possibile contattare l'autore. Email: : lamberto.soliani@unipr.it Tel.0521/905662 Fax 0521/905402 Per l acquisto del testo, rivolgersi a - UNI.NOVA di Pietro Lia Via Fleming,7-431000 Parma - tel.: 0521-290245 cell. 335-8385704 INDICE CAPITOLO I - ANALISI DELLE FREQUENZE E DEI RAPPORTI: CHI QUADRATO E LOG DEL RAPPORTO DI VEROSIMIGLIANZA O TEST G 1.1. Confronti tra distribuzioni osservate e distribuzioni attese 1 1.2. Condizioni di validità del χ 2 e correzione di Yates 9 1.3. Le tabelle di contingenza 2 x 2 (fourfold tables) 13 1.4. Correzioni per la continuità in tabelle 2 x 2: Yates e Haber 22 1.5. Confronti tra frequenze relative con la distribuzione normale e sua correzione per la continuità 28 1.6. Confronto tra test χ 2 per tabelle 2 x 2 e test Z, senza e con le correzioni per la continuità 36 1.7. Confronto di una proporzione osservata con una attesa: il test Z per grandi campioni e la distribuzione binomiale per piccoli campioni 42 1.8. Tabelle di contingenza 2 x 2 in piccoli campioni: il metodo esatto di Fisher 47 1.9. Le tabelle 2 x N con la formula generale e quella di Brandt-Snedecor. Le tabelle M x N 52 1.10. Il log-likelihood ratio o metodo G 61 1.10.1 Confronto tra una distribuzione osservata ed una attesa con la correzione di Williams 64 1.10.2 Tabelle 2 x 2, con la correzione di Williams e quella di Mantel-Haenszel 68 II

1.10.3 Tabelle M x N con la correzione di Williams 71 1.11. Il chi quadro con il metodo di Cochran e di Mantel-Haenszel 75 1.12. Tabelle dei valori critici del chi quadrato 82 CAPITOLO II - RISCHI, PROPORZIONI E PERCENTUALI 2.1. Le misure del rischio, sensibilità, specificità, valore predittivo ed efficienza di un test 85 2.2. Perchè la varianza di p è pq; varianza e errore standard di una frequenza relativa o assoluta, in una popolazione infinita e in una popolazione finita 96 2.3. Intervallo di confidenza di una frequenza relativa o assoluta con la normale, in una popolazione infinita o finita 105 2.4. Metodi grafici per l intervallo fiduciale e per la stima del numero di dati. 111 2.5. Intervallo di confidenza di una proporzione, mediante la distribuzione F 118 2.6. Calcolo del campione minimo necessario, per la stima di una proporzione campionaria, con un errore massimo prefissato 124 2.7. Il confronto tra una proporzione campionaria e una proporzione attesa con il test z; dimensione minima del campione, con la distribuzione normale 129 2.8. La potenza di un test sulla proporzione per un campione, con la normale 135 2.9. Test per una proporzione: la binomiale per campioni piccoli e intervallo di confidenza con F per campioni grandi 142 2.10. La potenza di un test per una proporzione, con l uso della distribuzione binomiale 146 2.11. Significatività e intervallo di confidenza della differenza tra due proporzioni, con la distribuzione normale 149 2.12. Potenza a posteriori (1-β) e a priori (n) dei test sulla differenza tra due proporzioni; bilanciamento di due campioni 153 CAPITOLO III - METODI NON PARAMETRICI PER UN CAMPIONE 3.1. Le caratteristiche dei test non parametrici 169 3.2. Il test delle successioni (runs test) per un campione, con due categorie; distribuzioni centripete e distribuzioni centrifughe 173 3.3. Il test delle successioni (runs test) per un campione, con dati quantitativi: Runs Up and Down; Runs Above and Below the Median; eccezioni alla validità 186 3.4. Il test delle successioni (runs test) con più gruppi categoriali o qualitativi 193 3.5. Il test dei segni per un campione 198 3.6. Intervallo di confidenza della mediana con il test dei segni 206 3.7. Il test dei segni per ranghi di Wilcoxon 209 3.8. Differenze nulle e ties nel test T di Wilcoxon 221 3.9. Teoria del test T di Wilcoxon e della correzione per i ties 224 III

3.10. Intervalli di confidenza della locazione (mediana) con il T di Wilcoxon; medie di Walsh o quasimedians, stimatore di Hodges Lehmann o pseudomedian 229 3.11. Test di casualizzazione (raw scores test, Pitman test, Fisher s randomization test) 235 3.12. Test T di Wilcoxon per la simmetria 240 3.13. Il metodo di Kolmogorov-Smirnov per un campione, con dati ordinali discreti e con dati continui 247 CAPITOLO IV - METODI NON PARAMETRICI PER DUE CAMPIONI DIPENDENTI 4.1. Test per 2 campioni dipendenti o per dati appaiati 269 4.2. Il test di McNemar con la correzione di Edwards; la stima della potenza 271 4.3. Estensione del test di McNemar o test di Bowker 283 4.4. Intervallo di confidenza della differenza tra le proporzioni di due campioni dipendenti 289 4.5. Il test dei segni, con stima della potenza a priori 291 4.6. Il test T di Wilcoxon o test dei segni per ranghi, con stima della potenza 301 4.7. Intervallo di confidenza di una differenza con il test dei segni e il T di Wilcoxon o metodo delle Walsh averages 311 4.8. Test di casualizzazione per 2 campioni dipendenti o Fisher s randomization test 318 C A P I T O L O V - METODI NON PARAMETRICI PER DUE CAMPIONI INDIPENDENTI 5.1. I test per 2 campioni indipendenti 327 5.2. Il test della mediana o test di Mood o di Brown-Mood, per due campioni indipendenti 329 5.3. L intervallo di confidenza per la differenza tra due mediane, con il metodo esatto di Fisher 338 5.4. Il test di Wilcoxon-Mann-Whitney o della somma dei ranghi 343 5.5. Calcolo delle probabilità associate ai valori di T, potenza (1-β, n) e robustezza del test di Wilcoxon-Mann-Whitney 355 5.6. Il test U di Mann-Whitney o dell'ordine robusto dei ranghi 360 5.7. L intervallo di confidenza della differenza tra due mediane, con l indice U di Mann-Whitney 370 5.8. Il test S di Kendall e suoi rapporti con il test T e il test U; potenza-efficienza dei tre test e confronti tra i metodi 373 5.9. Il test di casualizzazione per due campioni indipendenti 383 5.10. Il test non parametrico di Levene con la modifica di Brown-Forythe, per l omoschedastictà di due campioni indipendenti 391 5.11. Test di Siegel-Tukey per l uguaglianza della variabilità; cenni sul test di Freund-Ansari-Bradley e sul test di Conover 393 5.12. Il test dei ranghi equivalenti di Moses per le differenze nella dispersione o variabilità 401 5.13. Confronto tra due distribuzioni campionarie: il metodo di Kolmogorov-Smirnov per 2 campioni indipendenti, con dati ordinali discreti o con gruppi e con dati continui 408 IV

5.14. Il test delle successioni per due campioni indipendenti o test di Wald-Wolfowitz 421 CAPITOLO VI - TEST NON PARAMETRICI PER PIU'CAMPIONI 6.1. I test non parametrici più diffusi, per k campioni 431 6.2. Estensione del test della mediana o test di Brown-Mood per k campioni indipendenti 433 6.3. Confronti multipli tra mediane con le frequenze, nel test di Brown-Mood 443 6.4. Cenni sul test di Nemenyi e altri test per la mediana 452 6.5. Analisi della varianza per ranghi ad un criterio di classificazione: il test di Kruskal-Wallis 455 6.6. Metodi per i confronti multipli tra le medie dei ranghi: casualizzazione o permutation test, Bonferroni-Dunn, tipo-tukey di Nemenyi e tipo-scheffé 473 6.7. Confronti multipli post-hoc per il test di Kruskal-Wallis, con il test U di Mann-Whitney 490 6.8. Equivalenza del test di Kruskal-Wallis con il test U di Mann-Whitney, quando k = 2 496 6.9. Rappresentazione grafica per confronti multipli tra mediane: il notched box-and-whiskers plot 498 6.10. Test non parametrici di Levene e di Brown-Forsythe, per la differenza nella variabilità tra k campioni; la formula di Sprent 501 6.11. Confronti tra più proporzioni e confronti multipli relativi 508 6.12. Il test Q di Cochran 518 6.13. Il test di Friedman o analisi della varianza per ranghi a 2 criteri di classificazione, con una e con k repliche 523 6.14. I confronti multipli tra medie di ranghi nell analisi della varianza non parametrica, a due criteri di classificazione 542 6.15. Il test di Quade 551 6.16. L esempio di Koch: uso di metodi non parametrici, nell analisi statistica di un esperimento complesso con k fattori 558 CAPITOLO VII - TEST NON PARAMETRICI PER IL TREND CON DATI DISTINTI 7.1. La media mobile e la scelta del test per la tendenza 573 7.2. Il test di Cox e Stuart (e sue varianti) per il trend della tendenza centrale e della variabilità 579 7.3. Il test di Mann o di Mann-Kendall o test di Kendall per il trend, con una sola serie e con la versione modificata per la stagionalità 592 7.4. Il test U di Mann-Whitney e il test T di Wilcoxon, per la differenza nella tendenza centrale di due cicli 608 7.5. Coefficiente di regressione e intervallo di confidenza: metodo di Sen o Theil-Sen o Sen-Kendall per tempi distinti e raggruppati 613 7.6. L intervallo di confidenza del coefficiente angolare β di Sen, con il metodo di Hodges-Lehmann 622 7.7. Il test di Farrell o di Sen-Farrell o di Farell-Van Belle-Hughes V

per il trend con stagionalità, in campioni uniformi 632 7.8. Il test di Pettitt per il punto di svolta (change point o turning point), con tempo ignoto e con tempo noto 642 CAPITOLO VIII - TEST NON PARAMETRICI PER IL TREND CON DATI RAGGRUPPATI 8.1. Il test di Jonckheere o di Jonckheere-Terpstra per alternative ordinate, in k campioni indipendenti 655 8.2. Il test di Cuzick per il trend 670 8.3. Il test di Mack-Wolfe o test dell ombrello (umbrella test) 680 8.4. Il test di Page o delle alternative ordinate, in k campioni dipendenti 699 CAPITOLO IX - TEST NON PARAMETRICI PER CORRELAZIONE, CONCORDANZA, REGRESSIONE MONOTONICA E REGRESSIONE LINEARE 9.1. La correlazione non parametrica ρ (rho) di Spearman, con la distribuzione di Hotelling-Pabst 717 9.2. Il coefficiente di correlazione τ (tau) di Kendall; il τ a e τ b di Kendall con i ties 727 9.3. Confronto tra ρ e τ; potenza del test e numero di osservazioni necessarie per la significativita 736 9.4 Altri metodi per la correlazione non parametrica: test di Pitman con le permutazioni. 742 9.5 Il quadrant test o test della mediana di Blomqvist 747 9.6. Il test di Daniels per il trend 752 9.7. Significatività della regressione e della correlazione lineare parametrica con i test ρ e τ 758 9.8. I coefficienti di correlazione parziale: il τ 12,3 di Kendall e il ρ 12,3 di Spearman 763 9.9. La retta di regressione non parametrica di Theil o di Theil-Kendall 768 9.10. Confronto tra la retta parametrica e la retta di Theil 780 9.11. Significatività di b con il τ di Kendall 782 9.12. Il test di Hollander per il confronto tra due coefficienti angolari 789 9.13. La regressione monotonica di Iman-Conover 795 9.14. Trend lineare di Armitage per le proporzioni e le frequenze 801 CAPITOLO X - ALTRI METODI INFERENZIALI: IL RICAMPIONAMENTO 10.1. Metodi di ricampionamento: Monte Carlo e principio plug-in 807 10.2. Il Jackknife 812 10.3. Il Bootstrap 818 VI