Tiziano Vargiolu. Elementi di Probabilità e Statistica



Documenti analoghi
Esame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

E naturale chiedersi alcune cose sulla media campionaria x n

1 Serie di Taylor di una funzione

INDICE PREFAZIONE VII

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Esercizi su. Funzioni

Test statistici di verifica di ipotesi

Corso di Laurea in Scienze della Formazione Primaria Università di Genova MATEMATICA Il

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr.

Lezioni di Matematica 1 - I modulo

Teoria delle code. Sistemi stazionari: M/M/1 M/M/1/K M/M/S

LEZIONE n. 5 (a cura di Antonio Di Marco)

Cosa dobbiamo già conoscere?

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

Un modello matematico di investimento ottimale

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE


I libri di testo. Carlo Tarsitani

ProgettoFuori Corso TESI DI LAUREA

Matematica generale CTF

Appunti sulla Macchina di Turing. Macchina di Turing

Capitolo 2. Operazione di limite

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi

Fisica Medica x OPD. Angelo Scribano (ottobre 2006) Le scienze e il metodo scientifico Fisica Medica. A. Scribano pag.1

Errori di una misura e sua rappresentazione

Le biblioteche raccontate a mia fi glia

Alla ricerca dell algoritmo. Scoprire e formalizzare algoritmi.

Metodi statistici per le ricerche di mercato

lo schema di partenza

Temi di Esame a.a Statistica - CLEF

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

risulta (x) = 1 se x < 0.

Sommario. Definizione di informatica. Definizione di un calcolatore come esecutore. Gli algoritmi.

Relazioni statistiche: regressione e correlazione

Il confronto fra proporzioni

PROMUOVERSI MEDIANTE INTERNET di Riccardo Polesel. 1. Promuovere il vostro business: scrivere e gestire i contenuti online» 15

Indice. 1 Introduzione alle Equazioni Differenziali Esempio introduttivo Nomenclatura e Teoremi di Esistenza ed Unicità...

Slide Cerbara parte1 5. Le distribuzioni teoriche

QUANTIZZAZIONE diverse fasi del processo di conversione da analogico a digitale quantizzazione

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

4 3 4 = 4 x x x 10 0 aaa

Modulo didattico sulla misura di grandezze fisiche: la lunghezza

Dimensione di uno Spazio vettoriale

Uso di base delle funzioni in Microsoft Excel

Attività Descrizione Materiali utilizzati

Brand Il primo corso per gli imprenditori che vogliono imparare l arma segreta del Brand Positioning Introduzione

Tema A Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che

Da dove nasce l idea dei video

Statistiche campionarie

Corso di Psicometria Progredito

1. Distribuzioni campionarie

Inferenza statistica. Statistica medica 1

Istituzioni di Statistica e Statistica Economica

Schemi delle Lezioni di Matematica Generale. Pierpaolo Montana

Verifica di ipotesi e intervalli di confidenza nella regressione multipla

STATISTICA IX lezione

LA MOLTIPLICAZIONE IN CLASSE SECONDA

Unità 18. Le certificazioni di italiano L2. Lavoriamo sulla comprensione. Università per Stranieri di Siena Livello A2 CHIAVI

Elementi di Psicometria con Laboratorio di SPSS 1

AUTOREGOLAZIONE PER IL COMPITO

Un modello matematico di investimento ottimale

Esercizi riassuntivi di probabilità

Statistica inferenziale

Proof. Dimostrazione per assurdo. Consideriamo l insieme complementare di P nell insieme

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE

Nina Cinque. Guida pratica per organizzarla perfettamente in una sola settimana! Edizioni Lefestevere

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo.

Esercitazione n.2 Inferenza su medie

Introduzione alle relazioni multivariate. Introduzione alle relazioni multivariate

Equilibrio bayesiano perfetto. Giochi di segnalazione

LA CONDIZIONE DEL DOTTORATO DI RICERCA A BOLOGNA NEL 2000

TNT IV. Il Diavolo è meno brutto di come ce lo dipingono!!! (Guarda il video)

Statistica. Lezione 6

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

OpenPsy: OpenSource nella Psicologia. Presentazione del progetto in occasione dell edizione 2004 del Webbit (Padova)

Elementi di Psicometria con Laboratorio di SPSS 1

Esercizi test ipotesi. Prof. Raffaella Folgieri aa 2009/2010

TNT IV. Il Diavolo è meno brutto di come ce lo dipingono!!! (Guarda il video)

COME PARLARE DI DISLESSIA IN CLASSE.

SPC e distribuzione normale con Access

IPERCA. Il metodo a sei fasi Per gestire con successo progetti, incarichi e situazioni di vita e per accrescere continuamente l esperienza.

IDEE PER LO STUDIO DELLA MATEMATICA

ESAME DI STATISTICA Nome: Cognome: Matricola:

Viene lanciata una moneta. Se esce testa vinco 100 euro, se esce croce non vinco niente. Quale è il valore della mia vincita?

SERVIZIO NAZIONALE DI VALUTAZIONE

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it

Il calcolo letterale per risolvere problemi e per dimostrare

L'esame orale per il livello C1

Che cos è l intelligenza e come funzionano i test del Q.I.

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

I colloqui scuola-famiglia: le basi per una comunicazione efficace Dott.ssa Claudia Trombetta Psicologa e psicoterapeuta claudia.trombetta@ .

IL METODO PER IMPOSTARE E RISOLVERE I PROBLEMI DI FISICA (NB non ha nulla a che vedere con il metodo scientifico)

Statistica Matematica A - Ing. Meccanica, Aerospaziale I prova in itinere - 19 novembre 2004

Biografia linguistica

FISICA. Le forze. Le forze. il testo: 2011/2012 La Semplificazione dei Testi Scolastici per gli Alunni Stranieri IPSIA A.

REGOLE PER L ESAME (agg.te settembre 2015)

Interesse, sconto, ratei e risconti

UNIVERSITÀ DEGLI STUDI DI MILANO-BICOCCA A. A FACOLTÀ DI ECONOMIA. Programma del modulo di STATISTICA I (6 crediti)

Transcript:

Tiziano Vargiolu Elementi di Probabilità e Statistica

Ristampa: marzo 2014 ISBN 978 88 7178 349 9 ISBN 88 7178 349 2 2002 by CLEUP sc Coop. Libraria Editrice Università di Padova via Belzoni 118/3 Padova (t. +39 049 8753496) www.cleup.it - www.facebook.com/cleup Tutti i diritti di traduzione, riproduzione e adattamento, totale o parziale, con qualsiasi mezzo (comprese le copie fotostatiche e i microfilm) sono riservati. Grafica di copertina: Carlo Fumian

Indice Introduzione vii 1 Statistica descrittiva ed inferenziale 1 1.1 Statistica descrittiva.............................. 1 1.1.1 Media.................................. 2 1.1.2 Variabilità................................ 3 1.1.3 La distribuzione normale....................... 3 1.1.4 Percentili................................ 4 1.2 Statistica inferenziale.............................. 7 2 Elementi di Calcolo delle Probabilità 13 2.1 Esperimento aleatorio............................. 13 2.2 Operazioni con eventi e variabili aleatorie.................. 15 2.3 Probabilità di un evento............................ 16 2.3.1 Proprietà delle probabilità....................... 18 2.4 Legge di una variabile aleatoria........................ 19 2.5 Funzione di ripartizione di una variabile aleatoria.............. 21 2.6 Probabilità condizionata............................ 23 2.6.1 Formula della probabilità totale.................... 24 2.6.2 Formula di Bayes............................ 24 2.7 Indipendenza.................................. 25 2.7.1 Variabili aleatorie binomiali...................... 28 2.8 Speranza e varianza.............................. 30 2.8.1 Le leggi gaussiane........................... 33 2.9 Teoremi di limite................................ 35 2.9.1 Variabili aleatorie di Poisson..................... 37 3 Stime e test 47 3.1 Statistica descrittiva.............................. 47 3.1.1 Media e varianza............................ 47 3.1.2 Percentili e quantili.......................... 48 3.2 Statistica inferenziale.............................. 52 3.3 Quantili della distribuzione normale N(0, 1)................. 64

iv INDICE 4 Test di Student 65 4.1 Variabile aleatoria t di Student........................ 66 4.2 Test di Student................................. 67 4.3 Errori di prima e seconda specie....................... 71 4.4 Test unilateri.................................. 71 4.5 Test sulla media................................ 73 4.6 Il valore P.................................... 74 4.7 Quantili della distribuzione t(n) di Student................. 78 5 Analisi della varianza 79 5.1 La variabile aleatoria χ 2............................ 81 5.2 Variabile aleatoria F di Fischer........................ 81 5.3 Il test t è una analisi della varianza...................... 83 5.4 Un altro esempio................................ 84 5.5 Uso del test t per isolare differenze tra gruppi................ 86 5.6 Quantili della distribuzione F di Fischer, α = 0.95............. 97 5.7 Quantili della distribuzione F di Fischer, α = 0.99............. 98 6 Errori di prima e di seconda specie 99 6.1 Errore di seconda specie............................ 99 6.2 Potenza di un test............................... 102 6.3 Cosa determina la potenza di un test?.................... 103 6.3.1 La probabilità α di fare un errore di prima specie.......... 103 6.3.2 La differenza che si vuole misurare.................. 105 6.3.3 La taglia del campione......................... 107 6.3.4 Riassunto................................ 109 6.4 Problemi pratici relativi alla potenza..................... 110 6.5 Approssimazione normale........................... 111 7 Intervalli di confidenza 115 7.1 Un esempio................................... 116 7.2 Che significa confidenza............................ 118 7.3 Uso degli intervalli di confidenza per test di ipotesi............. 120 7.4 Intervalli di confidenza per la media..................... 121 8 Statistica discreta 127 8.1 Torniamo su Marte............................... 127 8.2 Stimare le proporzioni dai campioni..................... 128 8.3 Test di ipotesi per le proporzioni....................... 131 8.3.1 Mortalità associata all anestesia.................... 132 8.4 Un altro approccio: analisi delle tabelle di contingenza........... 132 8.4.1 Il test χ 2................................ 133 8.5 Il test χ 2 per più di due gruppi o risultati.................. 134 8.5.1 Suddividere le tabelle di contingenza................. 135 8.6 Test per un singolo campione......................... 136

INDICE v 8.7 Intervalli di confidenza per differenze di proporzioni............ 138 8.8 Intervalli di confidenza per proporzioni.................... 139 8.9 Quantili della distribuzione χ 2........................ 154 9 Regressione lineare 155 9.1 Come stimare i parametri da un campione.................. 157 9.2 Variabilità intorno alla retta di regressione.................. 161 9.3 Errori standard dei coefficienti di regressione................ 163 9.3.1 Intervalli di confidenza e test di ipotesi sui coefficienti di regressione164 9.4 Un altro esempio................................ 165 9.5 Previsione nella regressione lineare...................... 168 9.5.1 Previsione della media......................... 169 9.5.2 Previsione della singola misurazione................. 169 A Teoria della probabilità secondo Kolmogorov 181 A.1 Esperimento aleatorio............................. 181 A.2 Eventi legati ad un esperimento aleatorio.................. 182 A.3 Probabilità di un evento............................ 183 A.3.1 Proprietà delle misure di probabilità................. 184 A.4 Variabili aleatorie................................ 185 A.5 Funzione di ripartizione di una variabile aleatoria.............. 187 A.6 Speranza matematica.............................. 188 A.7 Conclusione................................... 189

Introduzione Questo libro è la seconda edizione di un libro tratto dalle dispense che avevo scritto per il corso di Istituzioni di Matematiche II per Biotecnologie nell anno accademico 1999/2000. Tuttavia, rispetto alla prima edizione, ho cambiato completamente l approccio con cui presentare la probabilità (e di conseguenza la statistica). Seguendo l esempio di un altro libro di matematica per non matematici [14], ho scritto due introduzioni: una per gli studenti, e una per i miei colleghi docenti. Introduzione per gli studenti Dopo un capitolo introduttivo su statistica descrittiva ed inferenziale, ho scelto di presentare subito le basi teoriche sia della probabilità che della statistica. Questo per due motivi: far vedere che le procedure statistiche più usate in pratica (test t, regressione lineare, ecc.) non sono una serie di formulette da imparare a memoria che funzionano per qualche specie di magia, ma hanno delle giustificazioni teoriche; ho preferito mostrare brevemente a cosa può servire la statistica, prima di partire con la teoria; una volta fatta la teoria, poi, si riesce a capire molto meglio parecchie cose usate in pratica. Una parola va spesa per il formalismo matematico. Probabilmente il rigore utilizzato soprattutto nei Capitoli 2 e 3 può apparire eccessivo per una cosa che poi avrà delle applicazioni pratiche. Tuttavia, in matematica ogni parola o simbolo usato ha il suo preciso significato, e il più piccolo cambiamento può portare a stravolgimenti di senso. Questo fatto è molto ben esemplificato da un esempio non matematico fatto da un matematico (Freddie Delbaen): Perfino l ordine con cui si dicono le cose ha la sua importanza. Se dico: per ogni uomo esiste una donna, voi vi immaginate una certa situazione. Se invece dico: esiste una donna per ogni uomo, voi vi immaginate una situazione completamente diversa. Naturalmente questo tipo di donne esiste... ma non ha una reputazione molto buona!. Seguendo questo spirito, nei Capitoli 2 e 3 ho usato una struttura teorema-dimostrazione (quando è stato possibile fornire una dimostrazione breve e comprensibile); nei capitoli seguenti, la struttura si fa più discorsiva, ma sono sempre specificate le ipotesi sotto cui si può utilizzare la procedura statistica sotto esame.

viii INTRODUZIONE Inoltre, in tutto il libro capita di dare delle definizioni: il nome dell oggetto definito viene usualmente indicato in grassetto, e consiglio vivamente di usare quel nome e non dei sinonimi, a meno di essere veramente sicuri di ciò che si sta facendo. La scelta degli argomenti è poi caduta su quelli svolti tradizionalmente in un corso di statistica elementare. Ogni argomento é svolto tenendo d occhio una situazione pratica in cui si applica o si potrebbe applicare la procedura utilizzata. Alcuni esempi sono stati volutamente scelti fuori dal comune: ho infatti notato che l effetto finale degli esempi è che gli studenti sono interessati dalla situazione strana e alla fine comprendono meglio la procedura statistica. Ogni capitolo termina con degli esercizi risolti, alcuni dei quali sono testi di esami precedenti. La mia raccomandazione è che lo studente, dopo aver letto il capitolo, tenti di fare l esercizio senza guardare la soluzione, poi confronti la propria soluzione con quella del libro. In questo modo si imparano molte più cose che leggendo semplicemente la soluzione, secondo il noto principio per cui si impara di più facendo che guardando gli altri fare. Introduzione per i docenti Nello scrivere la prima edizione di questo libro, avevo perseguito due obbiettivi: il rigore formale e la presentazione di applicazioni concrete, il tutto cercando di non sacrificare la comprensibilità. Infatti, mentre l insegnamento dell Analisi non ci sono molte differenze nel rigore formale tra un corso di laurea in Matematica e un qualsiasi altro corso (le definizioni di intorno, di funzione continua, di limite ecc. sono sempre le stesse), per quanto riguarda la Probabilità mi sembra che essa soffra di una specie di complesso di inferiorità (o di superiorità) non appena esce dal corso di laurea in Matematica: infatti mi sembra che si tema di fare teoria perché non verrebbe capita, e ci si accontenta di presentare solo i risultati utili per la statistica, quasi senza giustificazione. Avevo quindi cercato, dopo una breve parte in cui si presentano le idee intuitive della Statistica, di fornire le basi teoriche della Probabilità e della Statistica (secondo l approccio di Kolmogorov), cercando di dimostrare tutto il possibile, compatibilmente al fatto che il tipico lettore di questo libro non conosce (né sarà tenuto a farlo) la Teoria della Misura. Durante gli anni (non molti) in cui ho usato questo testo, però, mi sono accorto che alcune cose non venivano capite dagli studenti non tanto per troppa astrazione, ma perchè non comprendevano gli scopi pratici. Le principali obiezioni risultavano essere all additività numerabile (soprattutto da studenti che ormai, dopo innumerevoli tagli ai programmi, non vedono più una serie numerica nè al liceo nè all università) e alla costruzione delle variabili aleatorie, che sembrano cadere dal cielo. Mentre affrontavo queste difficoltà, mi è capitato di interessarmi all approccio di De Finetti. Dopo un periodo di digestione, ho deciso di adottarlo, poichè risolve in modo stupefacente i due problemi di cui sopra: la teoria viene sviluppata fin da subito supponendo solo l additività finita (questo perchè lo stesso De Finetti ritiene l additività numerabile una proprietà troppo forte e che di fatto tradisce il legame della probabilità con le applicazioni), e facendo a meno della struttura di spazio probabilizzato sottostante la teoria, ma che di

ix fatto non viene utilizzata quasi mai in applicazioni statistiche (e sicuramente non per quanto riguarda quanto esposto qui). Come per la prima edizione, molti fatti sono dati per veri senza accennare a dimostrazioni, soprattutto nei Capitoli 2 e 3. I più rilevanti nella prima edizione (di cui una traccia si può vedere in Appendice) erano l esistenza dei boreliani e della misura di Lebesgue, insieme a quasi ogni enunciato sulle variabili aleatorie continue (ho scelto di omettere assolutamente perché per un lettore che non conosce la Teoria della Misura non si capisce rispetto a cosa siano assolutamente continue ). In questa edizione ho sorvolato sul fatto che non ci sono contraddizioni se si definisce la probabilità in modo che valga l additività finita e poi si compiono operazioni su un insieme infinito (numerabile o meno) di eventi (una sorta di teorema di compattezza logica), e sul fatto che la speranza matematica di variabili aleatorie non limitate in realtà è indeterminato, e quello che si usa nel libro è solo una delle infinite possibili specificazioni del risultato (che comunque rimane coerente sia al suo interno che coi teoremi di limite presentati alla fine del Capitolo 2). Dopo la parte teorica, ho lasciato alle applicazioni tutto lo spazio che meritano in un corso che di fatto dovrà dare le basi quantitative ad un futuro scienziato che tipicamente non sarà un matematico: molti tests (sia col metodo del valore critico che usando gli intervalli di confidenza) e molti esempi pratici; ogni capitolo poi termina con alcuni esercizi risolti. A questo proposito devo dire che per essere pienamente coerente avrei dovuto essere bayesiano, e presentare da subito la statistica bayesiana. Ma questa edizione nasce come esperimento, e in questo momento non voglio mettere troppa carne sul fuoco: ho preferito quindi attenermi ad un approccio più classico nei corsi di Statistica per biologia, anche per il fatto che è l approccio seguito nella maggior parte della letteratura scientifica. Ho poi voluto tenere il numero di pagine basso, in modo che il libro contenesse ciò che ragionevolmente si può fare in un corso annuale: d altronde esistono già dei libri che si possono assumere come testi di referenza, e cercare di esaurire tutti gli argomenti svolti da questi avrebbe voluto dire sacrificare sia la leggibilità che la precisione. Ringraziamenti Desidero poi ringraziare gli studenti del primo anno di Biotecnologie dell Università di Padova dell anno accademico 1999/2000 per i numerosi errori trovati nella prima edizione di questo manoscritto, e Gino Favero per alcuni consigli sull edizione finale. Sicuramente altri errori sono stati introdotti poi, e me ne scuso con i lettori. Padova, 26 aprile 2005 Tiziano Vargiolu