Proprietà della varianza
|
|
|
- Oliviero Baroni
- 9 anni fa
- Просмотров:
Транскрипт
1 Proprietà della varianza
2 Proprietà della varianza
3 Proprietà della varianza
4 Proprietà della varianza Intermezzo: ma perché dovremmo darci la pena di studiare come calcolare la varianza nel caso di somme, differenze, prodotti e divisioni? ecco due esempi molto comuni: misuriamo la risposta di un sistema biologico ad un trattamento. Eseguiamo diverse repliche dell'esperimento e calcoliamo la media e l'errore standard. Contemporaneamente misuriamo anche il background (risposta del sistema in assenza di trattamento) medio e la sua dispersione attorno al valore medio. Siamo interessati a sottrarre tale valore alla risposta del sistema al trattamento. vogliamo comparare tra loro diversi set di dati, ad esempio la risposta di diverse linee cellulari ad uno stesso trattamento, e vogliamo usare uno standard di riferimento come controllo. Il modo naturale di procedere è normalizzare i valori ottenuti con ciascuna linea per il valore di controllo. Spesso capita di vedere (in tesi e lavori scientifici in genere) che in queste operazioni vengano dimenticati gli errori. Una misura senza l'errore associato NON SERVE A NULLA!
5 Proprietà della varianza Partiamo dal seguente caso: una funzione trasforma il valor medio di una variabile nel valor medio di un'altra variabile. Allora: derivata prima della funzione calcolata nel valore medio di x
6 Proprietà della varianza
7 Proprietà della varianza In realtà nella pratica di laboratorio abbiamo spesso a che fare con il problema inverso: es. reale di laboratorio linea rossa: funzione logistica a 5 parametri linea blu: approssimazione lineare
8 Proprietà della varianza
9 Propagazione dell'errore: generale Solo per variabili indipendenti derivata parziale di f rispetto alla variabile x1. Derivo la funzione considerando x1 una variabile e x2 costante
10 Propagazione dell'errore: somma
11 Propagazione dell'errore: differenza si noti l'implicazione!
12 Propagazione dell'errore: prodotto
13 Propagazione dell'errore: prodotto trucco
14 Propagazione dell'errore: prodotto es.:
15 Propagazione dell'errore: divisione
16 Propagazione dell'errore: divisione trucco
17 Propagazione dell'errore: divisione es.:
18 Propagazione dell'errore
19 Propagazione dell'errore coefficiente di variazione (percentuale) o errore relativo
20 Propagazione dell'errore implicazioni
21 Propagazione dell'errore implicazioni prendo campioni casuali di n=3, 4,5,...,100 repliche da l'errore standard della media:. Calcolo la media e
22 Implicazioni: pianificazione...ulteriori implicazioni. Abbiamo visto che: dunque, se abbiamo che e per semplicità e ci aspettiamo che: dunque il test di significatività dipende da quanto distano tra loro le medie, da quanto è grande la dev. standard e dalla dimensione dei campioni
23 Implicazioni: pianificazione errore tipo 2: falsi negativi errore tipo 1: falsi positivi
24 Implicazioni: pianificazione Ricordiamo che: scostamento della media del campione dalla media della popolazione dunque: ma Z segue una distribuzione normale standard e quindi possiamo calcolare (o trovare nelle tabelle opportune) tutti i valori di probabilità che desideriamo per ogni valore di Z. Ad es. possiamo calcolare i valori critici di Z che definiscono l'intervallo all'interno del quale ricade il 95% dei valori di Z: è l'intervallo che ci dice quanto la media campionaria si discosta al più del 95% dalla media vera: intervallo di confidenza (CI) al 95% Dunque
25 Implicazioni: pianificazione dunque dobbiamo scegliere un valore critico di Z in modo che l'area β assuma un certo valore che noi vogliamo accettare. Che significa?
26 Implicazioni: pianificazione Che significa? Che accettiamo di rischiare di ottenere falsi negativi con una certa probabilità. Per convenzione si fissa tale valore al 20%, e il valore critico di Z è:
27 Implicazioni: pianificazione Accettiamo di avere solo il 5% di falsi positivi. Accettiamo di avere il 20% di falsi negativi, cioè siamo in grado di discriminare i veri positivi nel 80%. Siamo in grado di rifiutare l'ipotesi nulla H0 con una probabilità P=0.8: POTENZA
28 Implicazioni: pianificazione Equazione di Leher differenza standardizzata es. il QI (scemenza) ha una distribuzione normale con media pari a 100 e deviazione standard pari a 20. Ci attendiamo che una popolazione sottoposta ad un certo trattamento si discosti dal valore medio di 10 punti, ad esempio un trattamento rincretinente ridurrebbe il QI medio da 100 a 90 punti. Quanti soggetti dobbiamo valutare accettando di avere il 5% di falsi positivi e una potenza del 80%, cioè di avere una probabilità del 80% di mettere in evidenza l'effetto (o di rifiutare l'ipotesi nulla nel 80% dei casi)?
29 Implicazioni: pianificazione ovviamente posso fare i conti per avere una potenza del test più elevata, ma si noti che aumenta anche il numero di soggetti oppure rigirare l'equazione per ottenere una stima di ciascun parametro in funzione del valore ipotizzato per gli altri
30 Varianza: proprietà Riprendiamo questo esperimento numerico: estrazione di campioni e calcolo delle medie per ogni campione grafico della distribuzione delle medie campionarie
31 Varianza: proprietà Questo ci dice che le medie campionarie si comportano come una variabile aleatoria con distribuzione E la varianza (calcolata per ogni campione) come si distribuisce? varianza campionaria
32 Chi-quadro In generale, se sono variabili aleatorie indipendenti con distribuzione allora la variabile aleatoria si distribuisce secondo una distribuzione Chi-quadro con k gradi di libertà
33 Chi-quadro es. numerico: nb. 500 campioni
34 Chi-quadro es. numerico:
35 Varianza: proprietà varianza campionaria ci attendiamo che e infatti: questo risultato può essere usato per calcolare l'intervallo di confidenza della varianza esattamente come abbiamo fatto per la media utilizzando la distribuzione t di Student. Attenzione: il metodo è molto sensibile all'ipotesi di normalità della variabile x di partenza
36 Varianza: proprietà es. gli occhi di Cyrtodiopsis dalmanni si trovano in cima a peduncoli oculari, particolarmente sviluppati nei maschi a cui pare conferiscano un vantaggio riproduttivo. La distanza interoculare misurata a 9 maschi presi a caso dalla popolazione è: Calcolare l'intervallo di confidenza della varianza: il problema è calcolare: perché?
37 Varianza: intervallo di confidenza La distribuzione è asimmetrica e dunque i valori critici sono diversi:
38 Varianza: intervallo di confidenza
39 This work is licensed under a Creative Commons AttributionNonCommercial 4.0 International License. see: Roberto Chignola Università di Verona [email protected]
Chi-quadro. sono variabili aleatorie indipendenti con distribuzione allora la variabile aleatoria
Chi-quadro In generale, se sono variabili aleatorie indipendenti con distribuzione allora la variabile aleatoria si distribuisce secondo una distribuzione Chi-quadro con k gradi di libertà Chi-quadro Dunque
Distribuzioni discrete di Probabilità
Ma la biologia di laboratorio che cosa ha a che fare con le distribuzioni discrete di probabilità? Consideriamo questo gedankenexperiment: in una fiasca per coltura cellulare abbiamo una popolazione eterogenea
Esercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI
IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e
Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer
Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Inferenza statistica: insieme di tecniche che si utilizzano per ottenere informazioni su una
Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).
Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si
Verifica delle ipotesi
Statistica inferenziale Stima dei parametri Verifica delle ipotesi Concetti fondamentali POPOLAZIONE o UNIVERSO Insieme degli elementi cui si rivolge il ricercatore per la sua indagine CAMPIONE Un sottoinsieme
Statistica inferenziale per variabili quantitative
Lezione 7: - Z - test e intervalli di Confidenza - t-test per campioni indipendenti e dipendenti Cattedra di Biostatistica Dipartimento di Scienze scperimentali e cliniche, Università degli Studi G. d
STATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani [email protected] http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta
Il confronto fra medie
L. Boni Obiettivo Verificare l'ipotesi che regimi alimentari differenti non producano mediamente lo stesso effetto sulla gittata cardiaca Ipotesi nulla IPOTESI NULLA La dieta non dovrebbe modificare in
Gli errori nella verifica delle ipotesi
Gli errori nella verifica delle ipotesi Nella statistica inferenziale si cerca di dire qualcosa di valido in generale, per la popolazione o le popolazioni, attraverso l analisi di uno o più campioni E
STATISTICA ESERCITAZIONE 13
STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni
Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.
5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema
Distribuzioni campionarie
1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari
Regressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 10-Significatività statistica per la correlazione vers. 1.0 (5 novembre 2014) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università
CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
1.1 Obiettivi della statistica Struttura del testo 2
Prefazione XV 1 Introduzione 1.1 Obiettivi della statistica 1 1.2 Struttura del testo 2 2 Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati 5 2.2 Distribuzioni di frequenza
Dispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
Distribuzione Gaussiana - Facciamo un riassunto -
Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura
Il Test di Ipotesi Lezione 5
Last updated May 23, 2016 Il Test di Ipotesi Lezione 5 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura I anno, II semestre Il test di ipotesi Cuore della statistica inferenziale!
Quanti soggetti devono essere selezionati?
Quanti soggetti devono essere selezionati? Determinare una appropriata numerosità campionaria già in fase di disegno dello studio molto importante è molto Studi basati su campioni troppo piccoli non hanno
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII
Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII Un breve richiamo sul test t-student Siano A exp (a 1, a 2.a n ) e B exp (b 1, b 2.b m ) due set di dati i cui
SOLUZIONE. a) Calcoliamo il valore medio delle 10 misure effettuate (media campionaria):
ESERCIZIO SU TEST STATISTICO (Z, T e χ ) Da una ditta di assemblaggio di PC ci viene chiesto di controllare la potenza media dissipata da un nuovo processore, che causa a volte problemi di sovraccarico
Test delle Ipotesi Parte I
Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test
Cognome e nome. 2 In uno studio viene misurata la pressione arteriosa sistolica a 5 maschi adulti, con i seguenti risultati : 129; 134; 142; 128; 146
Statistica medica. Biotecnologie mediche A.a. 2004-2005 1 Febbraio 2005 Tempo previsto 60 minuti Cognome e nome 1 Indicate a quale categoria appartengono le seguenti variabili: Nominale Ordinale Numerica
ESERCITAZIONE 21 : VARIABILI ALEATORIE CONTINUE
ESERCITAZIONE 21 : VARIABILI ALEATORIE CONTINUE e-mail: [email protected] web: www.dm.unipi.it/ tommei Ricevimento: su appuntamento Dipartimento di Matematica, piano terra, studio 114 7 Maggio 2013 Esercizio
Esercitazione 5 del corso di Statistica 2 Prof. Domenico Vistocco
Esercitazione del corso di Statistica Prof. Domenico Vistocco Alfonso Iodice D Enza May 30, 007 1 Esercizio Si consideri una popolazione caratterizzata dai numeri, 3, 6, 8, 11. Si considerino tutti i possibili
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi
Contenuti: Capitolo 14 del libro di testo
Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4
DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.
Corso di Laurea Specialistica in Biologia Sanitaria, Universita' di Padova C.I. di Metodi statistici per la Biologia, Informatica e Laboratorio di Informatica (Mod. B) Docente: Dr. Stefania Bortoluzzi
Approssimazione normale alla distribuzione binomiale
Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Approssimazione normale della Poisson (TLC) In un determinato tratto di strada il numero di incidenti
05. Errore campionario e numerosità campionaria
Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,
Corso di Statistica Esercitazione 1.8
Corso di Statistica Esercitazione.8 Test su medie e proporzioni Prof.ssa T. Laureti a.a. 202-203 Esercizio Un produttore vuole monitorare i valori dei livelli di impurità contenute nella merce che gli
