Tutta la scienza è fondata sulle misure (Helmholtz)

Documenti analoghi
Tutta la scienza è fondata sulle misure (Helmholtz)

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

STATISTICA. Esercitazione 5

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

Breve ripasso di statistica

Metodi statistici per le ricerche di mercato

Compiti tematici dai capitoli 2,3,4

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51

Quanti soggetti devono essere selezionati?

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

1.1 Obiettivi della statistica Struttura del testo 2

Metodi statistici per lo studio dei fenomeni biologici

Metodi statistici per le ricerche di mercato

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano

Teoria e tecniche dei test. Concetti di base

Comprendere i fenomeni vuol dire studiare le relazioni tra 2 o più variabili. Esiste un legame tra le variabili?

Ulteriori Conoscenze di Informatica e Statistica

Introduzione alla statistica con Excel

Metodi statistici per le ricerche di mercato

Metodi Matematici e Informatici per la biologia. Esercizi

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i

REGRESSIONE E CORRELAZIONE

Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazion

Test di ipotesi. Test

Ulteriori Conoscenze di Informatica e Statistica

INDICE PARTE METODOLOGICA

Laboratorio di Chimica Fisica. Analisi Statistica

Verifica delle ipotesi

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

PROGRAMMA DI STATISTICA BITETTO-BOGLI aa. 2018/2019 CON DETTAGLIO ARGOMENTI DA STUDIARE E LEGGERE * SUI LIBRI ADOTTATI

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo

COGNOME.NOME...MATR..

Distribuzioni teoriche di probabilità: distribuzione binomiale e distribuzione normale

Distribuzioni e inferenza statistica

Fondamenti statistici : Test d Ipotesi (1)

COGNOME.NOME...MATR..

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

Università degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE

Il metodo statistico: prova dell ipotesi, intervallo di confidenza

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

CORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

Esercizi di statistica

STATISTICA A K (60 ore)

Presentazione dell edizione italiana

Università di Pavia Econometria. Richiami di Statistica. Eduardo Rossi

Distribuzioni teoriche di probabilità: distribuzione binomiale e distribuzione normale

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Distribuzioni teoriche di probabilità: distribuzione binomiale e distribuzione normale

Statistica inferenziale per variabili quantitative

Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali. Esercitazione E

CALCOLO DELL ERRORE E VALUTAZIONE DI UN METODO ANALITICO

Modelli e procedure per l educazione degli adulti

University of Messina, Italy

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice

Distribuzioni teoriche di probabilità: distribuzione binomiale e distribuzione normale

Elaborazione statistica di dati

Tipi di variabili. Indici di tendenza centrale e di dispersione

PROBABILITÀ ELEMENTARE

Distribuzioni teoriche di probabilità: distribuzione binomiale e distribuzione normale

Analisi della varianza

Dipartimento di Fisica a.a. 2003/2004 Fisica Medica 2 Indici statistici 22/4/2005

Significatività ed analisi degli errori

Dispensa di Statistica

Statistica Elementare

Biostatistica Laurea Magistrale in Biologia

Capitolo 12 La regressione lineare semplice

STIME STATISTICHE. Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali. p. 2/2

Indice. L Editore ringrazia. Ringraziamenti. Autori. Prefazione. Obiettivi formativi XIII XVII

La statistica descrittiva prima parte. a cura della prof.ssa Anna Rita Valente

Cognome e nome Tempo disponibile: 75 minuti

Corso Di CHIMICA ANALITICA II

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II

MASB AA10/11 21/01/11 test #1 1

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

Parte 1 : Inferenza. Varianza nota test Z. Distribuzioni asintotiche dei test. Varianza ignota test t ad un campione

Richiami di inferenza statistica Strumenti quantitativi per la gestione

Verifica delle ipotesi. Verifica delle ipotesi

Modulo III. Definizione ed elementi di calcolo delle probabilità Le variabili casuali La distribuzione normale e la normale standardizzata

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer

Parametri statistici

Test d Ipotesi - Esempi

Teoria dei Fenomeni Aleatori AA 2012/13

Proprietà della varianza

Metodologie Quantitative

Teorema del Limite Centrale

Casa dello Studente. Casa dello Studente

BIN = 15 um l [um] Minimum um. Data_31misure_ l [um] Maximum Points 102, , um 1.3 um

Regressione Lineare Semplice e Correlazione

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

o Si sceglie il modello che meglio si adatta alla realtà osservata, cioè quello per il quale risulta più probabile la realtà osservata.

Statistica4-29/09/2015

Transcript:

Tutta la scienza è fondata sulle misure (Helmholtz)

L acquisizione di una osservazione come DATO SCIENTIFICO richiede che : osserviamo un fenomeno lo quantifichiamo correttamente lo confrontiamo con altri fenomeni lo interpretiamo correttamente con criteri precisi DATI + METODI STATISTICI INFORMAZIONI

Arrotondamento dei dati 27.434 27.43 27.4 21.467 21.47 21.5 Il numero di cifre significative non può essere superiore alla precisione dello strumento, che dipende dalle caratteristiche tecniche dello strumento

Rappresentazioni grafiche di frequenza di un evento: il grafico dei dati in funzione del tempo 100 90 80 70 60 50 40 30 20 10 0 1 Trim. 2 Trim. 3 Trim. 4 Trim.

Rappresentazioni grafiche di frequenza di un evento: L istogramma a barre SI NO 100 90 80 70 60 50 40 30 Est Ovest Nord 90 80 70 60 50 40 30 Est Ovest Nord 20 10 0 1 Trim. 2 Trim. 3 Trim. 4 Trim. 20 10 0 1 Trim. 2 Trim. 3 Trim. 4 Trim.

Rappresentazioni grafiche di frequenza di un evento: il diagramma a torta 13% 57% 13% 17% 1 Trim. 2 Trim. 3 Trim. 4 Trim.

La probabilità p che un evento si verifichi può essere definita come la proporzione di volte in cui l evento avviene su un numero totale di prove sufficientemente grande. 0 < p < 1 In una determinazione di una grandezza, la misura tanto più si avvicina all evento certo (p = 1) quanto più grande è il numero di volte in cui la misura è ripetuta (n) e cioè tanto più la media osservata x delle n misure è vicina alla media vera ( ).

ATTENZIONE : il numero di osservazioni (misure) deve essere sempre e comunque n > 3 la curva BINOMIALE dell ERRORE è una gaussiana x

Per un n sufficientemente grande, la distribuzione degli errori è una gaussiana la cui media è il valore vero x =

L ampiezza della gaussiana può dipendere dallo sperimentatore, dallo strumento e dalla variabilità del fenomeno misurato. x =

Per essere sottoposto ad una analisi statistica il fenomeno deve essere : osservato in circostanze omogenee ripetibile (riproducibile) variabile La descrizione della variabilità del fenomeno è lo scopo della statistica

MISURE DI DISPERSIONE O DI VARIABILITA' Servono a esprimere il grado di variabilità o dispersione attorno al valore medio. Naturalmente le fonti di variabilità possono essere tante e si suole raggrupparle in tre grandi gruppi: variazione biologica temporale errori di misura.

SORGENTI DI VARIAZIONE In medicina e biologia le misure cliniche quantitative sono esposte a tre tipi fondamentali di variazione: 1) biologica: tutti i fattori che rendono diversi i vari individui: età, sesso, razza, dieta, ecc; la variazione dovuta alla variabilità biologica è detta anche "variabilità tra soggetti"; 2) temporale : tutti i fattori che determinano variazioni nello stesso individuo da un momento all'altro; 3) errore di misura: tutti i fattori che tendono a produrre differenze in misure diverse dello stesso fenomeno (strumenti di misura, errori tecnici, diversità dell'osservatore, ecc); tale variabilità è detta anche "variabilità entro soggetti". L'analisi della varianza è la tecnica statistica che permette di disaggregare la varianza totale in due componenti: quella inter-soggetti e quella intra-soggetti.

Dati scientifici richiedono l indicazione di parametri statistici (ad.es. media + DS) 45 40 35 30 25 20 15 10 5 0 controllo + ABC + DEF + GHI cuore fegato rene Media aritmetica : x = Deviazione standard : (x i - x) 2 n - 1 x i n controllo + ABC + DEF + GHI cuore 10 + 2.8 20 + 3.7 35 + 3.2 40 + 1.8 fegato 7 + 1.9 9 + 3.0 8 + 2.1 7.5 + 1.2 rene 15 + 4.9 13 + 1.2 14 + 3.0 16 + 1.5

Dati scientifici richiedono una analisi di significatività Il confronto statistico tra due serie di dati consente di valutare se quelle due serie sono significativamente diverse e con quale intervallo di confidenza. Test del t di Student Confronto delle medie Regione di accettazione Regione di rifiuto Intervallo di confidenza

p = 68.27 % p = 95.45 % p = 99.73 %

I test di significatività sono test statistici che quantificano i dati in senso di probabilità: i livelli del 5 % (0.05) e dell' 1 % (0.01) sono livelli accettati come limiti del tutto convenzionali per stabilire la significatività di uno scarto dall'ipotesi zero. Il livello di 5 % sta ad indicare che ci sono 95 probabilità su 100 che il mio campione non derivi dalla popolazione, cioè che sia diverso. Tuttavia, esistono sempre 5 probabilità su 100 che tali differenze siano casuali e che quindi il campione derivi dalla popolazione.

IL TEST DI STUDENT Si parte dal presupposto che il nostro campione discenda dalla popolazione: e' questa la ipotesi nulla o zero (H o ); l'ipotesi nulla è vera quando campione e popolazione coincidono; invece l'ipotesi nulla è falsa o rigettata quando campione e popolazione non coincidono (H 1 ipotesi alternativa).

POPOLAZIONE (UNIVERSO) H0 H1 CAMPIONE H0 Esatto (vero neg) (non ci sono diff) Errore (falso neg) H1 Errore (falso pos) Esatto (vero pos) (ci sono diff.)

L'errore alfa (detto anche di I tipo) prende per valide differenze che in realtà (nell'universo) non esistono. Le tecniche per ridurre l'errore alfa si chiamano "significatività". L'errore beta (detto anche di II tipo) non si accorge di differenze che realmente sono presenti nell'universo. Le tecniche per ridurre l'errore beta si chiamano "potenza". E' ovvio che più aumenta il numero delle osservazioni e più si riducono gli errori alfa e beta.

Un qualsiasi test di significatività non può mai provare con certezza che una ipotesi zero è vera o falsa; esso può solo fornire una indicazione della forza con cui i dati contrastano l'ipotesi zero.

Quando si conosce solo la media di un piccolo campione rispetto ad una grande popolazione, di cui non si conosce la deviazione standard vera, si può individuare l intervallo di confidenza, utilizzando il n = 2 Test del 2 n = 4 n = 6 n = 10 Distribuzione del 2 in funzione di n

Il chi quadro indica la misura in cui le frequenze osservate in ogni casella della tabella differiscono dalle frequenze che ci aspetteremmo se non ci fosse associazione fra i contenuti che definiscono le righe e le colonne. In altre parole verifica se esiste una relazione fra la variabile che distingue le righe e la variabile che distingue le colonne.

Lo scopo del test χ² è quello di conoscere se le frequenze osservate differiscono significativamente dalle frequenze teoriche. Se χ² = 0, le frequenze osservate coincidono esattamente con quelle teoriche. Se χ² > 0, esse differiscono. Più grande è il valore di χ², più grande è la discrepanza tra le frequenze osservate e quelle teoriche.

Ad esempio : 45 40 35 30 25 20 15 10 5 0 * * * controllo + ABC + DEF + GHI cuore fegato rene * significativamente diverso dal controllo, p > 0.01 controllo + ABC + DEF + GHI cuore 10 + 2.8 20 + 3.7 35 + 3.2 * 40 + 1.8 fegato 7 + 1.9 9 + 3.0 8 + 2.1 7.5 + 1.2 rene 15 + 4.9 13 + 1.2 14 + 3.0 16 + 1.5 * *

La correlazione lineare E' una procedura statistica parametrica (e quindi usa variabili ad intervalli con distribuzione "normale") che studia le relazioni che intercorrono tra 2 variabili. Quando la funzione che le lega è di primo grado (y=a+bx) la relazione è di tipo lineare.

Se vogliamo descrivere la forza della relazione fra le due variabili si calcola il coefficiente di correlazione "r" di Pearson, che è un numero compreso fra -1 e +1. Tanto più è stretta la relazione tanto più "r" è prossimo a 1 (in valore assoluto); se è vicino a 0 la relazione è inesistente.

E' importante ricordare che "r" non misura un rapporto di causa-effetto tra le variabili, ma solo la forza della dipendenza lineare l'una dall'altra. Il segno di "r" indica il verso di tale associazione: positivo quando le 2 variabili variano nello stesso senso, negativo quando al crescere dell'una corrisponde il calare dell'altra. Il coefficiente "r" e' simmetrico, cioè il legame che collega X e Y è lo stesso che c è tra Y e X.

CaN activity (CPM) Calcineurin activity is oxidatively impaired in sals and fals patients 70000 60000 50000 R 2 = 0,0089 40000 30000 20000 R 2 = 0,0019 10000 0 0 20 40 60 80 100 Age (years) healthy fals sals