Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)



Documenti analoghi
E naturale chiedersi alcune cose sulla media campionaria x n

Slide Cerbara parte1 5. Le distribuzioni teoriche

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Inferenza statistica. Statistica medica 1

SPC e distribuzione normale con Access

La distribuzione Normale. La distribuzione Normale

La distribuzione Gaussiana

LA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di

Analisi di dati di frequenza

La variabile casuale Binomiale

Statistica inferenziale

Tasso di interesse e capitalizzazione

Misure della dispersione o della variabilità

Facciamo qualche precisazione

Probabilità II Variabili casuali discrete

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

Elementi di Psicometria con Laboratorio di SPSS 1

Matematica generale CTF

Test statistici di verifica di ipotesi

Prova di autovalutazione Prof. Roberta Siciliano

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010


Elementi di Psicometria

Elementi di Psicometria con Laboratorio di SPSS 1

STATISTICA ESERCITAZIONE 11 Dott. Giuseppe Pandolfo 3 febbraio Modelli continui di probabilità: la v.c. uniforme continua

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

8 Elementi di Statistica

ELEMENTI DI CALCOLO DELLE PROBABILITA

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Lezione n. 2 (a cura di Chiara Rossi)

Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V

Anno 3. Funzioni: dominio, codominio e campo di esistenza

Il Controllo Interno di Qualità dalla teoria alla pratica: guida passo per passo IL MODELLO TEORICO. Pasquale Iandolo

FONDAMENTI DI PSICOMETRIA - 8 CFU

Statistica. Lezione 6

Il concetto di valore medio in generale

I punteggi zeta e la distribuzione normale

ESERCIZI DI STATISTICA DESCRITTIVA

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it

= variazione diviso valore iniziale, il tutto moltiplicato per 100. \ Esempio: PIL del 2000 = 500; PIL del 2001 = 520:

ANALISI DELLE FREQUENZE: IL TEST CHI 2

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

Introduzione alle relazioni multivariate. Introduzione alle relazioni multivariate

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE

Elementi di Psicometria con Laboratorio di SPSS 1

1. Distribuzioni campionarie

Lezione 6: Forma di distribuzione Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Probabilità e statistica

13. Campi vettoriali

4 3 4 = 4 x x x 10 0 aaa

LE SUCCESSIONI 1. COS E UNA SUCCESSIONE

Capitolo 4 Probabilità

Metodi statistici per le ricerche di mercato

Esercizi test ipotesi. Prof. Raffaella Folgieri aa 2009/2010

Il calcolo letterale per risolvere problemi e per dimostrare

ORDINALI E NOMINALI LA PROBABILITÀ. Nell ambito della manifestazione di un fenomeno niente è certo, tutto è probabile.

Analisi statistica degli errori

Il confronto fra proporzioni

Indici (Statistiche) che esprimono le caratteristiche di simmetria e

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Statistiche campionarie

ELEMENTI DI STATISTICA

CORSO DI MISURE ANALISI DEI SEGNALI NEL DOMINIO DEL TEMPO

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo.

Limiti e continuità delle funzioni reali a variabile reale

Statistical Process Control

Verifica di ipotesi

Cosa dobbiamo già conoscere?

VARIABILI ALEATORIE CONTINUE

Principi generali. Vercelli 9-10 dicembre G. Bartolozzi - Firenze. Il Pediatra di famiglia e gli esami di laboratorio ASL Vercelli

CENNI DI METODI STATISTICI

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1

OSSERVAZIONI TEORICHE Lezione n. 4

matematica probabilmente

Viene lanciata una moneta. Se esce testa vinco 100 euro, se esce croce non vinco niente. Quale è il valore della mia vincita?

Istituzioni di Statistica e Statistica Economica

VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD. Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza.

1 Serie di Taylor di una funzione

Elementi di Psicometria con Laboratorio di SPSS 1

Statistica descrittiva: prime informazioni dai dati sperimentali

Probabilità discreta

Temi di Esame a.a Statistica - CLEF

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA

STATISTICA IX lezione

VERIFICA DELLE IPOTESI

VARIABILI ALEATORIE MULTIPLE E TEOREMI ASSOCIATI. Dopo aver trattato delle distribuzioni di probabilità di una variabile aleatoria, che

LEZIONE n. 5 (a cura di Antonio Di Marco)

Tema A Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che

Ricerca di outlier. Ricerca di Anomalie/Outlier

Collegamento a terra degli impianti elettrici

LE FUNZIONI A DUE VARIABILI

3. Confronto tra medie di due campioni indipendenti o appaiati

La categoria «ES» presenta (di solito) gli stessi comandi

CONDUTTORI, CAPACITA' E DIELETTRICI

2 CERTAMEN NAZIONALE DI PROBABILITA E STATISTICA FELICE FUSATO Fase di Istituto 15 febbraio 2011

1. la probabilità che siano tutte state uccise con pistole; 2. la probabilità che nessuna sia stata uccisa con pistole;

Transcript:

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a) Evento somma: si verifica A o B o entrambi p(a) + p(b) p(a&b) Evento complementare: p(ã) = 1 - p(a) Parametri descrittivi: non dimostrano nulla servono solo a descrivere il campione Media: parametro descrittivo del campione Varianza: variazione media intorno alla media, somma degli scarti al quadrato fratto n-1 gradi di libertà. Se si lavora su dati teorici si divide per n cosi come per campioni di grande numerosità dove n o n-1 si equivalgono Valore atteso: prodotto ogni valore per la sua probabilità diviso n se equiprobabili la media viene definita molte volte come valore atteso Legge dei grandi numeri: all aumentare del numero delle prove la frequenza tende al valore della sua probabilità teorica, tende a 1 ( evento certo) Percentile: 40esimo percentile in altezza = più alto del 40% della popolazione totale Mediana: 50esimo percentile Moda: punta di massima frequenza Distribuzione di probabilità: rappresentatività di tutti i valori della variabile serve per sapere se supponendo vera Ho ( ipotesi nulla ) si ha o no la possibilità di avere un determinato valore in definitiva se il valore che devo esaminare può essere considerato valore causale oppure dovuto ad una causa specifica incidente.. Lo strumento di base per capire quali sono le differenze che stanno dentro l oscillazione casuale e quelle che stanno fuori, che sono quindi ritenute dovute a uno specifico fattore, questo strumento è la distribuzione di probabilità. funzione di distribuzione è la funzione che rappresenta per ogni x la probabilità di ottenere un valore uguale o minore di X. Quindi invece di stabilire la probabilità dei diversi valori io vado a stabilire qual è la probabilità che ho di ottenere un valore minore o uguale a un certo valore X. Se la variabile è discreta ho finiti valori uguali o inferiori a X. Ciò non è possibile per una variabile continua al denominatore ho infinito e il risultato è 0 1

La funzione di distribuzione permette di calcolare un valore finito in una variabile continua. In una variabile continua la probabilità è sempre uguale a zero, nella funzione di distribuzione invece no, si hanno infiniti casi al numeratore e infiniti al denominatore e questo dà un numero finito. Se la variabile è continua la funzione di distribuzione non è più definita dalla somma delle probabilità, ma come l integrale di una certa funzione. L intergale è una somma di infiniti termini, ognuno di valore infinitesimo, è la conversione nel caso continuo della sommatoria del caso discreto (sommatoria è somma di elementi definiti). Cos è quella f(x) quando calcolo l integrale? È la densità di probabilità, che rappresenta la probabilità che il valore x cada all interno di un certo intervallo diviso la larghezza di questo intervallo. La distribuzione binomiale è la distribuzione che compete a una variabile che può essere o SI o NO o successo o insuccesso o testa o croce, compete a una variabile dicotomica (cioè che ha 2 valori). 1 n p = n 2 s n = s n! s!(n - s)! Questa formula vale solo se la probabilità di successo p e di insuccesso q sono uguali ed ognuna è uguale ad ½, quindi la loro somma sia 1. Nel caso che ciò non sia vero la formula cambia leggermente. p q s i n p= p q s La distribuzione di probabilità serve per misurare l oscillazione casuale se ottengo risultati al di là di tali parametri ( normalmente fissati al 5% di errore ) non considero il dato frutto del caso. Nella distribuzione binomiale sommo le colonne esterne simmetriche che mi devono dare un risultato inferiore al 5% La distribuzione binomiale funziona solo se io considero il verificarsi di 1 evento dicotomico i cui risultati possono essere solo il verificarsi o il non verificarsi di quell evento. La realtà è che nella ricerca non è sempre così, ci sono volte in cui i valori possono essere tanti, ad esempio se prendo l altezza. La distribuzione binomiale è la discretizzazione, cioè la conversione in valori discreti, di un'altra distribuzione relativa ad una variabile continua (che è fondamentale in statistica), ed è la distribuzione normale o distribuzione di Gauss. La distribuzione gaussiana o normale è la distribuzione di una variabile continua, è l estensione della binomiale al caso continuo. Numero pari di prove ho un picco, dispari due La distribuzione normale è anche definita come curva degli errori. CURVA DEGLI ERRORI Condizioni: un errore è la somma di molte componenti di uguale ampiezza le diverse componenti sono fra loro indipendenti ciascuna componente è positiva o negativa con uguale probabilità allora l'ampiezza dell'errore ha una distribuzione normale 2

L entropia in statistica, poiché misura il disordine, è una misura del caso. In statistica più alta è l entropia, più alto è il disordine, più alta è l incidenza del caso. La distribuzione gaussiana è la distribuzione di una variabile caratterizzata dal fatto di avere la massima entropia possibile. La distribuzione normale è la distribuzione del caso per eccellenza Cosa importante: una variabile a distribuzione binomiale ha una media e una varianza ben definite, la media è data da n*p dove n è il numero di prove e p è la probabilità ad es. di successo. La varianza invece è data da n*p*q, dove q è la probabilità dell insuccesso. Questi due valori sono relativi a una distribuzione teorica, siamo in casi teorici. La media sia che riguardi valori teorici che sperimentali si calcola nello stesso modo, la varianza no, se la calcolo per valori teorici va divisa per n non per (n-1). Una generica variabile normale con media m e varianza s² è indicata con N(m,s²) e la sua densità Per standardizzare la curva gaussiana ottenuta dal mio esperimento e compararla con altre devo trovare il valore z normalizzato siparagona con la curva g. standard N = ( 0,1 ) Zeta = X mi / sigma Il punto cruciale è che per trovare il punto zeta devo sapere la media e la varianza teorica Vedi QI media 100 varianza 15 La distribuzione X quadro è la distribuzione che compete ad una somma di variabili Z elevate al quadrato la somma di variabili gaussiane o la loro divisione per una costante produce una variabile gaussiana, non il loro prodotto La varianza di variabili gaussiane hanno una distribuzione X quadro, compete alla somma di variabili gaussiane elevate al quadrato Se nei miei esperimenti non posso trovare il punto Z perché non ho una media e una varianza teorica di confronto uso il T-Test usando la media e la varianza che trovo empiricamente Il t-test ha una forma simile alla curva gaussiana solo più ampia. E più ampia perché nella distribuzione gaussiana ho soloss una variabile, la X, nella T ho tre sorgenti di variabili: la X, la media, la varianza al denominatore - la distribuzione t è la distribuzione che compete direttamente a un rapporto fra medie e deviazioni standard (radice di varianza) se io non conosco il valore teorico della varianza. - la distribuzione t ha una somiglianza molto forte con una distribuzione z, con la differenza che ha dei limiti di falsificazione più grandi. - nel momento in cui io aumento i gradi di libertà, cioè aumento la dimensione del campione, la distribuzione t tenderà sempre di più ad una gaussiana e i suoi limiti di falsificazione si avvicinano sempre di più a quelli della distribuzione z. Riepilogo dei simboli: s² è la varianza teorica s² è la varianza sperimentale s è la deviazione standard teorica s è la deviazione standard sperimentale La varianza teorica fra individui è s² mentre la varianza fra medie è s²/n, perché la varianza o meglio la deviazione standard è una misura dello scarto medio tra il soggetto e la media del gruppo 3

La distribuzione f di Fisher è il rapporto fra due o più X quadro e ha una distribuzione asimmetrica come la variabile X quadro Questa distribuzione viene usata per comparare la varianza di due variabili per comparare delle varianze devo usare la F I d e a G e n e r a l e I p o t e s i S p e r i m e n t a l e F o r m u l a z i o n e H o S c e l t a C a m p i o n e c a s u a l e e i d o n e o R a c c o l t a D a t i e D e s c r i z i o n e V a r i a b i l i T e s t S t a t i s t i c o ( s t i m a d e l p a r a m e t r o ) f a l s i f i c o l ' i p o t e s i n u l l a n o n f a l s i f i c o l ' i p o t e s i n u l l a 4

Distribuzione di Ho e H 1 H H 0-4 -3-2 -1 0 1 2 3 4 5 6 7 x 1 Respingo H0 H0 vera H1 falsa errore I tipo H0 falsa H1 vera corretto Non respingo H0 corretto errore II tipo Sull errore di 1 tipo abbiamo visto che è la probabilità che essendo vera H0 io la falsifichi. L errore di 2 tipo o è la probabilità di non falsificare H0 pur essendo questa falsa. Quindi è il fallimento di dimostrazione della mia idea di base che è vera. Si utilizza il parametro 1- che è la potenza del test. Cioè è la probabilità di falsificare H0 quando questa è falsa. La potenza del test dipende da questi parametri: da H0 e da H1 (dalla loro distanza) dalla numerosità del campione dalla minima differenza apprezzabile dalla varianza casuale 5