Statistica. V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali

Documenti analoghi
DISTRIBUZIONI DI PROBABILITA (parte 1) 1 / 19

Una variabile casuale è una variabile che assume determinati valori in modo casuale (non deterministico).

Modelli probabilistici variabili casuali

Matematica e Statistica per Scienze Ambientali

DISTRIBUZIONI DI PROBABILITA (parte 2) 1 / 27

Variabili casuali. - di Massimo Cristallo -

Richiami di TEORIA DELLE PROBABILITÀ

Modelli di probabilità

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

ES.2.2. Consideriamo un esperimento statistico definito da un insieme Ω di risultati possibili. Una partizione finita di Ω è una sequenza di K eventi

Statistica. Congiunte. Capitolo 5. Distribuzioni di Probabilità. Chap 5-1. Statistics for Business and Economics, 6e 2007 Pearson Education, Inc.

DISTRIBUZIONI DI PROBABILITA

Principi di Statistica a.a

Elementi di base su modello binomiale e modello normale

Variabili aleatorie. Variabili aleatorie e variabili statistiche

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica

Le variabili casuali o aleatorie

Costruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini. Lezione 3: Variabili aleatorie discrete notevoli

Ulteriori Conoscenze di Informatica e Statistica

esperimento casuale: è un esperimento condotto sotto l effetto del caso; evento elementare: ciascuno dei possibili esiti di un esperimento casuale;

ESERCITAZIONE N. 5 corso di statistica

PROBABILITA. Distribuzione di probabilità

Corso di Istituzioni di Matematiche con Elementi di Statistica. anno accademico 2015/2016 corso A-L (G. Gaeta & N. Bressan)

Variabile casuale E 6 E 5 E 4. R S x1 E 2

Teoria della probabilità Variabili casuali

Lezione 12. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 12. A. Iodice.

Richiami di Teoria della probabilità (I)

Ulteriori Conoscenze di Informatica e Statistica

LEZIONI DI STATISTICA MEDICA

Università del Piemonte Orientale Corsi di Laurea triennale di area tecnica. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. La distribuzione Normale (o di Gauss)

Controllo Statistico della Qualità (alcune note) A cura della Prof.ssa Paola Vicard e della Prof.ssa Flaminia Musella

Lezione n. 1 (a cura di Irene Tibidò)

DISTRIBUZIONI DI PROBABILITA (parte 3) 1 / 34

Risultati X P(X) TTT 0 1/8 TTC 1 1/8 TCT 1 1/8 CTT 1 1/8 TCC 2 1/8 CTC 2 1/8 CCT 2 1/8 CCC 3 1/8 X P(X) F(X) 0 1/8 1/8 1 3/8 4/8 2 3/8 7/8 3 1/8 1

10. VARIABILI CASUALI MULTIPLE

Variabili aleatorie. Variabili aleatorie

LE VARIABILI CASUALI A 1, A 2.,..., A k., p 2.,..., p k. generati da una specifica prova sono necessari ed incompatibili:

VARIABILI CASUALI CONTINUE

Lezione 3 Calcolo delle probabilità

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Funzioni di probabilità per variabili casuali discrete e continue

Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Teoria della probabilità A.A

STATISTICA A K (60 ore)

Modelli descrittivi, statistica e simulazione

Modelli descrittivi, statistica e simulazione

Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazion

Variabili aleatorie discrete. Giovanni M. Marchetti Statistica Capitolo 5 Corso di Laurea in Economia

Esercitazione 1 del corso di Statistica (parte 2)

Alcune v.a. discrete notevoli

FENOMENI CASUALI. fenomeni casuali

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari"

Statistica. Lezione : 17. Variabili casuali

STATISTICA: esercizi svolti sulle VARIABILI CASUALI

Esercitazioni di Statistica

Lezione 13 Corso di Statistica. Domenico Cucina

STATISTICA 1 ESERCITAZIONE 8

Probabilità: teoremi e distribuzioni

Distribuzione di Probabilità

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

PROBABILITÀ SCHEDA N. 3 VARIABILI ALEATORIE BINOMIALE E NORMALE. 1. La variabile aleatoria di Bernoulli e la variabile aleatoria binomiale

STATISTICA A D (72 ore)

Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Teoria della probabilità A.A

Distribuzioni e inferenza statistica

Statistica Inferenziale

Probabilita' mediante l'analisi combinatoria D n,k =Disposizioni di n oggetti a k a k (o di classe k)

PROVA SCRITTA DI STATISTICA (COD COD ) 7 luglio 2005 APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE SOLUZIONI MODALITÀ A

Statistica Sociale e Criminale (12 CFU) A.A. 2015/2016

Statistica. Lezione 4

Introduzione alla probabilità

Soluzione Esercizio 1 (pag 1):

Elaborazione statistica di dati

LEZIONE 2.6. corso di statistica. Francesco Lagona Università Roma Tre. LEZIONE 2.6 p. 1/15

Variabile casuale Normale

2. Introduzione alla probabilità

Statistica Applicata all edilizia: alcune distribuzioni di probabilità

Statistica. V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità.

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità.

1 4 Esempio 2. Si determini la distribuzione di probabilità della variabile casuale X = punteggio ottenuto lanciando un dado. Si ha immediatamente:

Capitolo 6 La distribuzione normale

Variabili aleatorie continue: la normale. Giovanni M. Marchetti Statistica Capitolo 6 Corso di Laurea in Economia

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

1! 4! = 5. Quindi la probabilità di ottenere 1 successo su 5 lanci sarà 5 2 = 5! 2! 3! = 10

Il campionamento e l inferenza. Il campionamento e l inferenza

Variabili aleatorie continue

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano

un elemento scelto a caso dello spazio degli esiti di un fenomeno aleatorio;

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1

Università del Piemonte Orientale. Corso di laurea in biotecnologie. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità.

RICHIAMI DI STATISTISTICA E CALCOLO DELLE PROBABILITA

La media campionaria. MEDIA CAMPIONARIA Date n v.a. X 1,..., X n indipendenti e identicamente distribuite (in breve i.i.d.), la v.a.

Capitolo 6. La distribuzione normale

Prova intercorso di laboratorio di Fisica I AA Matricole Pari 07-apr-16. Esercizi preparatori tipici

Esercitazione 5 del corso di Statistica 2 Prof. Domenico Vistocco

Transcript:

Elementi di Inferenza Statistica Variabili casuali V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali Soriano nel Cimino (VT), 6 Ottobre 2009 Pier Francesco Perri Dipartimento di Economia e Statistica - UNICAL pierfrancesco.perri@unical.it perri@unical it

Il concetto di variabile casuale La definizione i i classica di probabilità bilità fa riferimento i a fenomeni aleatori i cui possibili risultati formano lo spazio campionario La descrizione degli eventi passa attraverso la formulazione di espressioni verbali che, in quanto tali, risultano poco idonee per essere trattate matematicamente Può essere utile, in tal senso, ``quantificare gli eventi'', ovvero considerare come possibili risultati di un esperimento casuale non n più gli eventi - descritti tramite espressioni ssi del linguaggio comune - bensì un insieme di numeri reali, in corrispondenza con gli eventi, mediante i quali la loro trattazione diventa più spedita. 2

Il concetto di variabile a casuale Questa esigenza genera il concetto di variabile casuale (v.c.) con il quale si suole indicare una quantità variabile il cui valore è determinato dal risultato di un esperimento casuale. Questo legame di dipendenza del valore della variabile casuale dall'esito di un esperimento evoca l'idea di funzione: Variabile Casuale Una variabile casuale è la misura numerica del risultato di un esperimento (fenomeno) casuale. Definire una variabile casuale significa associare, secondo una determinata regola, un numero ad ogni risultato dell esperimento esperimento. 3

Il concetto di variabile a casuale Variabile Casuale Discreta Una variabile casuale è detta discreta se può assumere un numero finito o un infinità numerabile di valori. E utilizzata per descrivere fenomeni che prevedono un operazione di conteggio 4

Il concetto di variabile a casuale

Variabile a casuale: esempio Consideriamo il lancio di tre monete regolari. Se in corrispondenza di ogni possibile risultato conteggiamo il numero di volte che appare testa, avremmo definito la variabile casuale X: ``numero di teste uscite''. La situazione può essere schematizzata nel seguente prospetto Spazio campionario Valori di X Probabilità ω 1 ={TTT} 3 1/8 ω 2 ={TTC} 2 1/8 ω 3 ={TCC} 1 1/8 ω 4 ={CCC} 0 1/8 ω 5 ={CTC} 1 1/8 ω 6 ={CTT} 2 1/8 ω 7 ={CCT} 1 1/8 ω 8 ={TCT} 2 1/8

Distribuzione di probabilità La v.c. X: numero di teste uscite assume 4 diversi valori: 0,1,2,3. Se tali valori si organizzano in un prospetto associando ad ognuno di essi la probabilità del loro verificarsi, si costruisce la distribuzione di probabilità della v.c. in esame Valori di X 0 1 2 3 P(X=x) 1/8 3/8 3/8 1/8 Le probabilità sono tutte comprese tra 0 e 1 e la loro somma è pari 1 Qual è la probabilità di osservare almeno una testa? Qual è la probabilità di osservare meno di tre teste? Quante teste mediamente si osservano lanciando tante volte le tre monete?

Distribuzione di probabilità In generale, data una v.c. discreta X che può assumere i valori (distinti) x 1,x 2,,x k la sua distribuzione di probabilità è definita tramite una funzione P(.), detta funzione di probabilità che associa ad ogni singolo valore x 2 la sua probabilità Valori di X x 1 x 2 x i x k P(X=x i ) p 1 p 2 p i p k La funzione P(.) viene espressa tramite un modello matematico Media di X k k 2 x xp 2 i i σ x = xi μx pi i = 1 i = 1 μ = Varianza di X ( ) 2 2 Deviazione i standard d di X σ x = σx

La v.c. Binomiale Il risultato di molti esperimenti casuali è spesso di tipo binario e i due possibili esiti (complementari) vengono generalmente detti successo e insuccesso. Unesperimentodiquestotipoèdettobernulliano. Esperimento Lancio di una moneta Analisi clinica Sostenimento di un esame Esiti (successo, insuccesso) testa, croce positivo, negativo promosso, bocciato L evento successo viene definito dal ricercatore in base alle finalità dello studio. La sua probabilità è p. La probabilità dell evento insuccesso è 1-p. Un esperimento bernulliano viene espresso tramite la v c Un esperimento bernulliano viene espresso tramite la v.c. di Bernoulli che presenta media p e varianza p(1-p).

La v.c. Binomiale Supponiamo ora di ripetere n-volte un esperimento bernulliano e di volere determinare la probabilità di osservare un certo numero di successi. La v.c. Binomiale consente di modellare tali probabilità, sotto determinate ipotesi di lavoro: 1. Le condizioni sperimentali rimangono invariate nel corso del ripetersi dell esperimento, ovvero la probabilità di successo p non muta da esperimento ad esperimento 2. Gli esperimenti bernulliani sono indipendenti, ovvero l esito lesito di un esperimento non influenza in nessun modo quello che potrà essere il risultato di un altro esperimento

La v.c. Binomiale Variabile Casuale Binomiale Sia p la probabilità di successo in un esperimento benulliano e sia X la v.c. discreta numero di successi in n esperimenti benulliani, X=0,1,,n. La funzione di probabilità della v.c. X è data da: dove n x n x P( X = x) = p ( 1 p), x = 0, 1,..., n x n n!, n n ( n 1) ( n 2)... 2 1 x = = ( n x)! x!

La v.c. Binomiale: esempio Un test di cultura generale è composto da 10 domande ciascuna a riposta multipla l con 4 alternative ti di cui solo una corretta. Il test si considera superato se si risponde correttamente ad almeno 6 domande. Qual è la probabilità che un soggetto completamente ignorante degli argomenti oggetto d esame superi il test con il minimo sforzo rispondendo casualmente alle domande? Esperimento bernulliano: rispondere ad una domanda multipla Evento successo: risposta corretta Probabilità di successo: p=0.25 Numero di esperimenti bernulliani: n=10 risposte multiple X~Bin(10, 0.25)

La v.c. Binomiale: esempio Siamo interessati a determinare la probabilità di rispondere correttamente a 6 domande, ovvero P(X=6): n x P( X = x) = p ( 1 p) x n x 10 P X = = = 6 6 10 6 ( 6) 0.25 (1 0.25) 0.016 Di contro, la probabilità che il test non venga superato è pari a: P(X<6)=P(X=0)+P(X=1)+.+P(X=5)=0.996

La v.c. Binomiale: esempio Potremmo anche essere interessati a determinare il numero medio di risposte corrette che un soggetto darebbe se ripetesse il test più volte. L aspettativa della v.c. Binomiale è pari a np mentre la sua varianza la si ottiene come np(1-p) Nel nostro esempio, il numero medio di risposte corrette è μ= 10 * 0.25 025 = 25 2.5 La deviazione standard è invece σ = 10 * 0.25 * 0.75 = 1.37 Qual è il significato dei valori ottenuti?

La v.c. Binomiale con MS Excel I calcoli necessari per determinare le probabilità di una v.c. Binomiale possono essere facilmente realizzati tramite MS Excel eseguendo alcune semplici operazioni: 1. Si apre un foglio di lavoro 2. Si posiziona il cursore su una cella 3. Dalla barra dei comandi si inserisce una funzione Inserisci funzione ( ) Statistiche DISTRIB.BINOM 4. Si specificano gli argomenti della funzione

16

17

18

19

Variabili casuali continue Variabile Casuale Continua Una variabile casuale è detta continua se può assumere qualunque valore in un intervallo numerico. E utilizzata per descrivere fenomeni che prevedono un operazione di misurazione La distribuzione di probabilità è specificata da una curva (funzione di densità) ) che consente di determinare la probabilità che la v.c. assuma valori in un prefissato intervallo Ogni intervallo ha una probabilità compresa tra 0 e 1 ed è l area sotto la curva nell intervallo L intervallo contenente tutti i possibili valori della v.c. ha probabilità 1, ovvero l area sotto la curva è pari a 1 20

Variabili casuali continue P(a X b) Probabilità = Area P(X c) a b c

La v.c. Normale La v.c. Normale svolge un ruolo di primaria importanza in Statistica: 1. fornisce una ragionevole approssimazione di molti fenomeni aleatori 2. rappresenta la distribuzione limite di altre v.c. 3. è essenziale nelle procedure inferenziali E di natura continua e la forma della sua distribuzione è unimodale simmetrica intorno alla media campanulare determinata dalla media e dalla varianza

La v.c. Normale Non esiste una sola Normale ma tante curve a seconda della media e della varianza Stessa varianza ma media diversa µ=-15 µ=10 µ=50 σ 2 =100

La v.c. Normale Stessa media ma varianza diversa σ 2 =25 σ 2 =49 σ 2 =100

Come calcolare le probabilità La variabile casuale Normale viene identificata attraverso la sua media e varianza: 2 X ~ N ( μ, σ ) elaprobabilitàcheessaassumaunvalorecompresotraaeb è l area sottesa alla curva nell intervallo (a,b). Il calcolo semplificato di una probabilità passa attraverso la definizione fnzon della v.c. Normale Standarizzata ar Z = X μ σ la cui distribuzione è Normale con media zero e varianza unitaria i

Come calcolare le probabilità Il quoziente di intelligenza (IQ) ha una distribuzione normale con media 100 e deviazione standard 16 età mentale IQ = 100 * età anagrafica

Qual è la percentuale di persone con IQ molto basso? X 100 70 100 P ( X < 70) = P < = P ( Z < 1.875) 16 16 =Φ( 1.875) = 1 Φ (1.875) = 1 0.9696 = 0.0304 3% 70 rappresenta il 3 percentile della distribuzione

Qual è la percentuale di persone con IQ molto basso? X 100 70 100 P ( X < 70) = P < = P ( Z < 1.875) 16 16 =Φ( 1.875) = 1 Φ (1.875) = 1 0.9696 = 0.0304 3%

Qual è la percentuale di persone con IQ molto alto? P ( X > 130) = 1 P ( X < 130) = 1 0.9696 = 0.0304 3% X~ N(100,16 2 )

Qual è la percentuale di persone con IQ normale? 110 100 90 100 P (90 < X < 110) = Φ Φ = Φ (0.625) Φ( 0.625) 16 16 = 2 * Φ(0.625) 1 = 2 * 0.734 1 = 0.468 46.8% Z~ N(0,1)

P (90 < X < 110) = 0.468 31

L ipotesi di Normalità Numerose procedure statistiche ti ti si basano sull assunto che il fenomeno in esame abbia una distribuzione Normale. L applicazione indiscriminata di metodi statistici che richiedono l ipotesi di normalità conduce a risultati non conformi alla realtà quando i dati osservati non suffragano tale ipotesi. Verificare la normalità di un fenomeno è quindi presupposto essenziale per la corretta applicazione dei metodi statistici. A tal fine esistono diversi criteri: intervalli tipici, supporto grafico, verifica di ipotesi 32

Intervalli tipici Sotto l ipotesi di normalità è agevole definire le seguenti probabilità: P ( μ σ< X <μ+σ ) = 068 0.68 P( μ 2σ < X < μ+ 2 σ ) = 0.95 P( μ 3σ < X < μ+ 3 σ ) = 0.997 Regola empirica per verificare se i dati osservati supportano l ipotesi i di normalità 33

PP-Plot QQ-Plot 34 Istogramma Metodi grafici

PP-Plot QQ-Plot 35 It Istogramma

Accertare la normalità tramite SPSS Dati 36

37

E possibile sovrapporre la curva normale ad un istogramma scegliendo l opzioni con curva normale oppure visualizza la curva normale Statistiche descrittive 38

E anche possibile sovrapporre una qualsiasi curva ad un istogramma. Dopo aver visualizzato l istogramma nel file di output, occorre attivare l editor dei grafici cliccando due volte sul grafico stesso 39