TRACCIA DI STUDIO. Insiemistica. Operazioni tra insiemi

Documenti analoghi
3.1 La probabilità: eventi e variabili casuali

FENOMENI CASUALI. fenomeni casuali

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

SCHEDA DIDATTICA N 7

Alcune v.a. discrete notevoli

Introduzione al Calcolo delle Probabilità

Tipi di variabili. Indici di tendenza centrale e di dispersione

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari"

Esercitazione: La distribuzione NORMALE

Lezione 3 Calcolo delle probabilità

DISTRIBUZIONI DI PROBABILITA

Esercizi su variabili aleatorie discrete

1. Descrivere gli spazi campionari dei seguenti esperimenti casuali: 1. lancio di un dado 2. lancio di due dadi 3.

NOZIONI DI CALCOLO DELLE PROBABILITÀ

Statistica ARGOMENTI. Calcolo combinatorio

Lezione 12. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 12. A. Iodice.

Statistica Inferenziale

Compiti tematici dai capitoli 2,3,4

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

C.I. di Metodologia clinica

STATISTICA: esercizi svolti sulle VARIABILI CASUALI

Statistica. Lezione 4

Probabilità e Distribuzione Normale Lezione 3

LA DISTRIBUZIONE NORMALE (Vittorio Colagrande)

DISTRIBUZIONE NORMALE (1)

MATEMATICA. a.a. 2014/15

Teorema del limite centrale TCL

Ψ PSICOMETRIA. Corso di laurea triennale (classe 34) STATISTICA INFERENZIALE

1 4 Esempio 2. Si determini la distribuzione di probabilità della variabile casuale X = punteggio ottenuto lanciando un dado. Si ha immediatamente:

Scopo del Corso: Lezione 1. La Probabilità. Organizzazione del Corso e argomenti trattati: Prerequisiti:

Sperimentazioni di Fisica I mod. A Statistica - Lezione 3

Ulteriori Conoscenze di Informatica e Statistica

Variabili casuali. - di Massimo Cristallo -

Corso di Statistica. Distribuzioni di probabilità per variabili casuali discrete. Prof.ssa T. Laureti a.a

Esercizi sulle distribuzioni di probabilità.

Vedi: Probabilità e cenni di statistica

ESERCIZI SU EVENTI E VARIABILI ALEATORIE DISCRETE

PROBABILITA. DEFINIZIONE: Ogni singolo risultato di un esperimento casuale si chiama evento elementare

Modelli descrittivi, statistica e simulazione

LEZIONI DI STATISTICA MEDICA

Calcolo delle probabilità

La PROBABILITA è un numero che si associa ad un evento E ed esprime il grado di aspettativa circa il suo verificarsi.

Il Corso di Fisica per Scienze Biologiche

PROBABILITA. Distribuzione di probabilità

UNIVERSITÀ di ROMA TOR VERGATA

Calcolo delle Probabilità Soluzioni 1. Spazio campionario ed eventi

È l insieme di tutti i possibili esiti di un esperimento aleatorio; si indica generalmente con il simbolo.

L indagine campionaria Lezione 3

Esercizi di Calcolo delle Probabilità

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica

Il campionamento e l inferenza. Il campionamento e l inferenza

Casa dello Studente. Casa dello Studente

3) In una distribuzione di frequenza si può ottenere più di una moda Vero Falso

Distribuzione normale

Distribuzioni di probabilità

Distribuzione Normale

tabelle grafici misure di

Calcolo della probabilità

Statistica. Esercitazione 10. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice. V.C.

SOLUZIONI DEL 1 0 TEST DI PREPARAZIONE ALLA 1 a PROVA INTERMEDIA

VARIABILI ALEATORIE Una moneta equilibrata viene lanciata più volte. Qual è la probabilità che al 6 lancio:

Esercitazione n. 3 - Corso di STATISTICA - Università della Basilicata - a.a. 2011/12 Prof. Roberta Siciliano

Statistica 1 A.A. 2015/2016

Compiti tematici capp. 5,6

Distribuzione Gaussiana - Facciamo un riassunto -

CALCOLO DELLE PROBABILITA

ISTOGRAMMI E DISTRIBUZIONI:

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 2

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

esperimento casuale: è un esperimento condotto sotto l effetto del caso; evento elementare: ciascuno dei possibili esiti di un esperimento casuale;

Prova d'esame di Statistica I - Corso Prof.ssa S. Terzi

Metodi quantitativi per i mercati finanziari

CALCOLO delle PROBABILITA

Le variabili casuali o aleatorie

Soluzioni degli esercizi proposti

Variabili aleatorie discrete. Giovanni M. Marchetti Statistica Capitolo 5 Corso di Laurea in Economia

CALCOLO DELLE PROBABILITA' risultato non può essere previsto con certezza ogni risultato possibile di un esperimento

Esercizi svolti di statistica. Gianpaolo Gabutti

Distribuzioni e inferenza statistica

Calcolo delle probabilità

{ } corrisponde all uscita della faccia i-esima del dado. La distribuzione di probabilità associata ( )

Statistica. Alfonso Iodice D Enza

ESAME. 9 Gennaio 2017 COMPITO B

Esercitazione 7 del corso di Statistica (parte 1)

Probabilità delle cause:

Variabile Casuale Normale

La SCALA di Probabilità varia tra 0.00 e 1.00.

CENNI DI CALCOLO DELLE PROBABILITÀ (Vittorio Colagrande)

Esperimentazioni di Fisica 1 Elementi di Calcolo delle Probabilità

UNIVERSITÀ di ROMA TOR VERGATA

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1

STATISTICA 1 ESERCITAZIONE 8

p. 1/2 INFORMAZIONI Prossime lezioni Giorno Ora Dove 27/01 14:30 P50 29/01 14:30 Laboratorio (via Loredan) 03/02 14:30 P50 05/02 14:30 P50

Teorema del Limite Centrale

Teoria e tecniche dei test. Concetti di base

STATISTICA A K (63 ore) Marco Riani

DISTRIBUZIONI DI PROBABILITA

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)

Transcript:

TRACCIA DI STUDIO Raramente un evento si verifica con certezza o è impossibile: in genere, esiste un incertezza sul risultato in quanto legato anche all effetto del caso. Lo strumento idoneo allo studio e alla previsione dei fenomeni casuali o aleatori è rappresentato dalla teoria della probabilità. Insiemistica. Operazioni tra insiemi Il formalismo delle probabilità si richiama al concetto di insieme inteso come una collezione di elementi aventi in comune una o più caratteristiche. Un insieme può essere finito, infinito o vuoto a seconda del numero di elementi che racchiude e si rappresenta graficamente con figure geometriche mediante un diagramma di Venn. Ogni insieme può contemplare sottoinsiemi e tutti appartengono a un insieme generale che è l insieme universo o spazio campione. Con più insiemi, attraverso diverse operazioni, si possono formare particolari insiemi: unione (costituito da tutti gli elementi che appartengono ad almeno uno degli insiemi di partenza); intersezione (gli elementi devono appartenere contemporaneamente a tutti gli insiemi coinvolti nell operazione); sottrazione (comprende tutti gli elementi di un insieme con l esclusione di quelli che appartengono agli insiemi da sottrarre); prodotto (contempla le coppie di elementi derivate da tutte le possibili associazioni di ciascun elemento di un insieme con ciascun elemento dell altro). Teoria e calcolo delle probabilità La probabilità rappresenta il tentativo di quantificare la capacità di manifestarsi di un fenomeno o evento (intesa come risultato favorevole o successo dell evento). Il verificarsi di un evento semplice esclude qualsiasi altro risultato di uno stesso spazio campione: gli eventi semplici sono quindi tra loro incompatibili, o mutuamente esclusivi, ed esaustivi perché esauriscono tutto lo spazio campione. La teoria della probabilità si basa sulla frequenza relativa di successi dell evento considerato e quindi viene espressa in valori relativi o percentuali: la probabilità zero si riferisce all evento impossibile e la probabilità uno (o cento) all evento certo. Associando a ciascun evento la probabilità di successo, la somma delle probabilità di tutti gli eventi di uno spazio campione corrisponde a uno. Gli eventi composti contemplano l associazione di più eventi semplici; il calcolo delle loro probabilità segue due regole fondamentali: principio della somma: la probabilità di più eventi mutuamente esclusivi si ricava come somma delle singole probabilità (si basa sul concetto di unione di insiemi); principio del prodotto: la probabilità di eventi che si devono verificare tutti (in contemporaneità o in successione) si ottiene come prodotto delle singole probabilità (si basa sul concetto di intersezione di insiemi). Occorre inoltre distinguere tra: probabilità indipendenti: il risultato di un evento non coinvolge il risultato di un altro evento (gli eventi sono tra loro indipendenti); probabilità condizionate: il risultato di un evento modifica lo spazio campione dei risultati e quindi la probabilità di successo di altri eventi (gli eventi sono tra loro dipendenti). Il principio del prodotto permette anche di verificare se due eventi siano tra loro indipendenti. Distribuzioni di probabilità L insieme delle probabilità di tutti i possibili risultati di un evento composto, basato sulle ripetizioni (o prove) indipendenti di un evento semplice, rappresenta una distribuzione di probabilità. Le principali distribuzioni sono: per variabili casuali discrete: distribuzione binomiale. In questo caso, un singolo evento può avere solo due risposte (successo/insuccesso, sì/no, sano/malato). Tale distribuzione è definita dalla probabilità di successo del singolo evento semplice e dal numero di prove effettuate; essa tende a diventare simmetrica all aumentare del numero delle prove; distribuzione di Poisson. Consiste in una semplificazione della binomiale quando la probabilità di successo dell evento semplice è molto bassa e il numero di prove elevato. È sufficiente la media per definirla;

per variabili casuali continue: distribuzione gaussiana. Si tratta di un caso limite della binomiale, che per un numero teoricamente infinito di prove diventa continua. Di elezione per molte variabili biologiche quantitative, è definita da media e deviazione standard (o varianza); la distribuzione presenta una forma a campana simmetrica intorno alla media con media, moda e mediana coincidenti. Permette di stabilire la probabilità di riscontrare valori entro un determinato intervallo, ma i calcoli risultano complessi; distribuzione z (gaussiana standardizzata). Qualsiasi gaussiana può essere convertita, mediante una semplice trasformazione di variabile, in un unica distribuzione adimensionale con media zero e deviazione standard (e varianza) uno. Di questa distribuzione esistono tabelle predisposte che permettono, con semplici calcoli, di stabilire la probabilità di osservare casualmente valori entro un intervallo prescelto. In particolare, si considerano due intervalli importanti sotto l aspetto statistico: il 95% dei valori della distribuzione sono compresi tra 1.96z e 1.96z, e il 99% tra,58z e,58z. ESERCIZI 1. Sotto l aspetto probabilistico, come si possono definire gli eventi sano e malato?. Due eventi sono indipendenti quando si escludono a vicenda. Vero? 3. Gli eventi sesso e gruppo sanguigno 0 sono eventi indipendenti. Vero o falso? 4. In un indagine tra il personale sanitario, i dipendenti di sesso femminile sono stati classificati secondo lo stato civile (C coniugata e N non coniugata, separata, vedova) e il titolo di studio (0 licenza media inferiore, 1 licenza media superiore, diploma professionale, 3 laurea, 4 laurea e specializzazione). Definire lo spazio campione per la scelta a caso di una dipendente tra: a) tutti i soggetti di sesso femminile; b) tutte le dipendenti non coniugate; c) tutte le dipendenti almeno laureate. 5. In un reparto ospedaliero, sono ricoverati 39 pazienti (R): 19 con la patologia M 1, 3 con la patologia M e 8 con entrambe. Quanti sono i ricoverati per altre patologie e qual è la probabilità di selezionarne casualmente uno? 6. Una scatola contiene palline bianche e 5 palline gialle. Si estrae a caso una pallina e, al suo posto, viene messa nella scatola una pallina dell altro colore. Le palline vengono rimescolate e un altra pallina viene estratta a caso. Calcolare la probabilità che essa sia bianca.. In una classe formata da 15 maschi e 9 femmine vengono scelti a caso 4 studenti per essere interrogati. Qual è la probabilità che i primi tre siano maschi e il quarto femmina? 8. Un urna contiene 3 palline bianche, 4 nere e 13 gialle. Estraendone a caso simultaneamente, calcolare la probabilità che siano entrambe dello stesso colore. 9. In tabella sono stati organizzati i dati riferiti a quante volte in un anno sono state ricoverate 650 persone.

N. ricoveri N. individui % 1 1490. 10 33.0 3 105 15.6 4 1150 1.5 5 500.6 6 160.4 58 0.9 8 10 0. 9 0.1 Totale 650 100 Calcolare la probabilità che un individuo scelto a caso sia stato ricoverato: a) o 3 volte; b) un numero pari di volte; c) meno di 3 o almeno. 10. Dimostrare che i possibili risultati della somma ottenuta dal lancio di due dadi non sono equiprobabili. 11. Si lancia quattro volte di seguito una moneta. a) Qual è la probabilità di ottenere testa solamente al primo lancio? b) Qual è la probabilità di ottenere almeno tre teste? c) Come possiamo definire l insieme delle probabilità dei possibili risultati del lancio? d) Quante teste ci possiamo aspettare? 1. Qual è la probabilità che un individuo, estratto a caso da una popolazione con peso medio kg e deviazione standard 5 kg, pesi tra 60 e 80 kg? 13. Per quali valori una distribuzione gaussiana raggiunge l asse delle ascisse? 14. Usando la tabella della distribuzione gaussiana standardizzata, calcolare l area inferiore a, superiore a 1 e compresa tra 3 e 3. Quale significato è possibile attribuire ai valori trovati? RISPOSTE 1. Sano e malato sono modalità della mutabile qualitativa stato di salute. Si tratta di eventi semplici, mutuamente esclusivi ed esaustivi perché insieme esauriscono lo spazio campione.. È falso. Non si deve confondere il concetto di indipendenza con quello di mutua esclusività. Due eventi sono indipendenti quando il verificarsi di uno non influenza la probabilità di verificarsi dell altro: il risultato di un test diagnostico di un paziente non può influenzare il risultato del test di un altro paziente; sono mutuamente esclusivi quando un evento esclude la possibilità che si verifichi l altro: il risultato positivo di un test esclude il risultato negativo (indipendentemente dalla correttezza della refertazione). 3. Vero. Si presume che il sesso non influenzi il gruppo sanguigno di un soggetto. Sesso e gruppo sanguigno 0 danno luogo a eventi composti con le intersezioni (M 0) e (F 0), mutuamente esclusive, come spazio campione. L indipendenza tra le due variabili è verificata se P(0) P(M 0) e di conseguenza P(0) P(F 0), cioè se la percentuale generale di soggetti con gruppo 0 è la stessa di quella presentata dai soli maschi e dalle sole femmine.

4. La soluzione più semplice si ottiene facendo riferimento al prodotto degli insiemi stato civile e titolo di studio riferito alle sole femmine. Nel quadro che si ottiene, vengono evidenziati gli spazi campione da utilizzare per le scelte. Da notare che si tratta di situazioni condizionate che riducono lo spazio campione: infatti, a) è condizionata dal sesso, b) dallo stato civile e c) dal titolo di studio. Stato civile C N a C0 C1 C C3 C4 c b N0 N1 N N3 N4 0 1 3 4 Titolo di studio 5. Problemi di questo tipo sono in genere semplificati utilizzando una soluzione grafica (diagramma di Venn). Dopo aver definito nel diagramma tutti i possibili sottoinsiemi, si inseriscono i valori numerici corrispondenti, seguendo una successione logica determinata dalle informazioni che di volta in volta diventano attribuibili senza ambiguità. In questo caso, un dato iniziale sicuro è rappresentato dal sottoinsieme dei pazienti con entrambe le patologie M 1 M 8, un secondo si ricava dal fatto che gli individui affetti solo dalla patologia M 1 devono essere M 1 \M 19 8 11 e, analogamente, gli affetti solo da M risultano M \M 1 3 8 15. La rappresentazione completa del diagramma di Venn è: Ω = R = 39 M 1 = 19 M = 3 M 1 \ M = 11 M 1 M = 8 M \ M 1 = 15 M 1 M = 5 Si perviene alla risposta al primo quesito: M 1 M R(M 1 M ) 39 (11 8 15) 5. Dal momento che una probabilità è assimilabile al successo, al verificarsi cioè dell evento considerato, rispetto a tutti i risultati possibili: P M 1 M M 1 M 3 5 0.18 1.8% 9 Il procedimento di calcolo appare utile soprattutto in riferimento a situazioni più complesse. 6. Alla prima estrazione, le probabilità di scelta sono P(B 1 ) e P(G 1) 5. Per la seconda estrazione, viene modificato lo spazio campione, quindi la seconda è condizionata dalla prima: se la prima volta è stata estratta una pallina bianca, lo spazio campione sarà diventato di una bianca e sei gialle, quindi: P(B B 1 ) 1. Nel caso di una prima estrazione gialla, il nuovo spazio campione sarà composto da tre

bianche e quattro gialle, e di conseguenza P(B G 1 ) 3. Poiché estrarre alla prima una bianca o una gialla sono eventi mutuamente esclusivi e interessa la loro unione, si applica il principio della somma. La probabilità complessiva di estrarre una pallina bianca alla seconda estrazione sarà quindi: P(B ) P(B 1 B ) P(G 1 B ) P(B 1 ) P(B B 1 ) P(G 1 ) P(B G 1 ) 1 5 3 1 5 1 0.3469 34.%. 49 49 49. Le probabilità di partenza sono: P(M) 1 5 9 e P(F) 3 ; le successive sono invece condizionate dal fatto che uno studente già interrogato non lo sarà una seconda volta nella stessa giornata, quin- 4 4 8 di viene modificato lo spazio campione. La successione obbligata delle scelte prevede una intersezione di risultati, per cui occorre applicare il principio del prodotto: P(M 1 M M 3 F 4 ) P(M 1 ) P(M M 1 ) P(M 3 M M 1 ) P(F 4 M 3 M M 1 ) 1 5 1 4 1 3 9 9.6% 4 3 1 3 4 8. Lo spazio campione è costituito da 0 palline e le probabilità iniziali sono P(B), P(N) 0 0, P(G) 1 3. 0 L estrazione di una seconda pallina determina una variazione dello spazio campione (simultaneità non significa che viene rimessa nell urna la prima pallina). P(B N G) P(B) P(N) P(G) P(B 1 ) P(B B 1 ) P(N 1 ) P(N N 1 ) P(G 1 ) P(G G 1 ) 3 4 3 1 3 1 1 4 0.459 45.8%. 0 1 9 0 1 9 0 19 380 9. Le percentuali della tabella vengono assimilate a probabilità: a) P( 3) P() P(3) 0.330 0.156 0.486 48.6% b) P( 4 6 8) P() P(4) P(6) P(8) 0.330 0.15 0.04 0.00 0.531 53.1% c) P(< 3 ) P(1) P() P() P(8) P(9) 0. 0.330 0.009 0.00 0.001 0.569 56.9% Per non introdurre errori di arrotondamento, i calcoli si potevano fare partendo dalle frequenze assolute. Per la risposta c) il valore infatti risulta, più correttamente: 1490 10 58 10 P(< 3 ) P(1) P() P() P(8) P(9) 56.8%. 650

10. Per definire lo spazio campione dei risultati, si può ricorrere a un prodotto di insiemi: 6 8 9 10 11 1 5 6 8 9 10 11 1 dado 4 3 5 6 8 9 10 4 5 6 8 9 3 4 5 6 8 1 3 4 5 6 1 3 4 dado 5 6 1 6 Da cui risulta che: P(), P(3),, P() 3 6 3 6 3 6,, P(1) 1. I risultati sono mutuamente 36 esclusivi ed esaustivi, ma non equiprobabili. 11. a) P(T) P(T) 1, quindi P(T 1 T T 3 T 4 ) P(T 1 T T 3 T 4 ) P(T 1 ) P(T ) P(T 3 ) P(T 4 ) 1 1 1 1 1. 16 b) P(almeno 3T) P(3T o4t) P(3T 4T) P(3T) P(4T). Si può verificare empiricamente (non avendo conoscenze del calcolo combinatorio) che, nei quattro lanci, tre teste si possono ottenere in quattro modi diversi (T 1 T T 3 T, 4 T 1 T T T 3 4, T 1 T T 3 T 4 et T 1 T 3 T 4 ) e quattro teste in 1 1 5 un modo solo, per cui P(3T 4T) P(3T) P(4T) 4 31.5%. 1 6 1 6 1 6 c) Si tratta di una distribuzione di probabilità per dati qualitativi dicotomici: è una distribuzione binomiale. d) Il risultato atteso di teste è la media della distribuzione x Np 4 1, alla quale si associa una variabilità s N p q 4 1 1 1. 1. La variabile è quantitativa e continua, per cui si fa riferimento alla distribuzione gaussiana standardizzata. Occorre calcolare la porzione di area compresa tra 60 e 80 kg ai cui valori corrispondono rispettivamenti i valori z 60 (60 5 ) kg kg 0.48 e z (80 ) kg 80 0.3. Un grafico della gaussiana con evidenziata la porzione di area che interessa favorisce i calcoli successivi, evitando errori. Facendo riferi- 5 kg mento alla tabella della distribuzione z, si rileva che la probabilità esterna a z 0.48 (nell uso della ta-

bella si considera il valore assoluto) nelle due code è 0.631. L area di interesse tra 0.48 e 0 risulta quindi 0.5 0.6 31. Con analogo procedimento, si calcola la porzione di area tra 0 e 0.3 e, con la somma delle due aree, si perviene alla probabilità richiesta: P(60 kg < peso < 80kg) P(z 60 < z < z 80 ) P( 0.48 < z < 0) P(0 < z < 0.3) 0.5 0.6 31 0.5 0. 49 1 0.3155 0.345 0.310 31.0%. Si poteva pervenire allo stesso risultato considerando P(z 60 < z < z 80 ) P(z > 0.48) P(z > 0.3) o, in alternativa, P(z 60 < z < z 80 ) P(z < 0.3) P(z < 0.48). 0.4 0.3 0. 5 0.1 8 3 4 9 1 14 1 kg 60 80 4 3 1 0 1 3 4 0.48 0.3 z 13. Non lo raggiunge mai. Allontanandosi dalla media, tende asintoticamente all asse (si avvicina sempre di più senza arrivare a toccarlo). In questo modo, la curva comprende qualsiasi valore, anche infinitamente piccolo o grande, e quindi il 100% delle misure teoriche. 14. Per z, l area nelle due code è 0.046; interessa solo la coda di sinistra, per cui si dimezza e diventa 0.03. Con analogo ragionamento, l area superiore a 1 risulta 0.1585. L area esterna a z 3 (in valore assoluto e quindi nelle due code) è 0.003; la porzione di area interna risulta 1 0.003 0.99. I valori trovati corrispondono alle probabilità di riscontrare casualmente una misura entro o oltre gli intervalli desiderati. Si possono riferire a misure espresse con qualsiasi scala quantitativa purché seguano una distribuzione gaussiana. Possiamo dire che la probabilità di osservare una misura inferiore a µ σ è il.3%, superiore a µ σ è circa il 16%, compresa tra µ 3σ e µ 3σ risulta il 99.%.