Corso di Statistica. Simona Iacobelli 1

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Corso di Statistica. Simona Iacobelli 1"

Transcript

1 ESERCIZI DI CALCOLO DELLE PROBABILITA Con la collaborazione della dott.ssa Giulia Sbianchi I primi 10 esercizi trattano gli argomenti principali del corso. Da notare che in uno specifico corso alcuni argomenti potrebbero essere esclusi, ad esempio l approssimazione Normale alla Binomiale, o il test diagnostico. Gli esercizi su quest ultimo sono comunque interessanti, quindi qualora l argomento compaia sulle slide delle lezioni - si consiglia di vedere i concetti relativi al test diagnostico (sensitività, specificità e valore predittivo) e seguire le soluzioni. Il livello di difficoltà degli esercizi dal numero 11 in poi è simile o appena superiore agli esercizi precedenti, e non viene seguito l ordine di presentazione degli argomenti nel corso, in maniera da abituare a riconoscere il problema (il tipo di esercizio).gli ultimi esercizi (ad es. dal numero 30) possono risultare più complessi. ES 1 Se la probabilità che in un animale sia presente un marcatore genetico G1 è pari a 13% e la probabilità che siano presenti sia il marcatore G1 che G2 è del 3%, qual è la probabilità di trovare G2 se c è G1? Dati: P(G1)=0.13 P(G1&G2)=0.03 Domande: P(G2 G1)= 0.03 / 0.13=0.23 =23% ES 2 Supponiamo che la probabilità di ammalarsi di tumore nel corso della vita sia del 20%, e che la probabilità di secondo tumore (per chi si è già ammalato) sia del 40%. Qual è la probabilità di ammalarsi di tumore due volte nel corso della vita? Dati: P(T1)=0.2 P(T2 T1)=0.4 Domande: P(T1&T2)= =0.08=8% ES 3 Supponiamo che una pianta sottoposta a una situazione di stress abbia una probabilità del 7% di morire entro la prima settimana. Qual è la probabilità che 2 piante in una situazione di stress siano ancora vive dopo la prima settimana? Dati: Attenzione: P(M)=0.07 si chiede però la probabilità di sopravvivenza delle due piante: P(S)=1- P(M)=0.93 Domande: P(S&S)= =0.865 ES 4 Uno studente preparato da 30/30 deve sostenere un esame, e ha uguale probabilità di essere esaminato dal docente A o dal docente B; si sa però che la probabilità di prendere la lode col docente A è del 50%, e col docente B è del 30%. Qual è la probabilità che prenda la lode? E come cambia questa probabilità se ci sono minori probabilità di essere interrogato dal docente A, e quindi maggiori di essere interrogato dal docente B? Dati del problema: P(A)=P(B)=1/2 P(L A)=1/2 P(L B)=3/10 Domande: P(L)=P(L A) P(A)+ P(L B) P(B)= =0.4 Nel secondo caso, p(l) diminuisce, poiché diminuisce il peso che si dà a P(L A) [la scomposizione ci fa vedere che la prob. di L è una sorta di media pesata fra la prob. di L con A e la prob. di L con B] ES 5 In un centro sperimentale si teme vi sia contaminazione con un raro batterio, con probabilità di contrarne infezione (evento B) pari a 5%. Un topolino del centro presenta un rigonfiamento cutaneo (evento C). Si sa che in caso di infezione da quel batterio la probabilità di avere un rigonfiamento cutaneo è 90%, mentre se agiscono altri batteri o altre cause essa è solo del 20%. Qual è la probabilità che quel topolino con il rigonfiamento sia infetto dal batterio B? Dati: P(B)=0.05 P(C B) =0.9 P(C non B) =0.2 1

2 Si utilizza la formula di Bayes: P(B C) = P(B) P(C B) / [P(B) P(C B)+ P(non B) P(C non B)] = / ( ) = ES 6 Supponiamo che, a seguito di trapianto d organo, ci sia una probabilità del 15% di morire entro 3 settimane. Qual è la probabilità che, sottoponendo 10 pazienti a trapianto, 2 sopravvivano alla terza settimana? E la probabilità che sopravvivano tutti? Sappiamo che P(M)=0.15 quindi P(S)=1-P(M)=0.85 Qui non è facile risolvere utilizzando solo le formule di base del calcolo delle probabilità. Ad esempio per la prima domanda posso calcolare la probabilità che i primi 2 sopravvivano P(S&S&M&M&M& &M)= ma questa è solo una delle possibili stringhe di 2 S e 8 M che danno 2 sopravviventi. E molto più facile riconoscere che si tratta di uno schema del tipo risolto dalla distribuzione Binomiale: X=numero di sopravviventi ha distribuzione Binomiale con N=10 e π= PrX PrX ES 7 Se la probabilità di trovare un quadrifoglio in un prato di trifogli è pari a 1 ogni 10,000, qual è la probabilità che in 100 trifogli non vi sia nessun quadrifoglio? Il dato è p(quadrifoglio trifogli) = π = Si vuole conoscere la probabilità che il numero di quadrifogli X fra n=100 trifogli sia pari a 0. Si tratterebbe di uno schema Binomiale, ma data la bassa probabilità dell evento e l alto numero di prove, si può applicare la formula della Poisson (che viene infatti detta anche legge degli eventi rari ). Il parametro della Poisson è λ=n π=0.01 e p ( X 0) ! e ES 8 Se in una popolazione di insetti si assume che la lunghezza del corpo (in mm) sia distribuita secondo una Normale di media 2.8 e varianza 0.16, qual è la probabilità che un insetto sia lungo meno di 1.8 mm?. Questo è un semplice problema sull utilizzo della curva Normale. I parametri sono: media µ= 2.8, varianza σ 2 =0.16 deviazione standard σ=0.4. p(x<1.8) = probabilità sulla N(0,1) che Z sia < del valore standardizzato z: z La tabella non ci fornisce Φ(z) (l area fino a z) se z è negativo; ma questa area è uguale a quella nella coda destra, e cioè a 1-Φ(2.5); sulle tavole in dotazione agli Studenti (che potrebbero essere diverse se prese da testi di statistica: attenzione!), in corrispondenza della riga 2.5 e della colonna 0, leggo Φ(2.5) = la probabilità cercata è ES 9 (Approssimazione Normale alla Binomiale*) Un fabbrica impiega 300 operai, e in un giorno ha bisogno di almeno 285 operai per far funzionare l impianto. In una settimana col giovedì festivo potrebbe avere manodopera insufficiente il venerdì, poiché si è visto in passato che in occasione di un ponte il 4% degli operai prende un giorno di ferie il venerdì. In effetti, qual è la probabilità che più di 15 operai prenderanno il venerdì libero? 2

3 Indichiamo con X il numero di operai fra i 300 che prenderanno il venerdì libero; per ciascun operaio questo evento ha probabilità =0.04. X è distribuita come una Binomiale, con N=300 e π=0.04, e vogliamo conoscere Pr(X>15). Dobbiamo usare una approssimazione Normale per la Binomiale, considerando X approssimativamente Normale con media =N π=12 e varianza =N π (1-π) =11.52, e quindi deviazione standard = Per correzione di continuità, calcoleremo Pr(X>15.5) [questo viene fatto per escludere il caso X=15] Standardizzando 15.5 z = Φ(z)= Φ(z)=0.151 [poiché vogliamo la coda a destra] Quindi c è una probabilità del 15% di avere personale insufficiente il venerdì. ES 10 (Test diagnostico*) Si stima che la celiachia abbia nella popolazione una prevalenza del 1%. Il test diagnostico ttg per la celiachia presenta sensibilità 97% e specificità 95%. 1) Dire quanto vale la probabilità che un celiaco risulti positivo al test, e quanto vale la probabilità che un celiaco risulti negativo al test. 2) Dire quanto vale la probabilità che un individuo qualunque della popolazione sia celiaco, e quanto vale la probabilità che un individuo a cui risulti test positivo sia celiaco. 1) rispettivamente, 0.97 e ) la prima vale 0.01, per la seconda applichiamo la formula di Bayes: P(C TP) = ( )/(numeratore ) = ES 11 Supponiamo che una certa forma di allergia respiratoria colpisca di norma 1 individuo ogni 20, mentre le intolleranze alimentari riguardano il 3.5% dei casi. Supponendo che i due eventi siano indipendenti, qual è la probabilità di avere entrambi i problemi? e di averne almeno uno? e di averne solo uno? Il primo step è sempre chiarire gli eventi di cui stiamo trattando, e cosa sappiamo in proposito (che probabilità conosciamo, se gli eventi sono dipendenti o indipendenti, compatibili o incompatibili, etc) A =Allergia Respiratoria, p(a)=1/20 =0.05 I = Intolleranza Alimentare, p(i)= A ed I eventi indipendenti Successivamente formalizziamo le domande, e risolviamo: Probabilità di avere entrambi: p(a & I) [intersezione] = [per la proprietà di indipendenza] = p(a) p(i)= = (approssimando: circa 2 per mille) Probabilità di averne almeno uno: p(a oppure I) [unione] = p(a)+p(i)-p(a&i) = = (circa 8.3%) Probabilità di averne uno solo: vediamo 2 procedimenti. Il primo utilizza una scomposizione dell evento in questione: p( (A & non I) oppure (I & nona) ) Osserviamo che l unione [ oppure ] riguarda due eventi incompatibili ossia disgiunti; quindi: p( (A & non I) oppure (I & nona) )= p(a & non I) + p(i & nona) = (*) Dobbiamo ora risolvere le probabilità di queste due intersezioni. Gli eventi non I e non A sono rispettivamente i complementari di I e A, e quindi: p(non I)= =0.965 ; p(non A)=1-0.05=0.95 Essendo A ed I eventi indipendenti, sono anche indipendenti ciascuno col complementare dell altro; quindi: (*) = p(a) p(non I) + p(i) p(nona)= = =

4 Secondo procedimento, più intuitivo: solo uno vuol dire o l uno o l altro ma non entrambi, il che ci suggerisce che la probabilità che cerchiamo è: pr(l uno o l altro) - pr(entrambi) = pr(unione) - pr(intersezione) = = ES 12 La proporzione di daltonici (D) nella popolazione è dell 1% nei maschi (M) e dello 0.5% nelle femmine (F). E noto che nella popolazione la percentuale di maschi è del 51%. Qual è la probabilità di osservare: 1) un maschio daltonico? 2) una femmina daltonica? 3) un daltonico? Dati del problema: P(M)=0.51 P(F)=1-0.51= 0.49 = P(non M) P(D M)=0.01 P(D F)= ) P(M & D) = P(M) * P(D M) = 0.51 * 0.01 = ) P(F & D) = 0.49 * = ) P(D) = P( (D & M) oppure (D & F) ) = P(M & D) + P(F & D) = = [Notare la tipica scomposizione: P(G) = P(M) * P(D M) + P(F) * P(D F)] ES 13 È noto che in una popolazione di 100 soggetti 16 hanno gli occhi verdi. Si consideri una classe di 20 bambini e si determini: - La probabilità che nessuno abbia gli occhi verdi; - La probabilità che almeno uno abbia gli occhi verdi. Rispondere alle stesse domande nel caso in cui i bambini siano 300 e la probabilità di avere gli occhi verdi sia 1.6%. X=numero di bambini con gli occhi verdi ~ Binomiale (N=20, p=0.16) Pr X Pr(X>0) = 1- Pr(X=0) = 0.97 Nel secondo caso X ~ Poisson (λ=np= =4.8) Pr(X=0)= exp(-4.8)=0.008 Pr(X>0)=1-Pr(X=0)=0.992 ES 14 È stato verificato che il valore del ph dell acqua contenuta nelle bottiglie di plastica è distribuito secondo una Normale con media 6.2 e deviazione standard ) Qual è la probabilità di osservare un valore per il ph compreso tra 7 e 7.35? 2) Qual è la probabilità di osservare un valore per il ph inferiore a 6.2? Pr(7< X <7.35) = Pr(X<7.35) Pr(X<7). Z1=( )/1.2=0.96 phi(z1)=0.747 Z2 = (7-6.2)/1.2 = 0.67 phi(z2)=0.831 Pr(7<X<7.35) = = Pr(X<6.2)=0.5 ES 15 La prevalenza del diabete mellito in Italia è stimata intorno al 4% della popolazione; fra i diabetici, in circa 1 caso su 10 si tratta di diabete di tipo 1. Il 7% dei pazienti con diabete di tipo 1 soffre anche di celiachia. 1) Dire quanto vale la probabilità che una persona abbia il diabete di tipo I 4

5 2) Dire quanto vale la probabilità che una persona abbia il diabete di tipo I e la celiachia Notazioni: Diabete: evento D; Diabete di tipo 1: evento DT1; Celiachia: evento C Dati del problema: Pr(D)=0.04 Pr(DT1 D)=0.1 Pr(C DT1)=0.07 1) Pr(DT1)=Pr(DT1 D) Pr(D) = = ) Pr(C & DT1)=Pr(C DT1) Pr(DT1)= = ES 16 L intolleranza al lattosio colpisce circa il 40% della popolazione italiana. In un solo giorno un laboratorio analizza 12 campioni. 1) Quanto vale la probabilità che ci sia esattamente un intollerante? 2) Quanto vale la probabilità che ci sia almeno un intollerante? 3) Quanto vale la probabilità che nessuno sia intollerante? Binomiale con p=0.40 e N=12 1) Pr(X=1)= ) Pr(X>1) = 1 Pr(X=1) = ) 2) Pr(X=0)= Pr Pr X X ES 17 Supponiamo che sia noto che le donne che hanno una certa patologia hanno problemi di sterilità e di maggiore abortività spontanea; la probabilità che il concepimento riesca (la donna entra in gravidanza) è pari al 20%, e in caso di gravidanza la probabilità di aborto spontaneo è pari a 15%. 1) Dire con che probabilità una donna con questa patologia ha una gravidanza che si conclude con un aborto spontaneo. 2) Dire quanto vale la probabilità che una donna con questa patologia riesca a diventare madre. 3) Dire quanto vale la probabilità che una donna con questa patologia non riesca a diventare madre. Notazioni: Gravidanza: evento G; Aborto spontaneo: evento A Dati del problema: Pr(G)=0.20 Pr(A G)=0.15 1) Pr(G&A)=Pr(A G) Pr(G) = =0.03 2) Pr(G & nona)=pr(nona G) Pr(G)= (1-Pr(A G)) Pr(G)= =0.17 3) Notando che l evento è il complementare di (G & nona): prob= = 0.83 Altro procedimento: non riesce = nong oppure [unione] G&A p(nonm) = p(nong) + p(g&a) 0 =(1-0.2) = 0.83 ES 18 Il girino generalmente predilige habitat costituiti da acque stagnanti e ricche di vegetazione; tuttavia alcune specie possono trovarsi anche in corsi di acqua corrente. Un biologo preleva dei campioni da 15 torrenti montani. Sapendo che la probabilità che un girino viva in un torrente è pari a 0.5%, calcolare la probabilità che: 1) il biologo non trovi alcun girino nei suoi campioni; 2) il biologo trovi almeno un girino; 5

6 3) il biologo trovi esattamente un girino. Poisson con tasso lambda= = ) Pr(X=0) =exp(-0.075) = ) Pr(X>0)=1-Pr(X=0)= ) Pr(X=1) =exp(-0.075) = ES 19 Una certa malattia insorge attorno a una età media pari a 50 anni, con distribuzione Normale caratterizzata (oltre che da µ=50) da σ=10. 1) Quanti pazienti hanno un età superiore a 70 al momento della diagnosi? 2) Quanti pazienti hanno un età compresa fra 60 e 70 al momento della diagnosi? Pr(X>70)=area nella coda superiore. 70 Z=(70-50)/10=2 phi(z)=0.977 Pr(X>70)= =0.023 Pr(X in (60-70)): 60 Z=(60-50)/10=1 phi(z)=0.841 Pr(X in (60-70))= = ES 20 Un insegnante di scuola media è convinto che l alunno Mario non abbia studiato la lezione, diciamo con probabilità 70%. Secondo l esperienza dell insegnante, se un alunno studia prende Ottimo con probabilità 90%, mentre se non studia solo nel 20% dei casi prende Ottimo. Al compito in classe, Mario prende Ottimo. Con che probabilità Mario ha copiato cioè, non aveva studiato? Mario studia p(s) = 0.3 Mario non studia [= Mario copia] p(non S) = 0.7 Prendere Ottimo P(O S) = 0.9 P(O non S) = 0.2 Domanda: P(non S O). Si applica la formula di Bayes: P(non S O) = P(non S) P(O non S) / [P(non S) P(O non S) + P(S) P(O S)] = / ( ) = 0.34 Dunque vediamo come con la formula di Bayes la probabilità a priori si aggiorni attraverso l acquisizione di una evidenza. Senza conoscere il risultato del compito in classe, l insegnante crede che Mario non abbia studiato con probabilità 70%. Avendo visto che Mario ha preso Ottimo, l insegnante rivede la sua aspettativa nei confronti dell evento: ora la probabilità che Mario non abbia studiato è scesa al 34%. ES 21 Nel concepimento, per una certa tipologia di coppia, la probabilità che il feto presenti una certa malformazione congenita è pari a 15%; effettuando in gravidanza un test che individua con certezza la presenza di questa malformazione su 8 donne, con che probabilità si troveranno 2 casi di malformazione? e nessuno? Questo è il classico schema Binomiale: ci interessa l evento ( successo ) trovare una malformazione, che ha probabilità π=0.15, osservato in n=8 prove (test in gravidanza). X=numero di successi nelle 8 prove. Domande: Pr(X=2) e Pr(X=0) ( 2) p X (21) ( ) ! 8 p ( X 0) !(8 0)! 6

7 ES 22 Supponiamo che, a seguito di trapianto d organo, ci sia una probabilità del 15% di morire entro 3 settimane. Qual è la probabilità che, sottoponendo 10 pazienti a trapianto, il 10% muoiano entro la terza settimana? L unica difficoltà è capire la domanda. Il 10% di 10 pazienti vuol dire 1 paziente. Per la Binomiale, consideriamo successo il decesso, quindi π=0.15: PrX Ma ovviamente se avessimo considerato successo la sopravvivenza (come in esercizi molto simili in questo gruppo) e quindi π=0.85, avremmo ottenuto lo stesso risultato: PrX ES 23 La distribuzione del peso (in gr) di un gruppo di colibrì giganti è approssimativamente Normale, con media 18 e deviazione standard 0.8. Individuare un intervallo di valori centrato sulla media tale che: a) contiene il 95% dei valori osservati b) contiene praticamente tutti i valori osservati (e quindi coincide con il range) c) contiene il 50% dei valori osservati Dobbiamo utilizzare le proprietà della Normale. Nell intervallo media ± 2 dev.st. cade all incirca il 95% dei valori (per un valore teorico più esatto, si dovrebbe usare 1.96 al posto del fattore 2). Questo risponde al quesito a). Analogamente, per il quesito b) costruiamo l intervallo di raggio 3 dev.st., che contiene il 99.7% dei valori: a) 18 ± = (16.4,19.6) b) 18 ± = (15.6,20.4) Per l ultimo punto, osserviamo che l intervallo centrato sulla media (=mediana) che contiene il 50% delle osservazioni è, per definizione dei quartili, l intervallo (Q1,Q3), dunque calcoliamo i due quartili con la nota formula: c) 18 ± = (17.464,18.536) ES 24 (Approssimazione Normale alla Binomiale*) Durante l ospedalizzazione c è una probabilità complessiva di infezione pari a 30%. Ogni infermiera/e tratta giornalmente circa 40 pazienti. Qual è la probabilità che un infermiere abbia meno di 10 pazienti con infezione oggi? Indichiamo con X il numero di pazienti con infezione oggi per quel particolare infermiere. Vogliamo calcolare Pr(X<10) sapendo che vi sono N=40 pazienti e ciascuno di essi ha probabilità π=0.3 di avere una infezione. Questa è una variabile aleatoria Binomiale, ma ne approssimiamo la distribuzione (ossia le probabilità) usando una Normale con media =N π=12 e varianza =N π (1-π) =8.4, pertanto deviazione standard =2.898 (infatti, senza approssimazione è difficile trovare la risposta: dovremmo calcolare PR(X=0)+Pr(X=1)+ +Pr(X=9). Per correzione di continuità, calcoliamo Pr(X<9.9) z = (9.9-12)/2.898 = Φ(0,863)= = Quindi c è una probabilità del 19.5% di avere meno di 10 pazienti con infezione oggi. ES 25 Un chirurgo esegue un intervento di routine in un intervallo di tempo che si distribuisce come una normale di media e deviazione standard pari rispettivamente a 38 e 3 minuti. Prima di iniziare l intervento il chirurgo scommette con un collega che l intervento durerà tra i 30 e i 45 minuti. Qual è la probabilità che il chirurgo vinca la scommessa? Chiamando con X la variabile aleatoria durata dell intervento che si distribuisce come una normale di parametri 38 e 3, vogliamo calcolare la Pr(35<X<40). 7

8 Un grafico aiuterà a risolvere il problema senza commettere errori! Tenere presente che l intervallo include la media. L area viene così calcolata: P(X<40)-P(X<35), dove il secondo termine corrisponde all area della coda P(X<35)=1-P(X>35) Standardizzazione: 40 z=0.67 Φ(0.67)= z=-1 Φ(1)= Φ(1)=0.159 Pr(35<X<40)= =0.59 Dunque la probabilità che il chirurgo vinca la scommessa è circa il 60%. ES 26 Un raro tumore pediatrico ha un incidenza di 3 casi ogni 1000 anni-persona [Questa quantità è un tasso ed è usato in epidemiologia. È costruito come rapporto tra il numero di nuovi eventi occorsi e la durata complessiva del periodo di osservazione, espressa in anni-persona. In questo caso il tasso ci dice che se seguiamo 1000 bambini per un anno, osserviamo 3 nuovi tumori o, in termini equivalenti, se seguissimo un bambino per 1000 anni, egli avrebbe il tumore 3 volte]. In una zona posta in prossimità di una fabbrica è stato stimato che la popolazione di bambini è circa 2000 e ogni anno vengono osservati 3 nuovi casi. Qual è la probabilità di osservare 3 nuovi casi? Qual è la probabilità di osservare più di 2 casi? [Questo tipo di valutazioni viene fatto, all interno di metodi di inferenza statistica, per valutare se un aea presenta un incidenca attesa, oppure se l incidenza è maggiore di quanto atteso fatto che supporterebbe l ipotesi di un danno ambientale] La Poisson è la distribuzione di riferimento utilizzata per descrivere il numero di eventi occorsi in una scala continua, sia essa un intervallo temporale o un area geografica, soprattutto se l evento è raro. Il parametro lambda è il tasso di occorrenza. Nel nostro esercizio il tasso è 3 per 1000 anni persona ma è preferibile trasformare questo tasso in 6 per 2000 anni persona (6 = 3*2000), dal momento che la popolazione di bambini è pari a Dunque, svolgeremo l esercizio assumendo 6 come valore per lambda. Il primo punto chiede di calcolare la Pr(X=3) ma per il secondo punto abbiamo bisogno di conoscere quanto vale Pr(X=0), Pr(X=1) e la Pr(X=2). Iniziamo da Pr(X=0) per ricordare come i calcoli siano facilitati ciascuno dal passo precedente: Pr(X=0) =exp(-6) = Pr(X=1) =exp(-6) 6 = = Pr(X=2) =exp(-6) 6 6/2 = /2 = = Pr(X=3) =exp(-6) 6 6 6/(3 2) = /3= = Quindi la probabilità di osservare 3 nuovi casi in un anno è 8.92% mentre la probabilità che il numero di tumori sia maggiore di 2 è Pr(X>2)= =0.938 = 94%. ES 27 (Test diagnostico*) Secondo degli studi, il 25% dei figli di genitori che hanno avuto una certa malattia presentano un anomalia genetica che aumenta il rischio di sviluppare a loro volta tale malattia. Esiste un test diagnostico per rilevare la presenza di quell anomalia genetica con sensitività 80% e specificità 95%. 1) Dire quanto vale la probabilità che il test risulti negativo se il bambino ha l anomalia genetica, e quanto vale la probabilità che il test risulti negativo se il bambino non ha l anomalia genetica. 2) Dire quanto vale la probabilità che un bambino a cui risulti test positivo presenti l anomalia genetica, e quanto vale la probabilità che un bambino con anomalia abbia test positivo. 1) rispettivamente, 0.20 e ) la seconda vale 0.80, per la prima applichiamo la formula di Bayes: P(A TP) = ( )/(numeratore )= ES 28 (Test diagnostico*) E' noto che il 2% delle persone sottoposte al test etilico dalla polizia stradale è effettivamente in stato di ebrezza (E). Il test utilizzato assicura un risultato positivo nel 95% dei casi, se la persona sottoposta al test è 8

9 effettivamente in stato di ebrezza, ed un risultato negativo nel 96% dei casi, se la persona sottoposta al test non è in stato di ebrezza. Calcolare la probabilità che una persona sottoposta al test sia effettivamente in stato di ebrezza, allorché il test sia risultato positivo. Dati del test diagnostico: sensitività = p(p E) = 95% specificità = p(n non E) = 96% (N = test Negativo) L evento ha una probabilità ha p(e)=2% Il numero di test positivi è dato dalla somma dei Veri Positivi (i Positivi per i Microcitemici) più i Falsi Positivi (i Positivi per i non-microcitemici). Gli automobilisti in stato di ebrezza dovrebbero essere 2 (sempre il 2% degli automobilisti osservati!), gli altri 98 non sono in stato di ebrezza. Dunque: - il numero dei Veri Positivi atteso è: p(p E) 2 = = il numero dei Falsi Positivi atteso è: p(p non E) 98 = (1-0.96) 96= 3.84 in totale: circa 5 test risulteranno Positivi. ES 29 (Test diagnostico*) Un certo biomarcatore X segue una distribuzione Normale di varianza 4.4 e media pari a 13 per i soggetti malati mentre per i soggetti non malati la media è uguale a 6.5. X verrà utilizzato per individuare la presenza della malattia. Come criterio diagnostico viene deciso di classificare come malato un soggetto con un valore di X superiore a 10. Quanto valgono la sensitività e la specificità del test diagnostico? Le informazioni fornite dal problema riguardano le distribuzioni di X condizionate allo stato del soggetto = malato/non malato. Indicando con D= 0,1 lo stato del paziente, dove 0 = non malato e 1 = malato (D per diseased ), abbiamo che: X D=0 ~ N(6.5, st.dev=2.098) X D=1 ~ N(13, st.dev=2.098) Inoltre sappiamo che l evento X>10 viene considerato test positivo. La Pr(X>10 D=1) è la sensitività. Questa probabilità può essere calcolata procedendo come nei soliti problemi con distrib. Normale, cioè standardizzando il valore 10 e calcolando l area di interesse: x=10 z = (10-13)/2.098 = Φ(1.43) =0.924 Pr(X>10 D=1)=0.924 La Pr(X>10 D=0) è la probabilità di avere un Falso Positivo. Questa probabilità è: x=10 z = (10-6.5)/2.098 = 1.67 Φ(1.67) =0.953 Pr(X>10 D=0)= =0.047 Quindi, la specificità è uguale a =

10 ES 30 (Test diagnostico*) Lo Skin-prick-test è utilizzato frequentemente per lo screening delle allergie agli alimenti; si tratta di un test cutaneo che fornisce il risultato in 15 minuti, ha sensibilità pari ad almeno 90%, ma ha una scarsa specificità, in media pari a 60%. Parte I Qual è il problema principale di questo test? Dire se ciascuna delle seguenti affermazioni è Vera o Falsa. a) Indica troppi falsi negativi b) Indica troppi falsi positivi c) Conduce spesso ad una diagnosi errata di allergia alimentare, mentre il soggetto non è allergico d) E molto probabile che un soggetto allergico risulti negativo al test Parte II Secondo alcuni studi, le allergie alimentari si osservano nel 6% circa dei bambini e nell'1.5% degli adulti. Dire se ciascuna delle seguenti affermazioni è Vera o Falsa e, se Falsa, suggerire una correzione alle parti sottolineate. e) Un bambino sottoposto allo Skin-prick-test ha test positivo con probabilità 6%. f) Un bambino sottoposto allo Skin-prick-test ha test positivo con probabilità 90%. g) Un adulto allergico sottoposto allo Skin-prick-test ha test positivo con probabilità 90%. h) Un bambino con Skin-prick-test positivo ha probabilità di essere allergico pari a 13%. i) La probabilità di essere allergico quando lo Skin-prick-test è positivo è la stessa per adulti e bambini sensitività = 90% = (introduco un po di notazione) p(tp AL) specificità = 60% = p(n non M) Nella seconda parte del quesito, abbiamo anche la prevalenza, diversa a seconda dell età del soggetto: Pr(AL) è 0.6 per i bambini e per gli adulti a) Falso: i falsi negativi sono il 10% (1-sensitività) b) Vero: i falsi positivi sono il 40% (1-specificità) c) Vero, è la stessa affermazione del punto b) d) Falso, è la stessa affermazione del punto a) e) Falso. La probabilità di Test Positivo va calcolata nel seguente modo: Sottintendiamo che parliamo di bambini. TP = Test Positivo. AL = Allergico. Pr(TP)=Pr( (TP & AL) oppure (TP & non AL) ) = = Pr(TP & AL) + Pr(TP & non AL) = = Pr(TP AL) Pr(AL) + Pr(TP non AL) Pr(non AL) = = sens (1-spec) (1 0.06) = = = 0.43 Quindi 43% corregge 6%. f) Falso: la correzione è Un bambino allergico (come suggerisce la seguente affermazione) g) Vero h) Vero: risulta calcolando il valore predittivo del test positivo: Pr(AL TP)= sens. prev. / [sens. prev + (1-spec) (1 prev) ] = = / = i) Falso, poiché per gli adulti la prevalenza è più bassa, ossia è minore la probabilità a priori di essere allergico, e quindi lo sarà anche la probabilità a posteriori. Verifichiamo facendo il calcolo, in maniera analoga al punto precedente: Stavolta parliamo di adulti. TP = Test Positivo. AL = Allergico. Pr(AL TP)= sens. prev. / [sens. prev + (1-spec) (1 prev) ] = = / =

11 Per gli adulti, la prob. di essere allergici avendo avuto un test positivo è solo del 3.3%. ES 31 Un ambulatorio di dietologia si prepara a sottoporre a visita circa 160 persone sovrappeso, a cui somministrare anche un questionario atto a stabilire quante calorie consumano giornalmente. Durante la visita, si vorrebbe anche offrire la possibilità di partecipare ad un programma di rieducazione alimentare, ma solo a soggetti con consumo calorico molto elevato, poichè le risorse a disposizione permettono di offrire il programma solamente a 40 persone circa. Il problema è di fissare un criterio per individuare i soggetti da invitare a partecipare al programma. Supponendo che il consumo calorico giornaliero dei pazienti dell ambulatorio si distribuisca Normalmente con media 2100 e deviazione standard 150, quale criterio adottereste? La proporzione di soggetti che è possibile arruolare nel programma di rieducazione è 40 / 160 = 25%. Dunque vogliamo determinare la soglia x tale che i soggetti con consumo calorico più alto di x siano pari al 25%. Il valore x tale che Freq(X>x) = 25% è per definizione Q3, il terzo quartile. Q3 in una N(μ=2100, σ=150) è pari a μ+0.67 σ = = Ogni soggetto dal cui questionario risulti un consumo calorico superiore a 4300 verrà invitato a partecipare al programma di rieducazione alimentare ES 32 Da uno studio sul Body Mass Index effettuato in una popolazione, si stima che il 33% degli individui è Normopeso, il 50% Sovrappeso, e il 17% Obeso. In questi 3 gruppi, la probabilità di sviluppare una certa tipologia di malattie cardiovascolari è rispettivamente pari a 1%, 3% e 6%. Sapendo che la popolazione comprende complessivamente 10,000 individui, calcolare: a) Quanti soggetti obesi dovrebbero complessivamente esserci in questa popolazione; b) Qual è la probabilità, estraendo a caso un individuo dalla popolazione, che sia un soggetto Normopeso e si ammali di una di queste malattie; c) Qual è la probabilità che un individuo scelto a caso in questa popolazione sviluppi una di queste malattie e, quindi, quanti casi di malattia ci aspettiamo nella popolazione. Eventi e probabilità: N=Normopeso, S=Sovrappeso, O=Obeso. p(n)=0.33 p(s)=0.5 p(o)=0.17. Sono 3 eventi sono incompatibili (disgiunti) e l unione ricostruisce lo spazio Ω (per riprova: la somma delle loro probabilità fa 1). M=sviluppare quella certa tipologia di malattie cardiovascolari. Il testo ci fornisce le probabilità di M nelle 3 situazioni di peso precedenti (probabilità condizionate): p(m N)=0.01 p(m S)=0.03 p(m O)=0.06 Ultimo dato disponibile: la popolazione comprende n=10,000 individui. Passiamo alle domande: a) p(o) n = ,000= 1,700 11

12 b) p(n M) = p(n) p(m N) = = = 3.3 (per mille) c) p(m): per impostare il calcolo, dobbiamo considerare che ci si ammala con probabilità diversa a seconda della condizione di peso, e conosciamo queste probabilità, e inoltre che nella popolazione ciascuna condizione ha una frequenza (prevalenza) diversa, che pure conosciamo; in pratica, partiamo dalla considerazione che: ci si ammala e si è Normopeso, oppure Sovrappeso, oppure Obesi: p(m) = p( (M N) U (M S) U (M O) ) = = p(m N) + p(m S) + p(m O) essendo eventi disgiunti (poiché N, S e O disgiunti) La prima l abbiamo calcolata, le altre due si calcolano in maniera analoga, quindi: p(m) = p(m N) p(n) + p(m S) p(s) + p(m O) p(o) = = % numero malati = p(m) n = ,000= 285 Osserviamo che abbiamo applicato una sorta di media ponderata delle probabilità condizionate di ammalarsi, con pesi dati dalle prevalenze di ciascuna condizione (la somma dei pesi è pari a 1, come osservato all inizio). Osserviamo anche che l addendo più grande nell ultima somma, e quindi il contributo più grande al numero complessivo di malati, viene dal gruppo dei Sovrappeso: sebbene il rischio sia molto maggiore per gli Obesi (RROvsN=6, RROvsS=3), esso si applica a una porzione più piccola della popolazione; un piccolo rischio, applicato a tanti individui, implica un grosso aggravio per la popolazione questo genere di considerazioni è utile in ambito epidemiologico e di salute pubblica. ES 33 Nell anemia mediterranea, un genitore portatore sano (microcitemico) trasmette l anomalia genetica al figlio con probabilità del 50%; se l individuo eredita l anomalia da entrambi i genitori, egli si ammala di talassemia; se la eredita solo da un genitore, egli è a sua volta un portatore sano. Una coppia di genitori portatori sani genera un Figlio; questo Figlio a sua volta si accoppierà con un soggetto che non presenta l anomalia, generando un Nipote della coppia iniziale. a) Qual è la probabilità che il Figlio sia malato? e la probabilità che sia un portatore sano? e che non erediti l anomalia? b) Qual è la probabilità che il Nipote sia portatore sano? Utilizziamo delle notazioni semplificate. T=trasmissione dell anomalia, NT=no trasmissione (complementare) saranno riferiti sia al genitore 1 che al genitore 2. Osserviamo che la trasmissione da parte del genitore 1 avviene indipendentemente dalla trasmissione da parte del genitore 2. P(Figlio malato) = P(T & T)= =0.25 P(Figlio no anomalia) = P(NT & NT)= =0.25 P(Figlio portatore sano) = P( (T&NT) U (NT&T) )= =0.5 (potevamo ovviamente trovarne una come 1-la somma delle altre due) P(Nipote portatore sano): dipenderà dallo status del Figlio, mentre il secondo genitore (compagno/a di Figlio) non può trasmettere l anomalia P(Nipote portatore sano Figlio malato)=1 P(Nipote portatore sano Figlio no anomalia)=0 P(Nipote portatore sano Figlio portatore sano)=0.5 Come al solito, si tratta di pesare queste probabilità con le probabilità dei rispettivi eventi condizionanti (ossia, ricorrere alla solita scomposizione): P(Nipote portatore sano)= P(Nipote portatore sano Figlio malato) P(Figlio malato)+p(nipote portatore sano Figlio no anomalia) = = = 0.50 ES 34 Un individuo ha, nel corso della vita, una probabilità dello 0.4% (4 per mille) di sviluppare il diabete di tipo 1. Questa patologia ha una probabile componente genetica; infatti, un soggetto che abbia un fratello/sorella con diabete di tipo 1 ha un rischio attorno al 5% di sviluppare il diabete di tipo 1, rischio che sale al 30% se il fratello/sorella è un gemello monozigote (identico). 12

13 a) Se John e Mary sono una coppia di sposi, qual è la probabilità che entrambi sviluppino il diabete di tipo I? b) Se John e Mary sono fratello e sorella, qual è la probabilità che entrambi sviluppino il diabete di tipo I? La probabilità di malattia p(d) è in generale Essa comunque dipende da altre informazioni: p(d fratello/sorella malato) = 0.05 p(d gemello identico malato) = 0.30 Usando i simboli DJ e DM rispettivamente per indicare gli eventi "John si ammala" e "Mary si ammala", dobbiamo calcolare p(dj & DM) in due diverse situazioni. a) coppia sposata = I due eventi sono indipendenti e p(dj)=p(dm)=p(d)=0.004 => p(dj & DM) = p(dj) p(dm)= = b) fratello e sorella. Trattandosi di un maschio e una femmina, non possono essere gemelli identici. Comunque qui i due eventi non sono indipendenti poichè per esempio p(dj DM)= p(dj & DM)=p(DM) p(dj DM )= = ES 35 Stima di sensitività, predittività e valore predittivo del test diagnostico* In un laboratorio è stato messo a punto un nuovo test diagnostico per la malattia celiaca basato su un prelievo di sangue. Si devono quindi stimare sensitività e specificità, attraverso un esperimento controllato. Gli studiosi prendono 20 pazienti con celiachia confermata dalla biopsia ("malati") e 60 pazienti che sono stati controllati a seguito di sintomi, ma sono risultati non affetti da celiachia ("non malati"). Su tutti gli 80 soggetti viene poi eseguito il nuovo test, ottenendo I seguenti risultati: Test + Test - Tot Malato Non malato tot Calcolare sensitività e specificità e il valore predittivo del test positivo, assumendo che la prevalenza della celiachia sia pari a 8%. Comparare quest'ultimo risultato con quello che si otterrebbe usando solo I dati in tabella: c'è una differenza, e perché? Dalla tabella si evincono i seguenti valori per i due parametri del test: sensitività = 17 / 20 = 0.85 specificità = 55 / 60 = 0.92 Per il valore predittivo del test positivo, usando la prevalenza = 0.08 e la formula di Bayes, otteniamo: sens prev p( M T) 0.47 sens prev (1 spec) (1 prev) (1 0.92) (1 0.08) Dunque un soggetto che ottiene un test positivo secondo il nuovo metodo diagnostico probabilità di essere celiaco - ossia, la biopsia darà risultato positivo con probabilità 47%. Se invece usiamo i dati in tabella: p(m T+) = (veri positivi) / positivi = tp / (tp + fp) = 17 / 22 = 0.77 ha il 47% di I risultati sono diversi, e il secondo è ERRATO poiché il secondo approccio non usa il valore corretto della prevalenza, quello sulla popolazione generale, bensì usa il valore della prevalenza ottenuto sulla tabella, cioè 20/80, il quale non riproduce la situazione nella popolazione, ma è stato fissato dagli investigatori per convenienza. (Potrebbe darsi che per puro caso o per scelta degli investigatori il valore vero della prevalenza sia coincidente con il valore stimato nella tabella; generalmente non lo è, solitamente negli esperimenti il rapporto fra malati e non malati è 1:2 o 1:3) 13

14 Dunque con la prevalenza sbagliata e maggiore di quella vera (25%) otteniamo il valore predittivo 77%, più alto di quello vero. Per completare l'illustrazione, vediamo un esempio dove la prevalenza stimata è corretta. Un ampio studio osservazionale ha considerato una popolazione di 100 persone esposte a una sostanza chimica che può indurre un certo tipo di tumore ematologico. Tutti gli individui sono stati sottoposti a un test diagnostico di screening per vedere se hanno assorbito grandi quantità della sostanza, ed essere quindi classificati come soggetti "a rischio" se positivi o "non a rischio" se il test era negativo. Fra le 200 persone, 22 hanno sviluppato quel tipo di tumore. La tabella dei risultati era: Test + Test - Tot Malato Non malato tot Stime: sensitività = 13 / 22 = 0.59 specificità = 53 / 78 = 0.68 prevalenza stimata: 22/100 = 22% Questa stima riproduce correttamente la prevalenza nella popolazione. Dunque possiamo usare entrambi gli approcci per calcolare il valore predittivo del test positivo: - o la formula di Bayes: sens prev p( M T) 0.34 sens prev (1 spec) (1 prev) (1 0.68) (1 0.22) - o (più rapidamente) il calcolo della percentuale dalla tabella: (veri positivi) / positivi = 13 / 38 =0.34 Vediamo anche il valore predittivo del test negativo, che fornisce la probabilità che un soggetto con test di screening negativo sia malato: (1 sens) prev (1 0.59) 0.22 p( M T) 0.14 (1 sens) prev spec (1 prev) (1 0.59) (1 0.22) 14

Sol. Dati del problema: P(M)=0.51 P(F)=1-0.51= 0.49 = P(non M) P(G M)=0.01 P(G F)=0.005

Sol. Dati del problema: P(M)=0.51 P(F)=1-0.51= 0.49 = P(non M) P(G M)=0.01 P(G F)=0.005 ES 1 La probabilità di una certa malattia genetica (G) è dell 1% nei neonati maschi (M) e dello 0.5% nelle neonate femmine (F). E noto che la probabilità che un neonato sia maschio è pari a 51%. Qual è

Dettagli

Attenzione: P(M)=0.15 si chiede però la probabilità di sopravvivenza dei due pazienti: P(S)=1-P(M)=0.85 P(S&S)= =0.7225

Attenzione: P(M)=0.15 si chiede però la probabilità di sopravvivenza dei due pazienti: P(S)=1-P(M)=0.85 P(S&S)= =0.7225 ESERCIZI DI CALCOLO DELLE PROBABILITA ES 1 Se la probabilità di soffrire di insonnia è pari a 13%, e la probabilità di soffrire di insonnia e cefalee è del 3%, qual è la probabilità di soffrire di cefalee

Dettagli

a) Quanti soggetti obesi dovrebbero complessivamente esserci in questa popolazione;

a) Quanti soggetti obesi dovrebbero complessivamente esserci in questa popolazione; ESERCIZI DI CALCOLO DELLE PROBABILITA ES 1 Supponiamo che una certa forma di allergia respiratoria colpisca di norma 1 individuo ogni 20, mentre le intolleranze alimentari riguardano il 3.5% dei casi.

Dettagli

a) Quanti soggetti obesi dovrebbero complessivamente esserci in questa popolazione;

a) Quanti soggetti obesi dovrebbero complessivamente esserci in questa popolazione; ESERCIZI DI CALCOLO DELLE PROBABILITA ES 1 Supponiamo che una certa forma di allergia respiratoria colpisca di norma 1 individuo ogni 20, mentre le intolleranze alimentari riguardano il 3.5% dei casi.

Dettagli

TEST DIAGNOSTICI. Si chiama test diagnostico un esame effettuato per stabilire se un dato individuo è affetto o no da una certa malattia.

TEST DIAGNOSTICI. Si chiama test diagnostico un esame effettuato per stabilire se un dato individuo è affetto o no da una certa malattia. TEST DIAGNOSTICI Si chiama test diagnostico un esame effettuato per stabilire se un dato individuo è affetto o no da una certa malattia. Il test, come ogni esame, ha un certo margine di errore, può risultare

Dettagli

Test diagnostici- 1. Un test diagnostico perfetto dovrebbe dare esito positivo in tutti i soggetti malati e esito negativo in tutti i soggetti sani.

Test diagnostici- 1. Un test diagnostico perfetto dovrebbe dare esito positivo in tutti i soggetti malati e esito negativo in tutti i soggetti sani. Test diagnostici- 1 Un test diagnostico è un metodo usato per diagnosticare una certa malattia: per esempio il Pap test è un metodo per diagnosticare il tumore del collo dell utero, la glicemia è un metodo

Dettagli

Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si

Dettagli

LEZIONI DI STATISTICA MEDICA

LEZIONI DI STATISTICA MEDICA LEZIONI DI STATISTICA MEDICA Lezione n.11 - Principi dell inferenza statistica - Campionamento - Distribuzione campionaria di una media e di una proporzione - Intervallo di confidenza di una media e di

Dettagli

Cenni di calcolo delle probabilità

Cenni di calcolo delle probabilità Cenni di calcolo delle probabilità Prof.ssa G. Serio, Prof. P. Trerotoli, Cattedra di Statistica Medica, Università di Bari 1/19 Quando si compie un esperimento o una serie di prove i possibili risultati

Dettagli

SOLUZIONI DEL 1 0 TEST DI PREPARAZIONE ALLA 1 a PROVA INTERMEDIA

SOLUZIONI DEL 1 0 TEST DI PREPARAZIONE ALLA 1 a PROVA INTERMEDIA SOLUZIONI DEL 1 0 TEST DI PREPARAZIONE ALLA 1 a PROVA INTERMEDIA 1 Esercizio 0.1 Dato P (A) = 0.5 e P (A B) = 0.6, determinare P (B) nei casi in cui: a] A e B sono incompatibili; b] A e B sono indipendenti;

Dettagli

Esercitazione 8 maggio 2014

Esercitazione 8 maggio 2014 Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un

Dettagli

UNIVERSITÀ di ROMA TOR VERGATA

UNIVERSITÀ di ROMA TOR VERGATA UNIVERSITÀ di ROMA TOR VERGATA Corso di Statistica, anno 2010-11 P.Baldi Lista di esercizi 3. Corso di Laurea in Biotecnologie Esercizio 1 Una v.a. X segue una legge N(2, ). Calcolare a1) P(X 1) a2) P(2

Dettagli

Esercitazione: La distribuzione NORMALE

Esercitazione: La distribuzione NORMALE Esercitazione: La distribuzione NORMALE Uno dei più importanti esempi di distribuzione di probabilità continua è dato dalla distribuzione Normale (curva normale o distribuzione Gaussiana); è una delle

Dettagli

SCHEDA DIDATTICA N 7

SCHEDA DIDATTICA N 7 FACOLTA DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA CIVILE CORSO DI IDROLOGIA PROF. PASQUALE VERSACE SCHEDA DIDATTICA N 7 LA DISTRIBUZIONE NORMALE A.A. 01-13 La distribuzione NORMALE Uno dei più importanti

Dettagli

Correzione primo compitino, testo B

Correzione primo compitino, testo B Correzione primo compitino, testo B gennaio 20 Parte Esercizio Facciamo riferimento alle pagine 22 e 2 del libro di testo Quando si ha a che fare con la moltiplicazione o la divisione di misure bisogna

Dettagli

GRUPPI SANGUIGNI. Supponendo che la popolazione italiana sia H-W, calcola la probabilità di ogni singolo allele e di ogni genotipo

GRUPPI SANGUIGNI. Supponendo che la popolazione italiana sia H-W, calcola la probabilità di ogni singolo allele e di ogni genotipo GRUPPI SANGUIGNI La distribuzione dei gruppi sanguigni nella popolazione italiana è: gruppo A 36%, gruppo B 17%, gruppo AB 7%, gruppo 0 40%. Il gruppo sanguigno è determinato da un locus genetico con tre

Dettagli

STATISTICA (2) ESERCITAZIONE 2. Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE 2. Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 2 5.02.2014 Dott.ssa Antonella Costanzo Esercizio 1. La v.c. Normale: uso delle tavole E noto che un certo tipo di dati si distribuiscono secondo una gaussiana di media 10

Dettagli

DISTRIBUZIONE NORMALE (1)

DISTRIBUZIONE NORMALE (1) DISTRIBUZIONE NORMALE (1) Nella popolazione generale molte variabili presentano una distribuzione a forma di campana, bene caratterizzata da un punto di vista matematico, chiamata distribuzione normale

Dettagli

Lezione n. 1 (a cura di Irene Tibidò)

Lezione n. 1 (a cura di Irene Tibidò) Lezione n. 1 (a cura di Irene Tibidò) Richiami di statistica Variabile aleatoria (casuale) Dato uno spazio campionario Ω che contiene tutti i possibili esiti di un esperimento casuale, la variabile aleatoria

Dettagli

Lezione 3 Calcolo delle probabilità

Lezione 3 Calcolo delle probabilità Lezione 3 Calcolo delle probabilità Definizione di probabilità La probabilità è lo studio degli esperimenti casuali e non deterministici Se lanciamo un dado sappiamo che cadrà ma non è certo che esca il

Dettagli

Intervallo di confidenza

Intervallo di confidenza Intervallo di confidenza Prof. Giuseppe Verlato, Prof. Roberto de Marco Sezione di Epidemiologia e Statistica Medica, Università di Verona campione inferenza popolazione Media Riportare sempre anche Stima

Dettagli

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.

Dettagli

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali Università degli studi della Tuscia Principi di Statistica dr. Luca Secondi A.A. 014/015 Esercitazione di riepilogo Variabili casuali ESERCIZIO 1 Il peso delle compresse di un determinato medicinale si

Dettagli

Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica (269AA) A.A. 2016/17 - Prima prova in itinere

Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica (269AA) A.A. 2016/17 - Prima prova in itinere Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica 69AA) A.A. 06/7 - Prima prova in itinere 07-0-03 La durata della prova è di tre ore. Le risposte devono essere adeguatamente giustificate.

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

NOZIONI DI CALCOLO DELLE PROBABILITÀ

NOZIONI DI CALCOLO DELLE PROBABILITÀ NOZIONI DI CALCOLO DELLE PROBABILITÀ ESPERIMENTO CASUALE: un esperimento si dice casuale quando gli esiti (manifestazioni o eventi) non possono essere previsti con certezza. PROVA: le ripetizioni, o occasioni

Dettagli

FENOMENI CASUALI. fenomeni casuali

FENOMENI CASUALI. fenomeni casuali PROBABILITÀ 94 FENOMENI CASUALI La probabilità si occupa di fenomeni casuali fenomeni di cui, a priori, non si sa quale esito si verificherà. Esempio Lancio di una moneta Testa o Croce? 95 DEFINIZIONI

Dettagli

MATEMATICA CORSO A CORSO DI LAUREA IN SCIENZE BIOLOGICHE I PROVA IN ITINERE COMPITO PROVA 1

MATEMATICA CORSO A CORSO DI LAUREA IN SCIENZE BIOLOGICHE I PROVA IN ITINERE COMPITO PROVA 1 MATEMATICA CORSO A CORSO DI LAUREA IN SCIENZE BIOLOGICHE I PROVA IN ITINERE COMPITO PROVA 1 1- Il volume di un corpo di qualsiasi forma è proporzionale al cubo di una qualunque delle sue dimensioni lineari.

Dettagli

IL FATTORE Rh Supponiamo ora di sapere che è nato un figlio Rh + da madre Rh, qual è la probabilità che il padre sia Rh + omozigote?

IL FATTORE Rh Supponiamo ora di sapere che è nato un figlio Rh + da madre Rh, qual è la probabilità che il padre sia Rh + omozigote? IL FATTORE Rh Supponiamo ora di sapere che è nato un figlio Rh + da madre Rh, qual è la probabilità che il padre sia Rh + omozigote? Dobbiamo calcolare P(P AA F + ), dove abbiamo indicato con P AA l evento

Dettagli

A proposito di valutazione scolastica

A proposito di valutazione scolastica A proposito di valutazione scolastica Livello scolare: 2 biennio Abilità interessate Identificare situazioni che richiedono di rilevare lo stesso carattere su una unità statistica formata da 2 elementi,

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 2

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 2 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 2 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. La variabile Uniforme Continua Data una scheda telefonica da 5 euro di cui non si sa se sia

Dettagli

LEZIONI DI STATISTICA MEDICA

LEZIONI DI STATISTICA MEDICA LEZIONI DI STATISTICA MEDICA A.A. 2010/2011 - Distribuzione binomiale - Distribuzione Normale Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona DISTRIBUZIONI TEORICHE DI PROBABILITA

Dettagli

ESERCIZIO 1 Lanciamo tre volte una moneta regolare e consideriamo equiprobabili i possibili

ESERCIZIO 1 Lanciamo tre volte una moneta regolare e consideriamo equiprobabili i possibili ESERCIZIO 1 Lanciamo tre volte una moneta regolare e consideriamo equiprobabili i possibili risultati. Dimostrare che per i 3 eventi A 1 = Almeno due teste A 2 = Un numero pari di teste A 3 = Croce al

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 27 Outline 1 () Statistica 2 / 27 Outline 1 2 () Statistica 2 / 27 Outline 1 2 3 () Statistica 2 /

Dettagli

Gli errori nella verifica delle ipotesi

Gli errori nella verifica delle ipotesi Gli errori nella verifica delle ipotesi Nella statistica inferenziale si cerca di dire qualcosa di valido in generale, per la popolazione o le popolazioni, attraverso l analisi di uno o più campioni E

Dettagli

PSICOMETRIA Voto X frequenza

PSICOMETRIA Voto X frequenza 1) Data la seguente distribuzione dei voti di laurea: PSICOMETRIA 2011-4 Voto X 100 101 102 103 104 105 106 107 108 109 110 frequenza 15 17 20 19 23 25 18 14 12 9 5 media = 104,32 e s 2 = 6.56 calcolare

Dettagli

Test delle Ipotesi Parte I

Test delle Ipotesi Parte I Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test

Dettagli

Distribuzione normale

Distribuzione normale Distribuzione normale istogramma delle frequenze di un insieme di misure relative a una grandezza che varia con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata

Dettagli

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA. Lezione 4 DISTRIBUZIONE DI FREQUENZA 1 DISTRIBUZIONE DI PROBABILITA Una variabile i cui differenti valori seguono una distribuzione di probabilità si chiama variabile aleatoria. Es:il numero di figli maschi

Dettagli

Corso di Laurea in Farmacia Modulo di Matematica ed Informatica, 3 giugno Giustificare adeguatamente le soluzioni dei seguenti esercizi

Corso di Laurea in Farmacia Modulo di Matematica ed Informatica, 3 giugno Giustificare adeguatamente le soluzioni dei seguenti esercizi Modulo di Matematica ed Informatica, 3 giugno 204 Si sono registrati i battiti cardiaci al minuto ad una persona, una volta al giorno per 20 giorni. Si sono ottenuti i seguenti dati: 66, 69, 7, 68, 66,

Dettagli

Laboratorio di Didattica di elaborazione dati 3A LA DISTRIBUZIONE DI BERNOULLI (BINOMIALE) LA DISTRIBUZIONE DI POISSON.

Laboratorio di Didattica di elaborazione dati 3A LA DISTRIBUZIONE DI BERNOULLI (BINOMIALE) LA DISTRIBUZIONE DI POISSON. 3A LA DISTRIBUZIONE DI BERNOULLI (BINOMIALE) LA DISTRIBUZIONE DI POISSON La distribuzione binomiale rappresenta la distribuzione di probabilità di prove ripetute indipendenti quando i risultati di ciascuna

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

TEST DI AUTOVALUTAZIONE APPROSSIMAZIONE NORMALE

TEST DI AUTOVALUTAZIONE APPROSSIMAZIONE NORMALE TEST DI AUTOVALUTAZIONE APPROSSIMAZIONE NORMALE I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. Sia X, X,...

Dettagli

Tutorato 1 (20/12/2012) - Soluzioni

Tutorato 1 (20/12/2012) - Soluzioni Tutorato 1 (20/12/2012) - Soluzioni Esercizio 1 (v.c. fantasia) Si trovi il valore del parametro θ per cui la tabella seguente definisce la funzione di probabilità di una v.c. unidimensionale X. X 0 1

Dettagli

GRUPPI SANGUIGNI. Supponendo che la popolazione italiana sia H-W, calcola la probabilità di ogni singolo allele e di ogni genotipo

GRUPPI SANGUIGNI. Supponendo che la popolazione italiana sia H-W, calcola la probabilità di ogni singolo allele e di ogni genotipo GRUPPI SANGUIGNI La distribuzione dei gruppi sanguigni nella popolazione italiana è: gruppo A 36%, gruppo B 17%, gruppo AB 7%, gruppo 0 40%. Il gruppo sanguigno è determinato da un locus genetico con tre

Dettagli

Schema lezione 5 Intervalli di confidenza

Schema lezione 5 Intervalli di confidenza Schema lezione 5 Intervalli di confidenza Non centrerò quella barca, ne sono convinto al 95% COMPRENDERE: Significato di intervallo di confidenza Uso degli stimatori come quantità di pivot per stime intervallari

Dettagli

CENNI DI CALCOLO DELLE PROBABILITÀ (Vittorio Colagrande)

CENNI DI CALCOLO DELLE PROBABILITÀ (Vittorio Colagrande) CENNI DI CALCOLO DELLE PROBABILITÀ (Vittorio Colagrande) Il Calcolo delle Probabilità trova molte applicazioni in Medicina, Biologia e nelle Scienze sociali. Si possono formulare in modo più appropriato

Dettagli

DISTRIBUZIONI DI PROBABILITA

DISTRIBUZIONI DI PROBABILITA DISTRIBUZIONI DI PROBABILITA La distribuzione di probabilità e un modello matematico, uno schema di riferimento, che ha caratteristiche note e che può essere utilizzato per rispondere a delle domande derivate

Dettagli

Seconda Parte Specifica di scuola - Statistica Sanitaria e biometria - 31/10/2014

Seconda Parte Specifica di scuola - Statistica Sanitaria e biometria - 31/10/2014 Domande relative alla specializzazione in: Statistica Sanitaria e biometria Domanda #1 (codice domanda: n.1341) : Se 2.5 mg/l è il 95 percentile della distribuzione dei valori di omocisteina nel gruppo

Dettagli

Esercizi svolti di statistica. Gianpaolo Gabutti

Esercizi svolti di statistica. Gianpaolo Gabutti Esercizi svolti di statistica Gianpaolo Gabutti (gabuttig@hotmail.com) 1 Introduzione Questo breve documento contiene lo svolgimento di alcuni esercizi di statistica da me svolti durante la preparazione

Dettagli

Distribuzioni campionarie

Distribuzioni campionarie 1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari

Dettagli

Variabili aleatorie gaussiane

Variabili aleatorie gaussiane Variabili aleatorie gaussiane La distribuzione normale (riconoscibile dalla curva a forma di campana) è la più usata tra tutte le distribuzioni, perché molte distribuzioni che ricorrono naturalmente sono

Dettagli

Elementi di calcolo delle probabilità e loro applicazione in medicina

Elementi di calcolo delle probabilità e loro applicazione in medicina Elementi di calcolo delle probabilità e loro applicazione in medicina Gli eventi e la Probabilità: le regole basilari Il concetto di dipendenza probabilistica La regola di Bayes e sue implicazioni I test

Dettagli

Distribuzione Normale

Distribuzione Normale Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di

Dettagli

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016 Esame di Statistica 0 o CFU) CLEF febbraio 06 Esercizio Si considerino i seguenti dati, relativi a 00 clienti di una banca a cui è stato concesso un prestito, classificati per età e per esito dell operazione

Dettagli

P (F E) = P (E) P (F E) = = 25

P (F E) = P (E) P (F E) = = 25 Regola del prodotto Conoscete la definizione di probabilità condizionata. Definizione 1. Siano E e F due eventi di uno spazio campionario S. Supponiamo P (F ) > 0. La probabilità condizionata dell evento

Dettagli

Test per una media - varianza nota

Test per una media - varianza nota Situazione Test per una media - varianza nota Popolazione N(µ,σ 2 ); varianza σ 2 nota. µ 0 numero reale fissato. Test di livello α per µ Statistica: Z n = X n µ 0 σ/ n. H 0 H 1 Rifiutiamo H 0 se p-value

Dettagli

Tipi di variabili. Indici di tendenza centrale e di dispersione

Tipi di variabili. Indici di tendenza centrale e di dispersione Tipi di variabili. Indici di tendenza centrale e di dispersione L. Boni Variabile casuale In teoria della probabilità, una variabile casuale (o variabile aleatoria o variabile stocastica o random variable)

Dettagli

Scanned by CamScanner

Scanned by CamScanner Scanned by CamScanner Scanned by CamScanner Scanned by CamScanner Scanned by CamScanner Scanned by CamScanner Scanned by CamScanner Scanned by CamScanner Università di Cassino Corso di Statistica Esercitazione

Dettagli

Statistica ARGOMENTI. Calcolo combinatorio

Statistica ARGOMENTI. Calcolo combinatorio Statistica ARGOMENTI Calcolo combinatorio Probabilità Disposizioni semplici Disposizioni con ripetizione Permutazioni semplici Permutazioni con ripetizioni Combinazioni semplici Assiomi di probabilità

Dettagli

In alternativa all intervallo di riferimento. VALORI o LIVELLI DECISIONALI

In alternativa all intervallo di riferimento. VALORI o LIVELLI DECISIONALI In alternativa all intervallo di riferimento VALORI o LIVELLI DECISIONALI Valori sopra o sotto i quali è raccomandabile seguire un determinato comportamento clinico: - Instaurare o modificare un regime

Dettagli

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici SOLUZIONI ESERCITAZIONE NR. 8 Test statistici ESERCIZIO nr. 1 Un campione casuale di dieci pazienti di sesso maschile in cura per comportamenti aggressivi nell ambito del contesto familiare è stato classificato

Dettagli

UNIVERSITÀ di ROMA TOR VERGATA

UNIVERSITÀ di ROMA TOR VERGATA UNIVERSITÀ di ROMA TOR VERGATA Corso di Laurea Magistrale in Scienze della Nutrizione Umana Corso di Statistica Medica, anno 05-6 P.Baldi Lista di esercizi, 8 gennaio 06. Esercizio Si sa che in una schedina

Dettagli

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n. 5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema

Dettagli

C.I. di Metodologia clinica

C.I. di Metodologia clinica C.I. di Metodologia clinica Modulo 5. I metodi per la sintesi e la comunicazione delle informazioni sulla salute Quali errori influenzano le stime? L errore casuale I metodi per la produzione delle informazioni

Dettagli

ES.2.3. è pari ad 1. Una variabile aleatoria X che assume valori su tutta la retta si dice distribuita

ES.2.3. è pari ad 1. Una variabile aleatoria X che assume valori su tutta la retta si dice distribuita ES.2.3 1 Distribuzione normale La funzione N(x; µ, σ 2 = 1 e 1 2( x µ σ 2 2πσ 2 si chiama densità di probabilità normale (o semplicemente curva normale con parametri µ e σ 2. La funzione è simmetrica rispetto

Dettagli

Ulteriori Conoscenze di Informatica e Statistica

Ulteriori Conoscenze di Informatica e Statistica ndici di forma Ulteriori Conoscenze di nformatica e Statistica Descrivono le asimmetrie della distribuzione Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 ( piano) tel.: 06 55 17 72 17

Dettagli

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari"

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in Scienze e Tecnologie Alimentari Levine, Krehbiel, Berenson Statistica Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari" Unità Integrata Organizzativa

Dettagli

LE DISTRIBUZIONI CAMPIONARIE

LE DISTRIBUZIONI CAMPIONARIE LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria

Dettagli

Compiti tematici dai capitoli 2,3,4

Compiti tematici dai capitoli 2,3,4 Compiti tematici dai capitoli 2,3,4 a cura di Giovanni M. Marchetti 2016 ver. 0.8 1. In un indagine recente, i rispondenti sono stati classificati rispetto al sesso, lo stato civile e l area geografica

Dettagli

Approssimazione normale alla distribuzione binomiale

Approssimazione normale alla distribuzione binomiale Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N

Dettagli

Distribuzione Gaussiana - Facciamo un riassunto -

Distribuzione Gaussiana - Facciamo un riassunto - Distribuzione Gaussiana - Facciamo un riassunto - Nell ipotesi che i dati si distribuiscano seguendo una curva Gaussiana è possibile dare un carattere predittivo alla deviazione standard La prossima misura

Dettagli

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con

Dettagli

DISTRIBUZIONI DI PROBABILITA

DISTRIBUZIONI DI PROBABILITA DISTRIBUZIONI DI PROBABILITA Nell associare ai risultati di un esperimento un valore numerico si costruisce una variabile casuale (o aleatoria, o stocastica). Ogni variabile casuale ha una corrispondente

Dettagli

05. Errore campionario e numerosità campionaria

05. Errore campionario e numerosità campionaria Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,

Dettagli

La verifica delle ipotesi

La verifica delle ipotesi La verifica delle ipotesi Se abbiamo un idea di quale possa essere il valore di un parametro incognito possiamo sottoporlo ad una verifica, che sulla base di un risultato campionario, ci permetta di decidere

Dettagli

UNIVERSITÀ di ROMA TOR VERGATA

UNIVERSITÀ di ROMA TOR VERGATA UNIVERSITÀ di ROMA TOR VERGATA Corso di Laurea Magistrale in Scienze della Nutrizione Umana Corso di Statistica Medica, anno 2015-16 P.Baldi Lista di esercizi 4, 11 febbraio 2016. Esercizio 1 Una v.a.

Dettagli

standardizzazione dei punteggi di un test

standardizzazione dei punteggi di un test DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it standardizzazione dei punteggi di un test serve a dare significato ai punteggi che una persona ottiene ad un test, confrontando la

Dettagli

Correzione primo compitino, testo A

Correzione primo compitino, testo A Correzione primo compitino, testo A Parte Esercizio Facciamo riferimento alle pagine 22 e 2 del libro di testo Quando si ha a che fare con la moltiplicazione o la divisione di misure bisogna fare attenzione,

Dettagli

Matricola: Corso: 1. (4 Punti) Stimare la variazione del reddito quando il prezzo del prodotto finale raddoppia.

Matricola: Corso: 1. (4 Punti) Stimare la variazione del reddito quando il prezzo del prodotto finale raddoppia. Facoltà di Economia Statistica Esame 3-12/04/2010: A Cognome, Nome: Matricola: Corso: Problema 1. Per 5 imprese imprese è stato rilevato il reddito quinquennale medio (in milioni di euro), y, e il corrispondente

Dettagli

Distribuzioni e inferenza statistica

Distribuzioni e inferenza statistica Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione

Dettagli

Corso di Laurea in Ingegneria Informatica Anno Accademico 2012/2013 Calcolo delle Probabilità e Statistica Matematica

Corso di Laurea in Ingegneria Informatica Anno Accademico 2012/2013 Calcolo delle Probabilità e Statistica Matematica Corso di Laurea in Ingegneria Informatica Anno Accademico 2012/2013 Calcolo delle Probabilità e Statistica Matematica Nome... N. Matricola... Ancona, 9 luglio 2013 1. Mario chiede al vicino di casa di

Dettagli

Elementi di base su modello binomiale e modello normale

Elementi di base su modello binomiale e modello normale Elementi di base su modello binomiale e modello normale (alcune note) Parte 1: il modello binomiale Di fondamentale importanza nell analisi della qualità sono i modelli. I due principali modelli statistico-probablistici

Dettagli

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI Perchè confrontare le varianze stimate in due campioni? Torniamo all'esempio dei frinosomi Per poter applicare il test t avevamo detto che le varianze, e

Dettagli

I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito.

I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. TEST DI AUTOVALUTAZIONE - SETTIMANA I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia 1 Parte A 1.1 Si considerino gli

Dettagli

Le statistiche campionarie sono stime dei parametri ignoti della popolazione al cui valore siamo interessati.

Le statistiche campionarie sono stime dei parametri ignoti della popolazione al cui valore siamo interessati. Una volta selezionato il campione, la variabile di interesse viene misurata sugli elementi che lo costituiscono. I valori che la variabile assume vengono poi sintetizzati utilizzando le statistiche opportune

Dettagli

I appello di calcolo delle probabilità e statistica

I appello di calcolo delle probabilità e statistica I appello di calcolo delle probabilità e statistica A.Barchielli, L. Ladelli, G. Posta 8 Febbraio 13 Nome: Cognome: Matricola: Docente: I diritti d autore sono riservati. Ogni sfruttamento commerciale

Dettagli

Concentrazioni. concentrazione quantità di soluzione

Concentrazioni. concentrazione quantità di soluzione Concentrazioni Una soluzione è un sistema omogeneo prodotto dallo scioglimento di una sostanza solida, liquida o gassosa (soluto), in un opportuno liquido (solvente). Definiamo concentrazione di una soluzione

Dettagli

VARIABILI CASUALI CONTINUE

VARIABILI CASUALI CONTINUE p. 1/1 VARIABILI CASUALI CONTINUE Una variabile casuale continua può assumere tutti gli infiniti valori appartenenti ad un intervallo di numeri reali. p. 1/1 VARIABILI CASUALI CONTINUE Una variabile casuale

Dettagli

Prova di recupero di Probabilità e Statistica - A * 21/04/2006

Prova di recupero di Probabilità e Statistica - A * 21/04/2006 Prova di recupero di Probabilità e Statistica - A * /04/006 (NB: saranno prese in considerazione solo le risposte adeguatamente motivate) tempo di lavoro: Due ore. Per conseguire la patente di guida, un

Dettagli

Capitolo 6 La distribuzione normale

Capitolo 6 La distribuzione normale Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 6 La distribuzione normale Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3 Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3 Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows. Immettere Nome utente b## (##

Dettagli

Quanti soggetti devono essere selezionati?

Quanti soggetti devono essere selezionati? Quanti soggetti devono essere selezionati? Determinare una appropriata numerosità campionaria già in fase di disegno dello studio molto importante è molto Studi basati su campioni troppo piccoli non hanno

Dettagli

LA DISTRIBUZIONE NORMALE (Vittorio Colagrande)

LA DISTRIBUZIONE NORMALE (Vittorio Colagrande) LA DISTRIBUZIONE NORMALE (Vittorio Colagrande) Allo scopo di interpolare un istogramma di un carattere statistico X con una funzione continua (di densità), si può far ricorso nell analisi statistica alla

Dettagli

ESERCIZI HLAFO ALFIE MIMUN

ESERCIZI HLAFO ALFIE MIMUN ESERCIZI HLAFO ALFIE MIMUN December, 27. Testo degli esercizi Risolvere i seguenti problemi: () Siano X, X 2, X 3 variabili aleatorie i.i.d. bernulliane di media.5 e siano Y, Y 2, Y 3, Y 4 variabili aleatorie

Dettagli

Esame di Istituzioni di Matematica II del 18 gennaio 2001 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola

Esame di Istituzioni di Matematica II del 18 gennaio 2001 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola Esame di Istituzioni di Matematica II del 8 gennaio 00 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola Es. Es. Es. 3 Es. 4 Somma Voto finale Attenzione: si

Dettagli

Esercizi di Probabilità e Statistica

Esercizi di Probabilità e Statistica Esercizi di Probabilità e Statistica parte 1 Massimo Guerriero Ettore Benedetti Indice Esercizi Presentazione dei dati Misure di sintesi numerica Probabilità Distribuzioni teoriche di probabilità Distribuzione

Dettagli

Esercizi di preparazione all esame di Statistica Dr Alessia Mammone alessia STATISTICA DESCRITTIVA

Esercizi di preparazione all esame di Statistica Dr Alessia Mammone alessia STATISTICA DESCRITTIVA Esercizi di preparazione all esame di Statistica Dr Alessia Mammone alessia mammone@gmail.com STATISTICA DESCRITTIVA Esercizio 1. Calcolare media, varianza, deviazione standard, mediana e moda delle seguenti

Dettagli

Domande di teoria. Esercizi

Domande di teoria. Esercizi 1 Domande di teoria 1. Vedi pp. 131-132 2. Vedi pp. 132-134 3. Vedi p. 134 4. Vedi p. 135 5. Vedi pp. 136-142 6. Vedi pp. 138-139 7. Vedi pp. 141-142 8. Vedi pp. 143-146 9. Vedi pp. 146-148 Esercizi Esercizio

Dettagli

Esempio. Distribuzione binomiale (3)

Esempio. Distribuzione binomiale (3) Esempio. Distribuzione binomiale (3) La prevalenza del daltonismo nella popolazione maschile è p = 6%. Qual è la probabilità di avere almeno 2 daltonici in un campione di 25? Il numero di daltonici in

Dettagli