Esercizi di Statistica per gli studenti di Scienze Politiche Università di Firenze



Documenti analoghi
Prova di autovalutazione Prof. Roberta Siciliano

ESAME DI STATISTICA Nome: Cognome: Matricola:

Il concetto di valore medio in generale

Calcolo delle probabilità

Metodi statistici per le ricerche di mercato

Probabilità e statistica

Corso di. Dott.ssa Donatella Cocca

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

La distribuzione Normale. La distribuzione Normale

Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco

Capitolo 2 Distribuzioni di frequenza

1. Distribuzioni campionarie

Una sperimentazione. Probabilità. Una previsione. Calcolo delle probabilità. Nonostante ciò, è possibile dire qualcosa.

matematica probabilmente

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 7

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Facciamo qualche precisazione

CORSO DI CALCOLO DELLE PROBABILITÀ E STATISTICA. Esercizi su eventi, previsioni e probabilità condizionate

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Primi esercizi per gli studenti del corso di Statistica ed Elementi di Probabilita

Test sul calcolo della probabilità

Analisi e diagramma di Pareto

Statistica. Alfonso Iodice D Enza iodicede@unina.it

Capitolo 4 Probabilità

(concetto classico di probabilità)

OCCUPATI SETTORE DI ATTIVITA' ECONOMICA

Probabilità discreta

Si considerino gli eventi A = nessuno studente ha superato l esame e B = nessuno studente maschio ha superato l esame. Allora A c B è uguale a:

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA

LA STATISTICA E IL CALCOLO DELLE PROBABILITÀ

A = { escono 2 teste e due croci (indipendentemente dall ordine) } B = { al primo tiro esce testa }.


PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

Calcolo delle Probabilita, INGEGNERIA INFORMATICA, semestre II, laurea (ord. Leonardo.

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Esercizi di Calcolo delle Probabilita (I)

Esercizi di Probabilità e Statistica

Statistiche campionarie

La variabile casuale Binomiale

metodi matematici per l ingegneria prove scritte d esame 1 Indice

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1

Esercitazioni del corso di Statistica Prof. Mortera a.a. 2008/2009

Statistica. Esercitazione 3 5 maggio 2010 Serie storiche. Connessione e indipendenza statistica

PROBABILITA' E VARIABILI CASUALI

Anteprima Finale Categoria Corsi di Statistica

METODOLOGIA STATISTICA E CLASSIFICAZIONE DEI DATI

STATISTICA IX lezione

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

Ancora sull indipendenza. Se A e B sono indipendenti allora lo sono anche

ANALISI DELLE FREQUENZE: IL TEST CHI 2

Analisi dei Dati 12/13 Esercizi proposti 3 soluzioni

UNIVERSITÀ DEGLI STUDI DI TERAMO

LA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di

Statistica. Lezione 6

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1

Slide Cerbara parte1 5. Le distribuzioni teoriche

Calcolo del Valore Attuale Netto (VAN)

CALCOLO COMBINATORIO

Esercizi di calcolo combinatorio

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

ESERCIZI EVENTI E VARIABILI ALEATORIE

Per poter affrontare il problema abbiamo bisogno di parlare di probabilità (almeno in maniera intuitiva). Analizziamo alcune situazioni concrete.

Un gioco con tre dadi

Metodi statistici per le ricerche di mercato

STATISTICA DESCRITTIVA - SCHEDA N. 1 VARIABILI QUALITATIVE

LA STATISTICA NEI TEST INVALSI

da 2 a 5 giocatori, dai 10 anni in su, durata 30 minuti

Elementi di Psicometria con Laboratorio di SPSS 1

STATISTICA E PROBABILITá

STATISTICA DESCRITTIVA UNIVARIATA

Contabilità ordinaria, semplificata e altri regimi contabili

Interesse, sconto, ratei e risconti

Relazioni statistiche: regressione e correlazione

Ai fini economici i costi di un impresa sono distinti principalmente in due gruppi: costi fissi e costi variabili. Vale ovviamente la relazione:

ESERCIZIO N 4. Fatturato Supermercati [0;500) 340 [500;1000) 368 [1000;5000) 480 [5000;10000) 37 [10000;20000) 15 taglia = 1240

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica

Esercizio 1 Dato il gioco ({1, 2, 3}, v) con v funzione caratteristica tale che:

REGOLE PER L ESAME (agg.te settembre 2015)

COEFFICIENTI BINOMIALI

Appunti di complementi di matematica

Temi di Esame a.a Statistica - CLEF

Corso di laurea in Economia e Gestione delle Arti e delle Attività Culturali a.a INTRODUZIONE ALLA STATISTICA DESCRITTIVA

ANALISI DI CORRELAZIONE

SPC e distribuzione normale con Access

Corso di ELEMENTI DI STATISTICA Alcuni problemi di probabilità, con soluzioni

ESERCIZI DI STATISTICA DESCRITTIVA

PROVE D'ESAME DI CPS A.A. 2009/ altrimenti.

Esercitazioni 2013/14

Capitolo 2 - Teoria della manutenzione: classificazione ABC e analisi di Pareto

1 Serie di Taylor di una funzione

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria. Statistica descrittiva

IGiochidiArchimede-SoluzioniBiennio 22 novembre 2006

Soluzioni Esercizi elementari

Dimensione di uno Spazio vettoriale

Capitolo 2. Operazione di limite

Esercitazione n.1 (v.c. Binomiale, Poisson, Normale)

PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO

Transcript:

Esercizi di Statistica per gli studenti di Scienze Politiche Università di Firenze Esercizi svolti da una selezione di compiti degli Esami scritti di Statistica VERSIONE PROVVISORIA Maggio 2003 A cura di L. Matrone F.Mealli L.Mencarini A.Petrucci 1

Ai nostri studenti dei corsi di Statistica Con questa nuova versione delle dispense di esercizi svolti di Statistica ci proponiamo, ancora una volta, l obiettivo di aiutarvi a superare la prova scritta dell esame di Statistica che tante preoccupazioni, non del tutto fondate, vi crea. Ed è proprio per tener conto di queste vostre preoccupazioni che, sin dalla prima stesura, abbiamo puntato non a presentare semplicemente degli esercizi di statistica ma ad illustrare lo svolgimento di esercizi di statistica proposti in alcune sedute d esame; inoltre la scelta degli esercizi raccolti è stata fatta in modo da fornire un panorama completo dei possibili temi d esame sia dal punto di vista formale che da quello sostanziale. In questa nuova edizione, ampliata ed integrata, per ciascun problema sono stati messi in evidenza i presupposti teorici e concettuali e sono stati indicati i dettagli del procedimento di calcolo necessario per la determinazione dei risultati numerici richiesti nel tentativo di far comprendere come le formalizzazioni algebriche delle varie misure statistiche si traducano in valutazioni numeriche a partire dai dati disponibili. Gli esercizi proposti sono stati raggrupparti secondo grandi temi: a) statistica descrittiva, b) probabilità e variabili casuali, c) inferenza statistica, in modo da rendere più agevole la consultazione. Naturalmente non vi sfuggirà che i molti richiami teorici costituiscono un utile aiuto per fornire le risposte ai quesiti della cosiddetta Parte teorica della prova d esame. Vogliamo concludere questo nostro messaggio con un invito a voi tutti di segnalarci, non solo gli eventuali errori, ma tutto ciò che vi sembrerebbe utile aggiungere e/o eliminare per migliorare questo supporto didattico e renderlo più utile per la vostra preparazione all esame. Buon lavoro! I docenti di Statistica della Facoltà di Scienze Politiche dell Università di Firenze L.Matrone matrone@ds.unifi.it F.Mealli mealli@ds.unifi.it L.Mencarini mencarin@ds.unifi.it A.Petrucci alex@ds.unifi.it 2

A. ESERCIZI DI STATISTICA DESCRITTIVA Esercizio 1A. Si consideri la seguente distribuzione delle industrie tessili secondo il fatturato annuo in milioni di vecchie lire: Fatturato [300,500] ]500,800] ]800,1500] ]1500,2000] Aziende 20 45 56 50 a) Determinare la distribuzione di frequenze relative. Le frequenze relative si ottengono dividendo ciascuna frequenza assoluta per la numerosità del collettivo N = i =1 4 n i =20 45 56 50=171 Classi di modalità Frequenze assolute Frequenze relative Ampiezza di classe Densità di frequenza Valore centrale ] X i, X i 1 ] n i n i N i = X i 1 X i d i = n i i c i = X i X i 1 2 [300,500] 20 20 171 =0.117 500-300=200 20 200 =0.10 300 500 =400 2 ]500,800] 45 0.2632 800-500=300 0.15 650 ]800,1500] 56 0.3275 1500-800=700 0.08 1150 ]1500,2000] 50 0.2924 2000-1500=500 0.10 1750 Totale 171 1.0000 b) Qual è la percentuale di industrie con fatturato annuo superiore a 500 milioni e non superiore a 1.5 miliardi? Il numero di industrie con tali caratteristiche risulta dalla somma delle frequenze assolute delle classi ] 45 56 500,800] e ]800,1500]. La percentuale richiesta è quindi 171 100=59.06 % c) Calcolare la classe modale del fatturato E' la classe con la densita di frequenza più elevata, che risulta essere la classe ]500, 800]. d) Calcolare il fatturato medio Essendo le modalità raggruppate in classi è necessario fare qualche ipotesi sulla distribuzione del fatturato all'interno di ciascuna classe. Si può ipotizzare, ad esempio, che le frequenze siano concentrate sul valore centrale c i di ogni classe, oppure che il fatturato medio in ogni classe sia pari al valore centrale. Entrambe queste ipotesi conducono al calcolo del fatturato medio come: 4 X = 1 c N i n i =400 20 650 45 1150 56 1750 50171=1106.14 i=1 3

Esercizio 2A. I tentativi di suicidio nel 1995 secondo l'età sono descritti dalla seguente distribuzione di frequenza: Età ] X i, X i 1 ] N tentativi n i [14,18[ 133 [18,25[ 499 [25,45[ 1400 [45,65[ 885 [65,75] 409 Si sa inoltre che la somma delle età di coloro che hanno tentato il suicidio è pari a 141233 anni, N ovvero i=1 x i =141233. a) Calcolare l'età media 5 La numerosità del collettivo è N = n i =3326. Inoltre, poiché la somma delle età di coloro che i =1 hanno tentato il suicidio è uguale a 141233, l'età media sarà data da X = 141233 3326 =42.46 In questo caso non è necessaria alcuna ipotesi semplificatrice per il calcolo della media come invece è stato necessario nell'esercizio 1 in quanto è noto l'ammontare complessivo del carattere età nel collettivo. b) Calcolare la percentuale di minorenni che hanno tentato il suicidio Essendo i minorenni coloro che hanno età nella classe [14,18[, tale percentuale risulta pari a 133 3326 100=3.99% c) Calcolare la percentuale di coloro che hanno tentato il suicidio di età non inferiore a 18 anni e minore di 65 anni Il numero di persone che soddisfano la condizione richiesta è dato dalla somma delle frequenze assolute delle tre classi di età [18,25[, [25,45[ e [45,65[. Dunque la percentuale è pari a d) Calcolare la classe modale 499 1400 885 100=83.7% 3326 Essendo le classi di ampiezza diversa, è necessario individuare la classe a cui corrisponde la densità di frequenza più elevata: 4

Classi di età ] X i, X i 1 ] Frequenze assolute n i Ampiezza intervallo i = X i 1 X i Densità di frequenza d i = n i i [14, 18[ 133 4 33.25 [18, 25[ 499 7 71.29 [25, 45[ 1400 20 70.00.00 [45, 65[ 885 20 44.25 [65, 75] 409 10 40.90 Totale 3326 La classe modale è dunque la classe [18,25[. Esercizio 3A. Sia data la variabile X = reddito mensile in milioni di vecchie lire, rilevata su un collettivo di famiglie come segue: a) Trovare la moda del reddito Reddito X i N di famiglie n i 1 1 2 0 3 5 4 4 La moda è la modalità che si presenta più frequentemente (ovvero che presenta frequenza assoluta più elevata); il reddito modale è dunque pari a 3 milioni. b) Trovare lo scarto quadratico medio del reddito Lo scarto quadratico medio σ, o deviazione standard, è la media quadratica degli scarti dalla media µ La media del reddito è data da e quindi ed infine = 1 4 N i=1 X i 2 n i dove 4 N = n i =10 i=1 = 1 1 2 0 3 5 4 4 = 32 10 10 =3.2 2 = 1 3.2 2 1 2 3.2 2 0 3 3.2 2 5 4 3.2 2 4 =0.76 10 = 0.76=0.87 5

Ricordando che la varianza si può anche determinare utilizzando la relazione: k 2 = 1 X 2 N i n i 2 i=1 si ottiene lo stesso risultato eseguendo i calcoli per la determinazione della varianza come segue: 2 = 12 1 2 2 0 3 2 5 4 2 4 10 3.2 2 = 1 45 64 10.24=0.76 10 c) Trovare lo scarto quadratico medio del reddito nell'ipotesi che ad ogni famiglia venga dato un aumento di stipendio di 500 mila lire Lo scarto quadratico medio, così come la varianza, è invariante per traslazione, ovvero se viene aggiunta una costante α a ciascuna determinazione del carattere lo scarto quadratico medio non cambia: X = X =0.87 Si ricordi, più in generale, che date le costanti α e β si ha e di conseguenza 2 X = 2 2 X X = X d) Trovare il rapporto di concentrazione per il reddito Il rapporto di concentrazione è definito come: R= 2 ovvero come rapporto fra la differenza media semplice e il valore che tale indice di variabilità assume nel caso di massima concentrazione. La differenza media semplice è data da = k i =1 k j =1 X i X j n i n j N N 1 Per determinare i k 2 addendi (k=4 numero di modalità) che compaiono al numeratore dell'espressione precedente si possono costruire due tabelle nelle quali vengono calcolate le differenze X i X j ed i prodotti n i n j : X i X j n i n j X j X i 1 2 3 4 n i 1 0 5 4 1 0 1 2 3 1 1 0 5 4 2 1 0 1 2 0 0 0 0 0 3 2 1 0 1 5 5 0 25 20 4 3 2 1 0 4 4 0 20 16 n j 6

A questo punto il numeratore della differenza media semplice si ottiene moltiplicando elemento per elemento le due tabelle precedenti e sommando i prodotti ottenuti: = 0 1 1 0 2 5 3 4 1 0 0 0 1 0 2 0 2 5 1 0 0 25 1 20 3 4 2 0 1 20 0 16 10 10 1 e quindi il rapporto di concentrazione è dato da = 84 90 =0.993 R= 0.993 2 3.2 =0.146 Esercizio 4A. Nell'a.a. 1988-89, il numero degli iscritti in corso all'università in Italia per Facoltà è riportato nella tabella che segue: Facoltà Studenti in corso (in migliaia) Scientifiche 146 Mediche 100 Ingegneria 193 Economiche-Giuridiche-Sociali 520 Letterarie 239 Come è evidente dai dati, l'unità statistica di rilevazione è la Facoltà ed il carattere è il Numero di studenti in corso, i valori forniti x i costituiscono quindi una successione di osservazioni sulla variabile Numero di studenti in corso e la numerosità del collettivo è N=5. a) Disegnare il diagramma di Lorenz del numero di studenti. Il diagramma di Lorenz è una rappresentazione grafica che permette di evidenziare la concentrazione di un carattere trasferibile. Per costruire il grafico è necessario ordinare le intensità del carattere in senso non decrescente; si calcolano poi le cumulate delle intensità assolute c i = j=1 cumulate delle intensità relative q i = c i nella seguente tabella: i x i c i Intensità cumulate c N e le cumulate di frequenza relative p i = i N Intensita relative cumulate q i i x j i=1 N, le, come risulta Frequeze relative cumulate p i 1 100 100 0.083 0.2 2 146 246 0.210 0.4 3 193 439 0.360 0.6 4 239 678 0.560 0.8 5 520 1198 1 1 Il diagramma di Lorenz si ottiene costruendo la spezzata di concentrazione i cui vertici sono i punti di coordinate p i, q i i=0 N con la posizione p 0, q 0 0,0 7

Diagramma di Lore nz 1 0,8 0,6 q 0,4 0,2 0 0 0,2 0,4 0,6 0,8 1 p b) Calcolare il rapporto di concentrazione. Il rapporto di concentrazione può essere calcolato utilizzando l'indice di Gini dato da: Dalla precedente tabella risulta: e quindi R= N 1 p i q i i=1 N 1 p i i=1 i p i q i p i q i 1 0.2 0.083 0.116 2 0.4 0.205 0.195 3 0.6 0.366 0.233 4 0.8 0.566 234 Σ 2 0.779 R= 0.779 =0.389 2 Allo stesso risultato si può giungere calcolando il rapporto di concentrazione come rapporto fra la differenza media semplice e il doppio della media come di seguito indicato: x i x j x i 100 146 193 239 520 100 0 46 93 139 420 146 46 0 47 93 374 193 93 47 0 46 327 239 139 93 46 0 281 x j 8

520 420 374 327 281 0 Si può osservare che questa tabella è simmetrica rispetto alla diagonale costituita dai valori zero derivanti dalle differenze di intensità di una unità statistica con se stessa; di conseguenza il calcolo del numeratore della differenza media semplice può essere abbreviato moltiplicando per 2 la somma dei valori al di sopra della diagonale indicata e quindi = N N j =1 i =1 ed in definitiva x i x j N N 1 = 2 46 93 139 420 47 93 374 46 327 281 5 4 = 100 146 193 239 520 5 R= 2 = 186.6 479.2 =0.389 = 1198 =239.6 2 =479.2 5 = 3732 20 =186.6 9

Esercizio 5A. Il capitale (in miliardi di lire) di una Società è suddiviso tra i soci nel seguente modo: Socio 1 2 3 4 5 Capitale 3 1 0,5 10 5 a) Calcolare la variabilità del capitale mediante la differenza media semplice. Le informazioni fornite costituiscono una successione di osservazioni sulla variabile Capitale e quindi per calcolare la differenza semplice media si può seguire la stessa procedura dell'esercizio precedente. x i x j x i 0.5 1 3 5 10 0.5 0 0.5 2.5 4.5 9.5 1 0.5 0 2 4 9 3 2.5 2 0 2 7 5 4.5 4 2 0 5 10 9.5 9 7 5 0 = 2 0.5 2.5 4.5 9.5 2 4 9 2 7 5 = 2 46 5 4 5 4 = 46 10 =4.6 b) Rappresentare la concentrazione del capitale mediante la spezzata di Lorenz. Si può procedere come fatto al punto a) dell'esercizio precedente. i x i c i Intensità cumulate x j Intensità relative cumulate q i Frequeze relative cumulate p i 1 0.5 0.5 0.0256 0.2 2 1 1.5 0.0769 0.4 3 3 4.5 0.2307 0.6 4 5 9.5 0.4871 0.8 5 10 19.5 1 1 1,1 Diagramma di Lorenz 0,9 0,7 q 0,5 0,3 0,1-0,1-0,1 0,1 0,3 0,5 0,7 0,9 1,1 p 10

c) Determinare il rapporto di concentrazione. Avendo nel punto a) già calcolato la differenza media semplice, per determinare il rapporto di concentrazione si deve calcolare la media: = 0.5 1 3 5 10 = 19.5 5 5 =3.9 e quindi R= 2 = 4.6 7.8 =0.5897 Esercizio 6A. Su un collettivo formato da 120 maschi e 80 femmine è stata rilevata l'età in anni compiuti ottenendo la seguente distribuzione percentuale per genere: Età % Maschi % Femmine 0-19 10 20 20-29 10 20 30-49 30 30 50-89 50 30 Totale 100 100 Le informazioni fornite si riferiscono ad una variabile statistica discreta suddivisa in classi della quale vengono fornite le distribuzioni percentuali in due sottocollettivi (maschi e femmine). La frequenza percentuale è il numero di unità statistiche per ogni 100 unità del collettivo, ovvero valgono le seguenti relazioni p i = n i 100 N = n i { N 100 n i = p i 100 N p i = f i 100 f i = p i 100 nella quale p i è la frequenza percentuale, n i è la frequenza assoluta, f i è la frequenza relativa ed N è la numerosità del collettivo. a) Trovare il numero di unità statistiche nel collettivo di età minore di 20 anni Per determinare tale numero (q), date le informazioni disponibili, bisognerà sommare il 10% dei maschi di età inferiore a 20 anni al 10% delle femmine con la stessa caratteristica q= 10 20 120 100 100 180=12 16=28 b) Trovare la percentuale di unità statistiche nel collettivo di età maggiore o uguale a 50 anni Bisognerà prima determinare il numero di unità statistiche (n) dell'intero collettivo che soddisfano alla condizione richiesta e poi calcolarne la percentuale (p) rispetto all'intero collettivo: n= 50 30 84 120 80=60 24=84 e quindi la percentuale richiesta è p= 100 100 120 80 100=42 % 11

c) Trovare il numero di maschi di età maggiore o uguale a 30 anni Il numero richiesto è dato da 30 50 100 120=96 d) Trovare le classi modali di età per i maschi e le femmine Sarà necessario individuare per ciascun sottocollettivo la classe cui corrisponde la massima densità di frequenza; determinare tale classe è equivalente a determinare la classe con la massima densità di frequenza relativa in quanto, dette d i, i e i rispettivamente la densità di frequenza assoluta, quella relativa e il numero di modalità per la classe i-ma, si ha: d i = n i i = n N N i = f i i N = i N dalla quale si deduce che, qualunque sia la classe, la densità di frequenza assoluta è proporzionale secondo N alla densità di frequenza relativa i Classe a i, b i Frequenze relative Maschi f i M Frequenze relative Femmine f i F Numero di modalità della classe i =b i a i 1 Densità di frequenza relativa Maschi i M Densita di frequenza relativa Femmine i F (0, 19) 0.10 0.20 20 0.0050 0.0100 (20, 29) 0.10 0.20 10 0.0100 0.0200 (30, 49) 0.30 0.30 20 0.0150 0.0150 (50, 89) 0.50 0.30 40 0.0125 0.0075 Pertanto la classe modale per i maschi è (30, 49) anni, mentre per le femmine è la classe (20, 29) anni. Esercizio 7A. In un collettivo di 200 studenti, di cui 30 sono lavoratori, è stato rilevato il voto ad un certo esame ottenendo la seguente distribuzione percentuale del voto per condizione occupazionale dello studente: Voto % Studenti non lavoratori % Studenti lavoratori 18-22 10 20 23-25 10 40 26-28 30 20 29-30 50 20 Totale 100 100 12

L'ESERCIZIO È SIMILE AL PRECEDENTE, QUINDI VENGONO FORNITI SOLO I RISULTATI a) Trovare il numero di unità statistiche nel collettivo con voto minore di 23 23 unità b) Trovare la percentuale di unità statistiche nel collettivo con voto maggiore o uguale a 29 45.5% c) Trovare il numero di studenti lavoratori con voto maggiore o uguale a 26 12 d) Trovare le classi modali del voto per gli studenti e gli studenti lavoratori La classe modale per gli studenti è quella di voto 29-30, per gli studenti lavoratori invece è quella 23-25. Esercizio 8A. Le abitazioni di una città vengono distinte in quelle abitate dai proprietari e in quelle abitate da affittuari. Le distribuzioni di frequenza relativa delle abitazioni per numero di vani vengono riportate nella tabella che segue; si sa inoltre che il numero di abitazioni abitate dai proprietari è 4000 e quello delle abitazioni in affitto è 6000. Numero di vani 1 2 3 4 5 6 Totale Abitate da proprietari 0,05 0,10 0,15 0,16 0,23 0,31 1 Abitate da affittuari 0,17 0,21 0,22 0,18 0,13 0,09 1 a) Calcolare il numero totale di abitazioni con un numero di vani non inferiore a 5 Si sa che le abitazioni abitate da proprietari sono 4000, mentre quelle abitate da affittuari sono 6000. Il numero di abitazioni, abitate da proprietari, con un numero vani 5 sarà dato da 0.23 0.31 4000=0.54 4000=2160 mentre quello per le case abitate da affittuari sarà 0.13 0.09 6000=0.22 6000=1320 e quindi il numero di abitazioni richiesto è dato da 2160+1320= 3480 b) Calcolare il numero medio di vani per il complesso delle abitazioni Si può determinare la media richiesta in due modi: 1) costruendo la tabella delle frequenze assolute a partire da quella delle frequenze relative date dal problema Numero vani X i 1 2 3 4 5 6 Totale Abitate da proprietari 200 400 600 640 920 1240 4000 n i p Abitate da affittuari 1020 1260 1320 1080 780 540 6000 n i a Totale 1220 1660 1920 1720 1700 1780 10000 n i 13

e calcolando la media nel modo usuale = 1 1220 2 1660 3 1920 4 1720 5 1700 6 1780 =3.636 10000 2) oppure calcolando le medie per le due sottopopolazioni (proprietari e affittuari) e determinando la media richiesta come media delle due medie p = 1 200 2 400 3 600 4 640 5 920 6 1240 =4.35 4000 a = 1 1020 2 1260 3 1320 4 1080 5 780 6 540 =3.16 6000 = 4.35 4000 3.16 6000 =3.636 10000 c) Rappresentare graficamente le abitazioni per numero di vani abitate da affittuari Si vuole mettere in evidenza che, nel grafico 1, i bastoncini sono stati disegnati con l'obiettivo di mettere in evidenza le ordinate dei punti X i,n i e che lo spessore dei bastoncini è del tutto arbitrario e non ha nessun significato. Il grafico andrebbe fatto rappresentando in un riferimento cartesiano i punti X i,n i come nel grafico 2. Abitazioni abitate da affittuari per numero di vani 1400 1200 N Abitazioni 1000 800 600 400 200 0 1 2 3 4 5 6 N vani Grafico 1 Abitazioni abitate da affittuari per numero di vani N Abitazioni 2000 1800 1600 1400 1200 1000 800 600 400 200 0 0 1 2 3 4 5 6 7 N Vani Grafico 2 14

Esercizio 9A. In un collettivo di pazienti sono stati rilevati la quantità di colesterolo in milligrammi per 100 millilitri di sangue ed il genere. Dallo spoglio delle osservazioni si è ottenuta la seguente distribuzione doppia di frequenze Colesterolo Maschio Femmina [120,160] 40 20 ]160,180] 10 12 ]180,200] 20 10 ]200,240] 10 20 ]240,300] 45 10 a) Rappresentare graficamente la distribuzione del colesterolo Lo spoglio effettuato per il carattere quantità di colesterolo ha generato una variabile quantitativa continua, suddivisa in classi, pertanto la rappresentazione grafica opportuna è costituita dall'istogramma. Per costruire l'istogramma bisogna valutare la densità di frequenza per classe, tale valutazione si effettua ipotizzando una uniforme distribuzione della variabile in ciascuna classe e calcolando quindi la densità come rapporto fra frequenza e ampiezza di classe Classi ]X i, X i 1 ] Frequenze assolute n i Ampiezza della classe i = X i 1 X i Densità di frequenza d i = n i i Valori centrali c i = X i X i 1 2 [120, 160] 60 40 1.5 140 ]160, 180] 22 20 1.1 170 ]180, 200] 30 20 1.5 190 ]200, 240] 30 40 0.75 220 ]240, 300] 55 60 0.91 270 La rappresentazione per istogrammi avviene costruendo tanti rettangoli quante sono le classi, le cui basi hanno lunghezza uguale all'ampiezza di classe, con gli estremi negli estremi di classe, e le cui altezze sono pari alla densità di classe, l'area di ciascun rettangolo è quindi pari alla frequenza assoluta della classe. 15

b) Calcolare la media del colesterolo per ciascuno genere I dati sono raggruppati in classi quindi si può determinare solo una media approssimata nell'ipotesi di uniforme distribuzione nella classe, sotto tale ipotesi la media della classe concide con il punto medio della classe stessa e quindi l'ammontare del carattere nella classe si può valutare come prodotto fra il il valore centrale di classe c i e la frequenza di classe n i Di conseguenza per determinare la media aritmetica approssimata si utilizza l'espressione: e quindi = i=1 k c i n i N maschi = 140 40 170 10 190 20 220 10 270 45 =203.6 125 femmine = 140 20 170 12 190 10 220 20 270 10 =192.2 72 c) Calcolare la classe modale del colesterolo per i maschi La classe (o le classi modali) sono quelle con densità di frequenza più elevate Classi Frequenze assolute (maschi) Ampiezza di classe Densità di frequenza [120, 160] 40 40 1 ]160, 180] 10 20 0,5 ]180, 200] 20 20 1 ]200, 240] 10 40 0,25 ]240, 300] 45 60 0,75 Ci sono due classi modali: [120, 160] e ]180, 200]. 16

Esercizio 10A. In un collettivo di 10 studenti è stato rilevato il voto riportato all'esame di Statistica e quello riportato all'esame di Storia Contemporanea: Studente 1 2 3 4 5 6 7 8 9 10 Voto a Statistica (X) 28 22 18 18 20 30 20 23 23 27 Voto a Storia Contemporanea (Y) 30 28 27 18 28 28 28 27 27 18 a) Costruire la distribuzione doppia di frequenze (X,Y) Bisogna costruire una tabella a doppia entrata nella quale viene riportato il numero di unità statistiche sulle quali si osserva la stessa coppia di modalità X i,y j Si ottiene così la seguente distribuzione bivariata Voto a Storia contemporanea(y) Voto a Statistica (X) 18 27 28 30 Totale di riga 18 1 1 0 0 2 20 0 0 2 0 2 22 0 0 1 0 1 23 0 2 0 0 2 27 1 0 0 0 1 28 0 0 0 1 1 30 0 0 1 0 1 Totale di colonna 2 3 4 1 10 I totali per riga e per colonna costituiscono le frequenze corrispondenti alle variabili marginali X e Y. b) Calcolare il voto mediano dell'esame di Statistica Occorre ordinare i voti riportati all'esame di Statistica, ottenendo la seguente successione ordinata 18, 18, 20, 20, 22, 23, 23, 27, 28, 30 Poichè il numero di unità statistiche è N=10, quindi pari, bisognerà considerare i voti riportati dalle N unità statistiche che occupano le posizioni 2 =5 e N 1=6,tali voti sono rispettivamente 22 e 23, 2 la mediana è per definizione un qualunque valore fra i due voti individuati: per convenzione si assume come mediana la media fra i due valori e quindi si ha M e = 22 23 =22.5. 2 c) Stabilire se vi è indipendenza in media di X da Y Vi è indipendenza in media di X da Y, se al variare di Y le medie delle condizionate X / Y =Y j rimangono costanti. Determiniamo quindi tali medie: 17

X / Y =18 = 18 1 27 1 =22.5 2 X / Y =27 = 18 1 23 2 =21.3 3 X / Y =28 = 20 2 22 1 30 1 =23 4 X / Y =30 = 28 1 1 =28 Le medie condizionate non sono uguali fra loro e quindi si può dire che non c'è indipendenza in media di X da Y. Esercizio 11A. In un collettivo di giovani si è osservato l'atteggiamento verso il fumo per classi di età ottenendo la seguente distribuzione di frequenze: Classi di età [16, 18] ]18, 22] ]22, 25] ]25, 30] Fuma 7 8 21 30 Non fuma 16 18 9 10 a) Calcolare la classe modale per l'età di chi fuma e di chi non fuma ]X i, X i 1 ] Frequenze assolute Fumatori n i, F Non fumatori n i, NF Ampiezza della classe Valore centrale Densità di frequenza Fumatori Non fumatori [16, 18] 7 16 2 17 3.5 8 23 ]18, 22] 8 18 4 20 2 4.5 26 ]22, 25] 21 9 3 23.5 7 3 30 ]25, 30] 30 10 5 27.5 6 2 40 Totale 66 53 119 La classe modale per i fumatori è ]22, 25] e per i non fumatori è ]16, 18] b) Calcolare il rapporto di correlazione dell'età dall'atteggiamento verso il fumo. Poiché la variabile è suddivisa in classi tutti gli indici statistici coinvolti saranno calcolati utilizzando i valori centrali delle classi. Il rapporto di correlazione è così definito: n i 18

X / Y = Devianza fra i gruppi = D B = Devianza totale D T h j=1 k i=1 j 2 n. j C i 2 n i. nella quale j e sono rispettivamente la media di X nel j-mo gruppo e nella popolazione e C i sono i valori centrali delle classi. = 4 i=1 C i n i. N fumatori = non fumatori = 4 i=1 n.1 = 17 23 20 26 23.5 30 27.5 40 =22.8235 119 C i n i1 4 C i n i2 i =1 n.2 = 17 7 20 8 23.5 21 27.5 30 =24.2045 66 = 17 16 20 18 23.5 9 27.5 10 =21.1037 53 D B = 24.2045 22.8235 2 66 21.1037 22.8235 2 53=282.5 D T = 17 22.8235 2 23 20 22.8235 2 26 23.5 22.8235 2 30 27.5 22.8235 2 40= =1875.87 2 X Y = 282.5 1875.87 =0.1506 Esercizio 12A. In un collettivo di 420 volontari si è osservato la frequenza di attività di volontariato per classi di età ottenendo la seguente distribuzione di frequenze relative percentuali: Classi di età (X) Frequenza di attività di volontariato (Y) [14,20] ]20,35] ]35,55] ]55,60] Almeno una volta la settimana 10 15 10 5 Una o più volte al mese 10 20 20 10 19

a) Quanti sono i volontari con età superiore a 20 anni e non superiore a 55 anni. La frequenza richiesta è data da 15 10 20 20 420=273 100 b) Quanti sono i volontari che prestano la loro attività almeno una volta la settimana e che hanno un'età superiore a 55 anni e non superiore a 60 anni. Il numero di volontari richiesto è dato da: 5 100 420=21 c) Determinare il rapporto di correlazione dell'età dalla regolarità del servizio di volontariato. Prima di procedere nel calcolo del rapporto di correlazione sarà necessario individuare i valori centrali di classe per la variabile X e la sua distribuzione marginale di frequenze percentuali. Valore centrali C i 17 27.5 45.0 57.5 Frequenza percentuale p i 20 35 30 15 Indicando con n 1i e p 1i rispettivamente la frequenza assoluta e percentuale di coloro che svolgono attività di volontariato almeno una volta la settimana e hanno un'età della classe i-ma, con n 2i e p 2i le corrispondenti frequenze di coloro che svolgono attività di volontariato una o più volte al mese, con N la numerosità del collettivo, con 1 l'età media di coloro che svolgono attività di volontariato almeno una volta la settimana, con 2 l'età media di coloro che svolgono attività di volontariato una o più volte al mese, con µ l'età media del collettivo di volontari e tenendo conto di quanto detto nell'esercizio 6A, si ha p 1i = n 1i N 100 e quindi 1 = 4 i=1 C i n 1i n 1. = 4 i=1 C n 1i i N 100 100 N = n 1i 4 i =1 4 C i p 1i i=1 4 n i1 100 i=1 N 1 = 17 10 27.5 15 45 10 57.5 5 = 1320 40 40 =33 ed analogamente 2 = 17 10 27.5 20 45 20 57.5 10 =36.8 60 = 17 20 27.5 35 45 30 57.5 15 =35.15 100 = 4 C i p 1i i =1 4 p 1i i =1 Possiamo ora determinare il rapporto di correlazione dell'età dalla frequenza di attività di volontariato 2 Devianza fra i gruppi X Y = = D B Devianza totale D T 20

2 D B = j=1 i 2 p j = 33 35.15 2 40 36.58 35.15 2 60=307.594 4 D T = C i 2 p i i=1 D T = 17 35.15 2 20 27.5 35.15 2 35 45 35.15 2 30 57.5 35.15 2 15=19040.23 2 X Y = 307.59 19040.23 =0.01615 Esercizio 13A. Su un collettivo di individui sono stati rilevati i caratteri X (Peso in Kg) e Y (Altezza in cm) ottenendo la seguente distribuzione congiunta di frequenze: a) Ricostruire la successione ordinata dell'altezza Y X 165 170 175 60 2 0 0 70 0 1 0 80 1 0 1 Al fine di rispondere al quesito costruiamo la distribuzione di frequenze della marginale Y Y n. j dalla quale otteniamo la successione richiesta 165 3 170 1 175 1 165, 165, 165, 170, 175 b) Calcolare la media e la mediana dell'altezza Essendo N=5 (dispari) la mediana è il valore che occupa il terzo posto N 1 2 =3 nella successione ordinata; quindi la mediana è pari a 165 Per calcolare la media della Y utilizziamo la distribuzione di frequenze costruita al punto precedente y = 163 3 170 1 175 1 = 840 5 5 =168 c) Calcolare il peso medio per gli individui che hanno un'altezza di 165 cm X Y =165 = 60 2 70 0 80 1 =66.66 3 21

d) Calcolare il coefficiente di correlazione lineare tra peso e altezza Il coefficiente di correlazione lineare è dato da: XY = XY = Cov X, Y X Y Var X Var Y 3 X = 1 N i=1 X i n i = 60 2 70 1 80 2 = 350 5 5 =70 3 X 2 = 1 N i=1 X = 80=8.94 3 Y 2 = 1 N i =1 Y = 16=4 X i X 2 n i = 60 70 2 2 70 70 2 1 80 70 2 2 =80 5 Y j Y 2 n j = 165 168 2 3 170 178 2 1 175 168 2 1 =16 5 3 3 j=1 XY = 1 N i =1 X i X Y j Y n ij XY = 60 70 165 168 2 80 70 165 168 1 5 70 70 170 168 1 80 70 175 168 1 5 XY = 60 30 0 70 = 100 5 5 =20 XY = 20 4 8.94 =0.56 Esercizio 14A. Lo stipendio medio annuo (X), in migliaia di euro, dei dirigenti e il numero di dipendenti (Y) di 9 aziende sono riportati nella tabella che segue: Azienda 1 2 3 4 5 6 7 8 9 Stipendio 45 30 84 63 62 61 46 43 42 N Dipendenti 14 16 46 32 22 21 28 17 24 22

a) Calcolare il coefficiente di correlazione lineare fra X e Y I dati forniti costituiscono quella che si chiama una successione doppia, infatti per ciascuna delle 9 unità statistiche di rilevazione (aziende) sono riportati i valori delle due variabili Stipendio medio annuo dei dirigenti e Numero di dipendenti, ciò determina una semplificazione delle espressioni per il calcolo degli tutti indici statistici da utilizzare come appresso indicato 9 1 { X = 9 i=1 Y = 1 9 9 i=1 9 x i 2 X = 1 x 9 i X 2 = 1 x 2 2 i=1 9 i X i=1 9 y i 2 Y = 1 y 9 i Y 2 = 1 y 2 2 i=1 9 i Y i =1 9 9 9 9 XY = 1 x 9 i X y i Y = 1 i=1 9 i=1 x i y i X Y e quindi XY = XY X Y X = 45 30 84 63 62 61 46 43 42 = 476 9 9 =52.89 Y = 14 16 46 32 22 21 28 17 24 = 220 9 9 =24.44 2 X = 452 30 2 84 2 63 2 62 2 61 2 46 2 43 2 42 2 52.89 2 = 27244 2797.23=229.88 9 9 2 Y = 142 16 2 46 2 32 2 22 2 21 2 28 2 17 2 24 2 24.44 2 = 6166 597.53=87.58 9 9 XY = 45 14 30 16 84 46 63 32 61 21 46 28 43 17 42 24 52.89 24.44= 9 = 12662 1292.84=114.05 9 114.05 XY = 229.88 87.58 = 114.05 15.16 9.36 =0.8 b) Determinare la mediana del numero di dipendenti Ricordiamo che la mediana è l'intensità del carattere ordinabile posseduta dall'unità statistica che, nella sucessione ordinata delle modalità, è preceduta e seguita dallo stesso numero di unità statistiche del collettivo; per individuare quindi la mediana sarà necessario ordinare le unità statistiche in ordine crescente (descrescente) secondo il numero di dipendenti, la successione ordinata delle osservazioni date è la seguente Azienda 1 2 8 6 5 9 7 4 3 N Dipendenti 14 16 17 21 22 24 28 32 46 l'unità statistica preceduta e seguita dallo stesso numero di unità statistiche (4) è l' Azienda 5 che possiede un numero di dipendenti pari a 22, quindi la mediana è proprio 22; in generale, quando la numerosità del collettivo è dispari, la posizione nella successione ordinata delle modalità dell'unita statistica mediana è data da N 1 /2 nella quale N è la numerosità del collettivo; così, nel nostro caso, la posizione mediana è 9 1 /2=5 e di conseguenza la mediana è il 5 valore nella successione ordinata su costruita, cioè 22. 23

B. ESERCIZI DI PROBABILITA' E VARIABILI CASUALI 24

B1. Calcolo delle probabilità Esercizio 1B1. In una popolazione di 400 laureati in Scienze Politiche la distribuzione secondo il sesso e lo stato lavorativo a due anni dalla laurea è la seguente: Si estrae a caso un laureato. Occupato Disoccupato Maschio 100 50 Femmina 150 100 Premessa Al fine di poter effettuare una estrazione casuale di una unità statistica del collettivo si può pensare di associare a ciascuna di esse una pallina, di diametro costante e di un dato materiale in determinate condizioni fisico-chimiche, sulla quale annotare genere e stato occupazionale. Le 400 palline così costruite vengono inserite in una scatola e mescolate accuratamente. La prova consiste nell'estrarre una sola pallina dalla scatola. In queste condizioni ciascuna pallina ha la stessa probabilità di essere estratta. Si è così costruito uno spazio di eventi (le 400 palline) necessari (una pallina verrà estratta), incompatibili (una sola pallina verrà estratta) ed equiprobabili (ciascuna pallina ha la stessa probabilità di essere estratta): ciascuna pallina ha probabilità data da 1 400. Il problema di calcolare la probabilita di estrarre una pallina con una particolare annotazione, per esempio femmina, si risolve considerando tale annotazione (femmina) come un evento composto dalla disgiunzione (unione) di un numero k (le 250 palline con femmina) di eventi incompatibili ed equiprobabili e quindi la sua probabilità sarà data dalla somma delle probabilità di questi k eventi equiprobabili cioè k 1 400 (la probabilità di femmina sarà 250 /400), ovvero dal rapporto fra il numero di casi favorevoli (le 250 palline con femmina) e il numero di casi possibili (le 400 palline). Dalle considerazioni esposte si può concludere che la frequenza relativa di una modalita di un carattere può essere vista come la probabilità di un evento: quello individuato dalla modalità fissata. a) Qual è la probabilità che sia disoccupato? Occupato Disoccupato Maschio 100 50 150 Femmina 150 100 250 250 150 400 Si considerino gli eventi A:={essere disoccupato} e B:={essere maschio}, dalle considerazioni svolte in premessa si ha: Pr A = 150 400 =0.375 b) Qual è la probabilità che sia disoccupato e maschio? Pr A B = 50 400 =0.125 c) Qual è la probabilità che sia disoccupato dato che è stato estratto un maschio? 25

Pr A B = Pr A B Pr B 50 400 = 150 400 = 50 150 =0.125 Esercizio 2B1. Un collettivo di 200 studenti è stato classificato secondo il voto riportato ad un dato esame e a seconda che l'esame in oggetto sia stato il primo ad essere sostenuto o meno Si estrae a caso dal collettivo uno studente. Primo esame Voto si no voto 24 40 15 voto 25 45 100 Si considerino gli eventi A:={voto 24} e B:={è il primo esame sostenuto} a) Calcolare Pr(A) Primo esame Voto si no voto 24 40 15 55 voto 25 45 100 145 85 115 200 Pr A = 55 200 =0.275 b) Calcolare Pr(B) Pr B = 85 200 =0.425 c) Calcolare Pr A B Pr A B =Pr A Pr B Pr A B = 55 200 85 200 40 200 = 100 200 =0.5 d) Calcolare Pr B A Pr B A = 40 Pr A B 200 = = 40 Pr A 55 55 =0.727 200 26

Esercizio 3B1. Un collettivo di 200 donne è stato classificato secondo lo stato civile e l'età come segue: Si estrae dal collettivo casualmente una donna. Stato civile Età Nubile Coniugata fino a 25 anni 40 15 più di 25 anni 45 100 Si considerino gli eventi A:={avere una età fino a 25 anni} e B:={essere coniugata} a) Calcolare Pr(A) b) Calcolare Pr(B) c) Calcolare Pr A B d) Calcolare Pr A B e) Calcolare Pr B A Nubile Coniugata fino 25 anni 40 15 55 più di 25 anni 45 100 145 85 115 200 Pr A = 55 200 =0.275 Pr B = 115 200 =0.575 Pr A B = 15 200 =0.075 Pr A B =Pr A Pr B Pr A B =0.275 0.575 0.075=0.775 f) A e B sono eventi indipendenti? Pr B A = Pr A B = 0.075 Pr A 0.275 =0.273 Due eventi si dicono stocasticamente indipendenti se Pr B A = Pr B dai risultati ottenuti ai precedenti punti b) ed e) si deduce che la condizione di indipendenza non è verificata. 27

Esercizio 4B1. Un collettivo di 200 giovani è stato classificato secondo lo stato civile e la condizione lavorativa come segue: Stato civile Condizione lavorativa Celibe Coniugato lavora 50 60 non lavora 70 20 Si estrae dal collettivo casualmente un giovane. Si considerino gli eventi A:={non lavora} e B:={essere celibe}. a) Calcolare Pr(A) Celibe Coniugato lavora 50 60 110 non lavora 70 20 90 120 80 200 Pr A = 90 200 =0.45 b) Calcolare Pr A B Pr A B = 70 200 =0.35 c) A e B sono eventi indipendenti? Due eventi si dicono stocasticamente indipendenti se Pr A B = Pr A ; determiniamo quindi la probabilità a primo membro della precedente Pr B = 120 200 =0.6 Pr A B = poiché risulta, tenendo conto del punto a), che eventi non sono indipendenti. d) Calcolare Pr A B Pr A B = 0.35 Pr B 0.6 =0.583 Pr A B Pr A possiamo concludere che i due Pr A B =Pr A Pr B Pr A B =0.45 0.6 0.35=0.7 28

Esercizio 5B1. Delle auto prodotte da una certa casa automobilistica si sa che 1 su 100 presenta difetti di carrozzeria e che 4 su 180 presentano difetti meccanici, inoltre fra le auto con difetti di carrozzeria la probabilità di trovarne una con difetti meccanici è pari a 0.002. Calcolare la probabilità di produrre un'auto con difetti di un tipo o dell'altro. Definiamo i seguenti eventi: Bisognerà determinare la Pr A B Dai dati del problema sappiamo che: dalle quali otteniamo: ed in conclusione A:={l'auto presenta difetti di carrozzeria} B:={l'auto presenta difetti meccanici} Pr A = 1 4 =0.01 Pr B = =0.022 Pr B A =0.002 100 180 Pr A B =Pr A Pr B A =0.01 0.002=0.00002 Pr A B =Pr A Pr B Pr A B =0.01 0.022 0.00002=0.0319 Esercizio 6B1. Con riferimento ad un collettivo di 600 studenti dell'università di Firenze si considerino i seguenti eventi: A := {ha superato l'esame di Economia} B := {frequenta il corso di Statistica}. Sapendo che 400 studenti hanno superato l'esame di Economia, che 300 studenti frequentano il corso di Statistica e che 200 sono gli studenti che hanno superato l'esame di Economia e frequentano il corso di Statistica a) Calcolare Pr(A) b) Calcolare Pr A B Pr A = 400 600 =0.66 Pr A B = 200 600 =0.33 c) Calcolare Pr A B Pr A B =Pr A Pr B Pr A B = 400 600 300 600 200 600 = 500 600 =0.83 29

Esercizio 7B1. Per un paziente con certi sintomi si considerino i seguenti eventi: A := { ha l'influenza } B := { ha la polmonite } C := { ha la febbre a 40} sapendo che: A B= A B=I Pr A =0.7 Pr C A =0.3 Pr C B =0.8 dove si è posto I :={evento certo} e :={evento impossibile} a) Calcolare la probabilità che il paziente abbia la polmonite Poiché gli eventi A e B sono necessari ed incompatibili si ha Pr B =1 Pr A =0.3 b) Calcolare la probabilità che abbia l'influenza dato che ha la febbre a 40 Tenendo conto delle notazioni adottate nel testo del problema bisogna calcolare la Pr A C che è Pr A C data da Pr C Si può ora notare che (vedi anche figura) Pr C =Pr C I =Pr C A B =Pr [ C A C B ] e tenendo conto del fatto che gli eventi C A e C B sono incompatibili, in quanto lo sono A e B, si ha Pr C =Pr C A Pr C B e poichè Pr C A =Pr C A Pr A =0.3 0.7=0.21 Pr C B =Pr C B Pr B =0.8 0.3=0.24 e quindi Pr C =0.45 ed in definitiva la probabilità richiesta è data da Pr A C Pr A C = = 0.21 Pr C 0.45 =0.47 Naturalmente quanto è stato fatto non è altro che la derivazione della probabilità a posteriori dell'evento A sapendo che si è verificato C data dal teorema di Bayes. A C= A C B C A C B B C 30

Esercizio 8B1. Uno studente al primo anno di università vuole conoscere le sue possibilità di laurearsi entro 4 anni. Gli vengono fornite le seguenti informazioni: 1) il 15% degli iscritti si laurea entro 4 anni; 2) su 10 laureati entro 4 anni 6 hanno riportato il massimo dei voti all'esame di diploma di scuola media superiore; 3) su 100 laureati con tempi superiori ai 4 anni 10 hanno riportato il massimo dei voti all'esame di diploma di scuola media superiore. Sapendo che lo studente in questione ha riportato il massimo dei voti all'esame di diploma di scuola media superiore, qual è la probabilità che si laurei entro 4 anni? Si considerino i seguenti eventi: A:={laurea conseguita entro 4 anni} B:={riportare il massimo dei voti all'esame di diploma di scuola media superiore} In base ai dati del problema sarà: Pr A = 15 100 =0.15 Pr B A =0.6 Pr B A =0.1 Si deve quindi calcolare Pr A B, con considerazioni analoghe a quelle dell'esercizio precedente si ha: ed in definitiva Pr B A =Pr A Pr B A =0.15 0.6=0.09 Pr A =1 Pr A =0.85 Pr B A =Pr A Pr B A =0.85 0.1=0.085 Pr B =Pr B A Pr B A =0.09 0.085=0.175 Pr A B = Pr A B = 0.09 Pr B 0.175 =0.514 Esercizio 9B1. Un giovane deve decidere se iscriversi all'università per conseguire una laurea o mettersi sul mercato del lavoro. Egli sa che tra i giovani lavoratori il 30% ha la laurea mentre tra i disoccupati il 20% è laureato. Inoltre, data la situazione economica, la probabilità per un giovane di lavorare è 0.8. Consigliereste al giovane di iscriversi all'università per conseguire una laurea? Si considerino gli eventi: A:={il giovane lavora} B:={il giovane ha la laurea} I:={evento certo} Dai dati del problema si ha: Pr A =0.8 P A =0.2 Pr B A =0.3 Pr B A =0.2 Al fine di dare una risposta al quesito si dovrà stabilire quale fra le due probabilità Pr A B e 31

Pr A B è maggiore. Con i dati disponibili possiamo calcolare le seguenti probabilità Osservando che si ha Pr B A =Pr A Pr B A =0.8 0.3=0.24 Pr B A =Pr A Pr B A =0.2 0.2=0.04 Pr B =Pr B A Pr B A =0.24 0.04=0.28 Pr B =0.72 A=A I= A B B = A B A B Pr A = Pr A B Pr A B Pr A B = Pr A Pr A B =0.8 0.24=0.56 ed in definitiva quindi Pr A B = Pr A B = Pr A B = 0.24 Pr B 0.28 =0.857 Pr A B = 0.56 Pr B 0.72 =0.778 si può quindi concludere che conviene conseguire una laurea in quanto, possedendo tale titolo, è maggiore la probabilità di trovare un lavoro. Esercizio 10B1. In un ufficio le pratiche relative ad una certa procedura amministrativa vengono affidate casualmente a tre impiegati che indicheremo con A,B,C. La probabilità che una pratica venga completata entro una settimana per ciascun impiegato è indicata nella tabella che segue: Impiegato A B C Probabilità 0.4 0.8 0.3 Avendo ricevuto una pratica espletata entro una settimana qual è, secondo voi, l'impiegato al quale era stata affidata? Si considerino i seguenti eventi: S:={la pratica è completata entro una settimana} A:={la pratica è affidata all'impiegato A} B:={la pratica è affidata all'impiegato B} C:={la pratica è affidata all'impiegato C} Dai dati del problema si ha: Pr A = Pr B =Pr C = 1 3 in quanto la pratica viene affidata casualmente ad uno dei tre impiegati, inoltre Pr S A =0.4 Pr S B =0.8 Pr S C =0.3 32

Per rispondere alla domanda posta sarà necessario stabilire qual è la maggiore fra le seguenti tre probabilità: Utilizzando il teorema di Bayes si ha: Pr A S Pr B S Pr C S Pr A Pr S A Pr A S = Pr A Pr S A Pr B Pr S B Pr C Pr S C Calcoliamo il denominatore della precedente che non è altro che la Pr S e quindi Pr S = Pr A Pr S A Pr B Pr S B Pr C Pr S C Pr S = 1 3 0.4 1 3 0.8 1 3 0.3= 1 3 0.4 0.8 0.3 =1 3 1.5 ed analogamente Pr A S = Pr A Pr S A Pr S 1 3 0.4 0.4 = = 1 3 1.5 1.5 =0.267 1 Pr B Pr S B 3 0.8 0.8 Pr B S = = = Pr S 1 3 1.5 1.5 =0.533 1 Pr C Pr S C 3 0.3 0.3 Pr C S = = = Pr S 1 3 1.5 1.5 =0.2 Si può quindi concludere che l'impiegato B è quello che, con maggiore probabilità, ha espletato la pratica riconsegnata. Esercizio 11B1. Si consideri un mazzo di 40 carte costituito da 10 carte per ciascun seme (,,, ) e per ciascun seme le carte sono numerate da 1 a 10. Si estraggano da tale mazzo due carte senza reintroduzione. a) Calcolare la probabilità che entrambe siano Poiché le estrazioni sono effettuate senza reintroduzione, gli eventi nella prima e seconda prova non sono indipendenti, inoltre, in ciascuna prova, la probabilità di estrarre una determinata carta è data da 1 k nella quale k è il numero di carte rimaste nel mazzo. Consideriamo ora i seguenti eventi: C 1 :={si verifica una carta di cuori alla prima estrazione} C 2 :={si verifica unacarta di cuori alla seconda estrazione} 33

Bisognerà calcolare la probabilità dell'evento C 1 C 2 Pr C 1 C 2 = Pr C 1 Pr C 2 C 1 = 10 40 9 39 =0.25 0.23=0.0575 b) Calcolare la probabilità che la seconda sia dato che la prima è un 2 Consideriamo gli eventi. ed osserviamo che 2 1 :={si verifica unacarta due alla primaestrazione } P 2 :={si verifica unacarta di picche alla seconda estrazione } 2P 1 :={si verifica un due di picche alla prima estrazione} 2Q 1 :={si verifica un duedi quadri alla prima estrazione} 2C 1 :={si verifica un due di cuori alla prima estrazione} 2F 1 :={si verifica un due di fiori alla prima estrazione} 2 1 =2P 1 2Q 1 2C 1 2F 1 Pr 2 1 =Pr 2P 1 Pr 2Q 1 Pr 2C 1 Pr 2F 1 = 1 40 1 40 1 40 1 40 = 4 40 2 1 P 2 = 2P 1 2Q 1 2C 1 2F 1 P 2 = 2P 1 P 2 2Q 1 P 2 2C 1 P 2 2F 1 P 2 Pr 2 1 P 2 = Pr 2P 1 P 2 2Q 1 P 2 2C 1 P 2 2F 1 P 2 = =Pr 2P 1 P 2 Pr 2Q 1 P 2 Pr 2C 1 P 2 Pr 2F 1 P 2 = =Pr 2P 1 Pr P 2 2P 1 Pr 2Q 1 Pr P 2 2Q 1 Pr 2C 1 Pr P 2 2C 1 Pr 2F 1 Pr P 2 2F 1 = = 1 40 9 39 1 40 10 39 1 40 10 39 1 40 10 39 = 1 40 9 39 3 1 40 10 39 = 39 40 39 = 1 40 e quindi c) Calcolare la probabilità che la seconda sia Consideriamo gli eventi: 1 Pr P 2 2 1 = Pr 2 P 1 2 40 = = 1 Pr 2 1 4 4 =0.25 40 Q 1 :={si verificauna carta di quadri alla prima estrazione} Q 2 :={si verifica unacarta di quadri alla seconda estrazione} Possiamo osservare che l'evento Q 2 si verificherà quando si verificherà uno dei seguenti due eventi Q 1 Q 2 oppure Q 1 Q 2 che sono incompatibili e quindi 34

Pr Q 2 =Pr Q 1 Q 2 Pr Q 1 Q 2 =Pr Q 1 Pr Q 2 Q 1 Pr Q 1 Pr Q 2 Q 1 = = 10 40 9 39 30 40 10 39 = 10 40 9 39 10 10 = 39 40 39 39 = 1 4 =0.25 Osservazione: Naturalmente sarà 0.25 la probabilità di estrarre alla seconda prova una carta di uno qualunque degli altri semi e ricordando dal punto b) che Pr P 2 2 1 =0.25=Pr P 2 possiamo concludere che, il sapere il numero della carta alla prima estrazione, non modifica la probabilità del colore della carta alla seconda estrazione; in altre parole saper il numero non aiuta a prevedere il colore. Esercizio 12B1. Vengono estratte, senza reintroduzione, tre carte da un mazzo di 52 contenente 13 carte di ciascun seme (fiori, quadri, picche, cuori), per ciascun seme le carte sono contrassegnate dai numeri da 2 a 10, da fante, regina, re, asso. Nella presentazione della soluzione utilizzeremo per gli eventi notazioni analoghe a quelle dell'esercizio precedente. a) Trovare la probabilità che abbiano tutte lo stesso contrassegno L'evento E:={tre carte con lo stesso contrassegno} è costituito dalla disgiunzione dei 13 eventi incompatibili ed equiprobabili S i 1 S i 2 S i i 3 nel quale S j con i=1 13 e j=1 3 rappresenta una carta con un determinato contrassegno, l'i-mo, alla j-ma estrazione, per esempio S 3 2 indica il verificarsi della carta 3 alla seconda estrazione, con queste posizioni calcoliamo la probabilità richiesta Pr E = Pr 13 13 S i 1 S i 2 S i = 3 Pr S i 1 S i 2 S i 3 =13 Pr S 2 1 S 2 2 S 2 3 = i=1 i=1 =13 Pr S 1 2 Pr S 2 2 S 1 2 Pr S 3 2 S 1 2 S 2 2 =13 4 52 3 51 2 50 =13 0.077 0.059 0.04=0.0024 b) Trovare la probabilità che nessuna delle tre carte sia asso Pr nessuna sia asso = Pr A 1 A 2 A 3 =Pr A 1 Pr A 2 A 1 Pr A 3 A 1 A 2 = = 48 52 47 51 46 50 =0.923 0.922 0.92=0.783 35

B2.1. Variabili casuali discrete Esercizio 1B2.1. Vi propongono di giocare al seguente gioco: si lanciano due monete, se si verificano due teste si vince 1 euro, se si verificano due croci si vince 0.5 euro, in tutti gli altri casi non si vince nulla. Per partecipare al gioco si paga 0.5 euro. Conviene giocare a questo gioco? (calcolare la vincita media) Indicando con T 1 e C 1 gli eventi Testa e Croce per una delle due monete e con T 2 e C 2 i corrispondenti eventi per l'altra moneta, lo spazio degli eventi Ω generato dal lancio delle due monete è dato da: ={ T 1 T 2, T 1 C 2, C 1 T 2, C 1 C 2 } Supponendo che le due monete siano bilanciate, cioè siano uguali le probabilità di Testa e di Croce e 1 quindi entrambe uguali ad 2, la probabilità di ciascuno dei 4 eventi di Ω sarà data da 1 4 in quanto ciascuna coppia di risultati è costituita da eventi indipendenti e di conseguenza la sua probabilità è data dal prodotto delle probabilità dei due eventi che la costituiscono. Costruiamo ora una variabile casuale G che associa a ciascun evento di Ω la differenza fra vincita e costo di partecipazione al gioco G :{ T 1 T 2 1 1 0.5=0.5 Pr 0.5 = 4 C 1 C 2 0.5 0.5=0 Pr 0 = 1 4 C 1 T 2 T 1 C 2 0 0.5= 0.5 Pr 0.5 = 1 4 1 4 =1 2 Il valore atteso della variabile casuale G ci fornirà il guadagno atteso del gioco proposto e quindi la risposta al quesito posto E [G]=0.5 1 4 0 1 4 0.5 1 2 = 0.125 poiché il guadagno atteso è negativo non conviene partecipare al gioco proposto. Esercizio 2B2.1. Un urna contiene palline bianche e nere con probabilità rispettivamente uguale 0.3 e 0.7. La prova consiste nell estrarre ripetutamente una pallina dall urna rimettendo la pallina nell urna dopo ogni estrazione. a) Calcolare la probabilità di ottenere la prima pallina bianca alla decima estrazione. Poiché le estrazioni sono effettuate con reintroduzione non cambia, da un'estrazione all'altra, la 36

composizione dell'urna e quindi la probabilità dei due risultati possibili: la probabilità di ottenere una pallina di un determinato colore ad una certa estrazione è sempre la stessa ad ogni estrazione, ciò si sintetizza dicendo che le estrazioni sono indipendenti. Indicando con N i l'evento {pallina nera alla i-ma estrazione} e con B i l'evento {pallina bianca alla i-ma estrazione} bisogna calcolare la probabilità dell'evento e quindi E 10 := N 1 N 2 N 3 N 4 N 5 N 6 N 7 N 8 N 9 B 10 9 Pr E 10 = 1 Pr N Pr B i 10 =0.7 9 0.3 b) Calcolare la probabilità di ottenere la prima pallina bianca fra la settima e la nona estrazione. Indicando con E j l'evento {la prima pallina bianca si ottiene alla j-ma estrazione} si dovrà determinare la probabilità dell'evento B := E 7 E 8 E 9 nel quale i tre eventi E 7,E 8 ed E 9 sono incompatibili e quindi: Pr B = Pr E 7 E 8 E 9 = Pr E 7 Pr E 8 Pr E 9 =0.7 6 0.3 0.7 7 0.3 0.7 8 0.3=0.077 Esercizio 3B2.1. Un urna contiene 7 palline gialle e 3 rosse. a) Calcolare la probabilità che, estraendo dall urna due palline senza reintroduzione, alla seconda estrazione si verifichi pallina gialla Utilizzando notazioni analoghe a quelle dell'esercizio 1B2.1 e tenendo conto che in questo caso le estrazioni non sono indipendenti in quanto la pallina estratta non viene rimessa nell'urna, si ha: G 2 = G 1 G 2 R 1 G 2 Pr G 2 =Pr G 1 G 2 R 1 G 2 =Pr G 1 G 2 Pr R 1 G 2 = =Pr G 1 Pr G 2 G 1 Pr R 1 Pr G 2 R 1 = 7 10 6 9 3 10 7 9 = 7 10 =0.7 b) Calcolare la probabilità che, estraendo dall urna due palline senza reintroduzione, si verifichi pallina rossa alla prima estrazione e gialla alla seconda Pr R 1 G 2 =Pr R 1 Pr G 2 R 1 = 3 10 7 9 =0.23 37

Esercizio 4B2.1. La proporzione di studenti di una certa Facoltà che hanno superato un determinato esame è 0.3 e si ipotizza di estrarre un campione casuale di 50 studenti della stessa Facoltà. a) Stabilire la probabilità di ottenere una proporzione campionaria di studenti che hanno superato quell esame pari a 0.4. La proporzione campionaria è una variabile casuale definita da X n nella quale X rappresenta il numero di successi nelle n estrazioni, in questo caso il valore fissato della proporzione campionaria è 0.4 in un campione di numerosità 50 e quindi x=0.4 50=20. Si dovrà quindi calcolare la probabilità di ottenere 20 successi in 50 prove di Bernoulli indipendenti, ciascuna con probabilità di successo θ pari a 0.3; a tale scopo utilizziamo la funzione di distribuzione di probabilità della variabile casuale binomiale (X) che fornisce appunto la probabilità di ottenere x successi in n prove bernoulliane la probabilità richiesta sarà quindi Pr X = x = n x x 1 n x x=0,1, 2, n Pr X =20 = 50 20 0.320 1 0.3 50 20 50! = 20! 50 20! 0.320 0.7 30 =0.037 Esercizio 5B2.1. I corsi di Statistica offerti negli atenei italiani richiedono agli studenti di acquistare un numero variable di libri di testo. Sia X la variabile casuale che rappresenta il numero di libri di testo richiesti da un corso di Statistica scelto a caso. X può assumere soltanto i valori 0, 1, 2, 3, 4, 5 e la tabelle sottostante fornisce la distribuzione di probabilità della variabile causuale X (a meno di una delle probabilità che è mancante): Numero di libri richiesti x 0 1 2 3 4 5 Probabilità Pr(X=x)? 0.45 0.24 0.12 0.09 0.05 a) Che valore ha la probabilità mancante? Affinchè la funzione di distribuzione di probabilità Pr(X=x) sia ben definita dovrà essere: Pr X = x 0 x=0,1,2,3,4,5 5 x=0 Pr X = x =1 di conseguenza, tenendo conto della seconda delle precedenti condizioni, si dovrà avere Pr X =0 Pr X =1 Pr X =2 Pr X =3 Pr X =4 Pr X =5 =1 Pr X =0 0.45 0.24 0.12 0.09 0.05=1 Pr X =0 =1 0.45 0.24 0.12 0.09 0.05 =0.05 quindi la probabilità richiesta è pari a 0.05, notiamo infine che anche la prima delle condizioni poste è soddisfatta. 38