Laboratorio di Statistica e Analisi dei Dati

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Laboratorio di Statistica e Analisi dei Dati"

Transcript

1 Laboratorio di Statistica e Analisi dei Dati Nicolò Campolongo Università degli Studi di Milano nicolo.campolongo@unimi.it January 12, 2019 Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

2 Programma Pagina del corso: 1 Introduzione, script in Python, Arrays, Series 2 DataFrame 3 Grafici 4 Variabili aleatorie 5 Esercizi di riepilogo 6 Calcolo di probabilità Calcolo di probabilità Risoluzione di un tema d esame 9 Simulazione di un tema d esame Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

3 Introduzione: Python Python è un linguaggio di programmazione dinamico orientato agli oggetti utilizzabile per molti tipi di sviluppo software. ( Figure: Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

4 Introduzione: installare Python Mac OS X 10.2 e successivi includono una versione pre-installata. Nei sistemi Linux spesso è già presente nel setup di base. Per verificare se Python è già installato è sufficiente aprire una finestra del terminale e digitare il comando python. Installazione (raccomandata) Nota: la versione che verrà utilizzata nel corso è la 3.x Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

5 Interprete interattivo - 1 Il comando python apre l interprete interattivo. L interprete valuta le istruzioni Python inserite a riga di comando e fornisce una risposta: dottorando@dottorando-lenovo-y50-70: $ python Python Anaconda, Inc. (default, Apr , 16:14:56) GCC 7.2.0on linux Type "help", "copyright", "credits" or "license" for more information. >>> >>> print("hello, world!") Hello, world! >>> Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

6 Interprete interattivo - 2 La funzione exit() è digitata per uscire dall ambiente interprete (o in alternativa ctrl + d / cmd + d): >>> print("hello, world!") Hello, world! >>> dottorando@dottorando-lenovo-y50-70: $ Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

7 Script Usare l interprete interattivo non è la maniera più comoda per programmare. É possibile lanciare un programma python (file.py), eseguendo il comando python <nomefile.py> dalla cartella in cui si trova il file.py: dottorando@dottorando-lenovo-y50-70: /Scrivania$ python test.py My first script in Python! dottorando@dottorando-lenovo-y50-70: /Scrivania$ Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

8 Variabili in Python - 1 Python è dinamicamente tipato e fortemente tipato. Una variabile inizia ad esistere nel momento in cui le viene assegnato un valore, che ne determina il tipo: >>> a=10000 >>> type(a) <type int > >>> len(a) Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: object of type int has no len() >>> Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

9 Variabili in Python - 2 Riferirsi ad una variabile inesistente (a cui non è ancora stato assegnato un valore) genera un errore: >>> b Traceback (most recent call last): File "<stdin>", line 1, in <module> NameError: name b is not defined >>> Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

10 Funzione Help Per aprire la documentazione a riguardo di un particolare oggetto, metodo o attributo si può invocare la funzione help( nome ) con il nome dell oggetto che stiamo cercando: >>> help(str) Help on class str in module builtin : class str(basestring) str(object= ) -> string Return a nice string representation of the object. If the argument is a string, the return value is the same object. Si esce dal manuale interattivo premendo q. Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

11 Tipi Predefiniti in Python Stringhe (str): questa è una stringa, questa pure Dizionari (dict): { chiave : valore} Tuple (tuple): (1, 2, 3, 1, ciao ) Liste (list): [1, 2, 3, 4, pippo ] Set (set): (1, 2, 3) Interi (int): 1, 2, 3 Float (float): 1.5, 3.14, Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

12 Numpy Il modulo numpy ( mette a disposizione una struttura dati creata appositamente per il calcolo scientifico. Array Un array è un contenitore di dati omogenei, cioè dello stesso tipo. Se si tenta di costruire un array con dati di tipo diverso, questi vengono trasformati nel più piccolo tipo adatto a contenerli tutti: >>> import numpy as np >>> np.array( [1,4,6.8,10] ) array([ 1., 4., 6.8, 10. ]) Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

13 Creazione di Array - 1 numpy.arange(x) restituisce un array contenente gli interi da 0 a x 1: >>> numpy.arange(5) array([0, 1, 2, 3, 4]) numpy.arange(start, stop, step) permette di scegliere gli estremi della sequenza contenuta nell array e il passo tra un numero ed il successivo: >>> numpy.arange(2,6,2) array([2, 4]) >>> numpy.arange(2,-3,-1) array([ 2, 1, 0, -1, -2]) numpy.linspace(start, stop, n) permette di scegliere gli estremi e quanti numeri devono comparire all interno della sequenza: >>> numpy.linspace(0,1,4) array)[0, , , 1]) Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

14 Creazione di Array - 2 numpy.ones( tupla ) restuituisce un array di 1, date le dimensioni specificate nella tupla come argomento. >>> numpy.ones( (1,5) ) array([1., 1., 1., 1., 1.]) numpy.zeros( tupla ) restuituisce un array di 0, date le dimensioni specificate nella tupla come argomento: >>> numpy.zeros( (2,5) ) array([[0., 0., 0., 0., 0.], [0., 0., 0., 0., 0.]]) Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

15 Operazioni con Array Applicando un operazione logica ad un array si ottiene come risposta un array di tipo booleano contenente nella posizione i-esima il risultato dell espressione logica valutata per l elemento i-esimo dell array: >>> numpy.arange(5) > 3 array([false, False, False, False, True], dtype=bool) Le operazioni +, -, *, /, % tra due array vengono eseguite elemento per elemento (gli array devono avere le stesse dimensioni): >>> numpy.arange(5) + numpy.linspace(0,2,5) array([ 0., 1.5, 3., 4.5, 6. ]) >>> numpy.arange(5) * 2 array([0, 2, 4, 6, 8]) Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

16 Selezioni di un sottoinsieme di elementi Ad un array è possibile accedere in tutti i modi con cui è possibile accedere ad una lista, ad esempio: Ottenere una tupla di elementi: >>> a[2], a[-1], a[3:6] (2, 9, array([3, 4, 5])) Slicing [start:stop:step]: >>> a[2:9:3] array([2, 5, 8]) >>> a[::2] array([0, 2, 4, 6, 8]) Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

17 Accesso con maschere booleane Specificando tra [ ] un array di tipo booleano, selezioniamo dall array gli elementi la cui posizione corrisponde ad un True nell array di tipo booleano (che prende il nome di maschera): >>> a = numpy.arange(10) >>> mask = a%2 == 0 >>> mask array([ True, False, True, False, True, False, True, False, True, False], dtype=bool) >>> a[mask] array([0, 2, 4, 6, 8]) o in maniera più compatta: >>> a[a%2 == 0] array([0, 2, 4, 6, 8]) Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

18 Esercizi 1 Lanciare uno script che stampi il vostro nome e cognome 2 Creare un array i cui elementi siano gli interi che compongono il vostro numero di matricola 3 Sia X la lunghezza dell array del punto precedente. Creare un array di X elementi equispaziati l uno dall altro di Creare un array di X elementi equispaziati nell intervallo tra 1 e 3 5 Ottenere gli array dati dalla somma tra l array del punto 2 e quello del punto 3, e quello dato dalla moltiplicazione tra punto 3 e punto 4 6 Ottenere per ciascuno dei due array del punto 5, un array maschera che in corrispondenza dei numeri divisibili per 3 abbia True, False altrimenti. Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

19 Pandas - Series (1) Pandas ( è una libreria Python che fornisce strutture dati e strumenti relativi esclusivamente all analisi dei dati. Una Series è un array monodimensionale ed etichettato. Rappresenta una serie di osservazioni di un certo carattere, fatto su un insieme di individui: a 0.0 b 1.0 c 2.0 d 3.0 e 4.0 f 5.0 g 6.0 h 7.0 Name: serie di esempio, dtype: float64 Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

20 Pandas - Series (2) pandas.series (data, index, dtype, name,... ) data: contiene i dati che si vuole inserire nella serie index: della stessa lunghezza di data, contiene le etichette dtype: permette di specificare il tipo che i dati devono assumere name: permette di dare un nome alla Series >>> import pandas as pd >>> import numpy as np >>> oss = np.arange(8) >>> etic = [ a, b, c, d, e, f, g, h ] >>> pd.series(data=oss, index=etic, name= serie di esempio, dtype=float) Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

21 Accesso ai dati di una Series Specificando un valore (o una lista di valori) per l etichetta: >>> s.loc[[ h, a ]] h 7.0 a 0.0 Specificando un valore (o una lista di valori) per la posizione: >>> s[[5,6]] f 5.0 g 6.0 Usando lo slicing (come per gli array numpy) per la posizione: >>> s[3:6] d 3.0 e 4.0 f 5.0 Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

22 Pandas Series - Utils Series.min(), Series.max() restituiscono rispettivamente il minimo ed massimo tra i valori della Series Series.sum() restituisce la somma dei valori della Series Series.sort values() restituisce una copia della Series ordinata per valore Series.sort index() restituisce una copia della Series ordinata per etichette Series.sample(n) restituisce una Series di n elementi scelti uniformemente a caso all interno di quelli della Series Series.append([s1,s2,...]) concatena una o più Series a quella di partenza Series.count() restituisce il numero dei valori della Series che non siano il valore NaN Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

23 Il valore NaN Nan un oggetto del modulo numpy, che può rappresentare, in una Series, un dato di cui non è stato possibile fare un osservazione. Operazioni con un valore Nan hanno come risultato il valore Nan. >>> oss = range(5) >>> oss.append(none) >>> pandas.series(oss) NaN Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

24 Esercizi Creare la Series gol in modo che le etichette siano numeri dall 1 al 23. I dati raccolti siano numeri interi tra 0 e 30 scelti casualmente (scarica il notebook). La Series rappresenta i gol segnati da ciascun giocatore di una società calcistica nella stagione appena passata. L etichetta corrisponde al numero di maglia del giocatore. Ottenere: 1 I gol segnati dal capocannoniere 2 Chi non ha mai fatto gol durante l anno 3 La statistica del punto 2 per i soli titolari (numeri dall 1 all 11), e per le sole riserve (dal 12 al 23) 4 La statistica del punto 2 per i soli attaccanti (numeri dal 9 all 11) 5 I gol segnati dai giocatori coi numeri di maglia 5, 9, 10, 14 (somma) 6 Chi ha segnato più di 10 gol e chi ha segnato esattamente 10 gol 7 Una copia della Series ordinata secondo i gol effettuati 8 Una stampa dei primi 5 cannonieri e degli ultimi 5 9 Una copia della Series ordinata in modo discendente secondo il numero di maglia Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

25 File.csv Il formato csv (comma-separated value) è un formato utilizzato per rappresentare una tabella di dati e favorirne l importazione e l esportazione. Un file.csv è scritto nella seguente forma: titolo,paese,anno,durata,genere,voto Guerre Stellari,USA,1977,121,Fantascienza,4 L impero colpisce ancora,usa,1980,124,fantascienza,4 Il ritorno dello Jedi,USA,1983,,Fantascienza,3.5 Profondo Rosso,ITA,1975,,Horror,3.5 Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

26 Leggere csv La funzione read csv(..) di Pandas può essere utilizzata per leggere un file di formato csv. Tra i vari parametri che passiamo in input, uno particolarmente importante è sep, che indica il carattere utilizzato per separare le colonne (default è, ): >>> df film = pd.read csv( film.csv ) >>> df film titolo paese anno durata genere voto Il padrino USA Drammatico 4.5 Pulp Fiction USA Drammatico 4.0 Fight Club USA Thriller Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

27 DataFrame In Pandas, un DataFrame è una struttura dati tabulare con assi etichettati, le cui colonne possono contenere dati eterogenei da colonna a colonna: >>> dataframe esempio Nome Cognome Eta Citta Tommaso Rossi 30.0 Milano Sergio Bianchi 34.0 Roma Pasquale Verdi 29.0 Palermo Antonio Gialli 30.0 Roma Il DataFrame può essere visto come un insieme di serie aventi lo stesso indice accostate una all altra. Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

28 Accesso colonne DataFrame - 1 Per conoscere le colonne di un DataFrame, possiamo invocare il comando df.columns, dove df è la variabile in cui abbiamo instanziato il DataFrame. Per accedere ad una colonna, dobbiamo specificarne il nome nel seguente modo: >>> df film[ genere ] titolo Il padrino Drammatico Pulp Fiction Drammatico Fight Club Thriller... Selezionando un unica colonna, in output viene restituita una Series. Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

29 Accesso colonne DataFrame - 2 Possiamo accedere allo stesso tempo a più colonne: >>> df film[[ paese, anno ]] titolo paese anno Il padrino USA Pulp Fiction USA Fight Club USA Selezionando più colonne, in output viene restituito un DataFrame. Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

30 Accesso righe DataFrame - 1 Per indice numerico: >>> df film[15:18] titolo paese anno durata genere voto Il padrino USA Drammatico 4.5 Pulp Fiction USA Drammatico 4.0 Fight Club USA Thriller 4.0 Quasi Amici FRA Commedia 3.5 Per valore dell indice (assumiamo che titolo sia l indice del DataFrame): >>> df film[ Il padrino : Fight Club ] titolo paese anno durata genere voto Il padrino USA Drammatico 4.5 Pulp Fiction USA Drammatico 4.0 Fight Club USA Thriller 4.0 Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

31 loc & iloc Così come per le Series, anche con i DataFrame possiamo usare loc ed iloc per l accesso ai dati: loc[ nome indice ] permette l accesso ad una riga o più righe, tramite nome dell indice. iloc[ posizione ] permette l accesso ad una o più righe, tramite la loro posizione. Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

32 Accesso tramite un espressione logica >>> df film[ anno > 1998] titolo Il padrino False Pulp Fiction False Fight Club True Quasi Amici True >>> df film[df film[ anno ] > 1998] titolo paese anno durata genere voto Fight Club USA Thriller 4.0 Quasi Amici FRA Commedia 3.5 Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

33 Metodi dei DataFrame La classe DataFrame ha diversi metodi. Elenchiamo qui i più importanti: DataFrame.append(..): permette di estendere il DataFrame DataFrame.drop duplicates(..): restituisce un DataFrame senza righe duplicate DataFrame.dropna(..): Eliminare i valori Nan da un DataFrame DataFrame.sort values(..): permette di ordinare il DataFrame DataFrame.max(..), DataFrame.min(..), DataFrame.mean(..), DataFrame.median(..) Per la completa documentazione, si può utilizzare il comando help(pd.dataframe) oppure andare al seguente link: pandas.dataframe.html Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

34 Frequenze La frequenza assoluta indica il numero di volte che una data osservazione occorre in un campione. La frequenza relativa è un valore tra 0 e 1 che permette di valutare in maniera più efficace la frequenza di un osservazione. Si calcola dividendo la frequenza assoluta per il numero totale di casi. Per calcolare questa quantità in Pandas possiamo utilizzare la funzione value counts() che opera su una Series. In alternativa, si può utilizzare la funzione pd.crosstab che calcola queste frequenze in automatico restituendole in output in un DataFrame. Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

35 Esercizi Utilizzando il file dati-ospedali.csv dai csv del laboratorio: 1 Leggere il file e visualizzarlo in un DataFrame. 2 Calcolare le frequenze assolute e relative dell attributo Regione usando crosstab. 3 Ottenere la singola serie relativa all attributo Regione e calcolarne la frequenza assoluta e relativa senza usare crosstab. 4 Estrarre un sottodataframe contenente le colonne Nome (attributo Denominazione Str. Pubblica New) e Numero di medici (attributo Medici SSN) degli ospedali aventi meno di 200 medici. 5 Visualizzare il nome degli ospedali della regione Lombardia 6 Calcolare il numero medio di ingegneri (Ingegneri SSN) presenti negli ospedali campani. Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

36 Esercizi 7 Calcolare la varianza del numero di assistenti sociali (Assistenti sociali SSN) negli ospedali con più di 400 medici. 8 Qual è l ospedale con meno medici? 9 Visualizzare in ordine alfabetico il nome dei primi 10 ospedali per numero di medici. 10 Visualizzare il numero degli ospedali che hanno dichiarato il numero di odontoiatri (per cui il valore è diverso da NaN) (Odontoiatri Universitari). 11 Visualizzare il numero degli ospedali che hanno dichiarato il numero di odontoiatri (Odontoiatri Universitari) e per cui questo numero è maggiore di Calcolare le frequenze assolute per l attributo Odontoiatri SSN. Trasformare questo risultato in frequenze relative. Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

37 Matplotlib Matplotlib è una libreria Python per la generazione di grafici 2D. La collezione di funzioni pyplot permette di generare istogrammi, grafici a barre, grafici a torta, ecc. in modo da poter visualizzare i dati a nostra disposizione. import matplotlib.pyplot as plt plt.plot(...) plt.show() plot è la più semplice funzione per creare un grafico. Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

38 Plot Vediamo un semplice esempio: >>> import matplotlib.pyplot as plt >>> import numpy as np >>> x=np.arange(10) >>> y=x*x >>> plt.plot(x,y) >>> plt.show() Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

39 Grafico di dispersione >>> x = np.random.rand(n) >>> y = np.random.rand(n) >>> colors = np.random.rand(n) >>> area = (30 * np.random.rand(n))**2 >>> plt.scatter(x, y, s=area, c=colors, alpha=0.5) >>> plt.show() Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

40 Grafici a barre - 1 La funzione bar ci permette di tracciare grafici a barre: >>> import pandas as pd >>> a = pd.series([181, 172, 198]) >>> a.index = [ Alessio, Ciccio, Giorgio ] >>> plt.bar(a.index, a.get values()) >>> plt.show() Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

41 Grafici a barre - 2 Possiamo invocare la funzione plot.bar() direttamente su una serie: >>> df ospedali = pd.read csv( dati-ospedali.csv, sep= ; ) >>> freq regione = df ospedali[ Regione ].value counts() >>> freq regione.plot.bar() >>> plt.xticks(rotation=25) >>> plt.show() Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

42 Istogrammi La funzione hist ci permette di tracciare istogrammi: >>> heroes = pd.read csv( heroes.csv, sep= ; ) >>> height = heroes[ Height ] >>> height.plot.hist() >>> plt.show() Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

43 Grafici con le Series In generale, possiamo tracciare diversi tipi di grafici con le Series: line : line plot (default) bar : vertical bar plot barh : horizontal bar plot hist : histogram box : boxplot kde : Kernel Density Estimation plot density : same as kde area : area plot pie : pie plot Per saperne di più, consultare questo link.. Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

44 Distribuzione cumulativa empirica - 1 Per visualizzare la distribuzione cumulativa empirica, possiamo utilizzare il seguente metodo: >>> x = height.sort values() >>> y = np.arange(len(x)) / float(len(x)) >>> plt.plot(x, y) >>> plt.show() Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

45 Distribuzione cumulativa empirica - 2 O in alternativa, utilizzare la funzione ECDF del modulo statsmodels: >>> from statsmodels.distributions.empirical distribution import ECDF >>> dist = ECDF(height) >>> plt.plot(dist.x, dist.y) >>> plt.show() Che produce in output il grafico della pagina precedente (provare per credere!) Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

46 Boxplot Rappresenta la distribuzione di un vettore di numeri, cerchiando gli outlier: >>> weight = heroes[ Weight ] >>> weight.plot.box() >>> plt.show() Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

47 QQplot Grafico di dispersione dei quantili di due distribuzioni. Più le distribuzioni sono simili, più si avvicina alla bisettrice del primo quadrante: >>> import statsmodels.api as sm >>> sm.qqplot 2samples(height, weight, line= 45 ) >>> plt.show() Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

48 Diagramma di Pareto - 1 Inserisce nello stesso grafico un diagramma a barre delle frequenze relative ordinate in maniera decrescente ed un grafico a linea spezzata delle frequenze cumulate. Esiste un package Python per tracciare Diagrammi di Pareto al seguente link. >>> from paretochart import pareto >>> eye color freq = heroes[ Eye color ].value counts() / len(heroes) >>> common colors = eye color freq[eye color freq >.02].index >>> common colors data = heroes[ Eye color ][heroes[ Eye color ].isin(common colors)] Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

49 Diagramma di Pareto - 2 >>> common colors freq = common colors data.value counts()/len(common colors data) >>> pareto(common colors freq,labels=common colors freq.index) >>> plt.show() Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

50 Esercizi - 1 Utilizzando il file capelli.csv dai csv del laboratorio: 1 Calcolare coefficiente di correlazione (di Pearson) tra lunghezza capelli e le altre misure (usando la funzione Pandas corr). 2 Visualizzare i relativi grafici di dispersione. Confermano il valore numerico? 3 Visualizzare il boxplot e l istogramma della colonna spesashampomensile. Cosa li accomuna? Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

51 Esercizi - 2 Utilizzando il file dati-ospedali.csv dai csv del laboratorio: 1 Visualizzate la distribuzione cumulativa empirica e un barplot dell attributo Medici SSN 2 Controllare se Medici SSN e Farmacisti SSN seguono la stessa distribuzione (usando qqplot) 3 Visualizzare il diagramma di Pareto della serie contenente i dati che rappresentano i Medici SSN per Regione Completare l analisi esplorativa in finanziamenti.pdf e cani.pdf Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

52 Sample space Un esperimento è qualsiasi processo che produce una realizzazione (o osservazione). L insieme di tutte le possibili realizzazioni di un esperimento viene detto sample space ed indicato con S. lancio di 2 monete gara di 3 cavalli (a, b, c) S = {(T, T ), (T, C), (C, T ), (C, C)} S = {tutti i possibili ordinamenti di(a, b, c)} = {(a, b, c), (a, c, b),..., (c, b, a)} Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

53 Eventi lancio di 2 monete S = {(T, T ), (T, C), (C, T ), (C, C)} A = 2 monete uguali A = {(T, T ), (C, C)} B = 2 monete diverse B = A c = {(T, C), (C, T )} gara di 3 cavalli A = cavallo a vincente A = {(a, b, c), (a, c, b)} Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

54 Probabilità - 1 Consideriamo un esperimento con sample space S. Supponiamo che ad ogni evento A sia associato un numero chiamato probabilità di A ed indicato con P(A), che soddisfa le seguenti proprietà: 1 Per ogni evento A, la probabilità di A è un numero tra 0 e 1: 0 P(A) 1 2 La probabilità del sample space S è 1: P(S) = 1 3 La probabilità dell unione di eventi disgiunti è uguale alla somma delle probabilità di tali eventi: P(A B) = P(A) + P(B) Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

55 Probabilità - 2 In generale 2 eventi potrebbero non essere disgiunti. P(A B) = P(A) + P(B) P(A B) Esempio: un certo negozio accetta pagamenti o con carte di credito VISA o Mastercard. 1 22% dei clienti ha Mastercard 2 58% dei clienti ha VISA 3 14% dei clienti ha entrambe Qual è la probabilità che un cliente ha almeno una delle 2 carte? P(A) = 0.22, P(B) = 0.58 P(A B) = P(A) + P(B) P(A B) = = 0.66 Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

56 Probabilità condizionata - 1 Se alcune informazioni riguardo l esito di un esperimento sono disponibili, parliamo di probabilità condizionata. Esempio: lancio di 2 dadi S = {(1, 1), (1, 2),..., (6, 5), (6, 6)} Probabilità che la somma sia 10 (evento B) sapendo che il primo dado mostra 4 (evento A)? (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6) P(B A) = 1/6 Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

57 Probabilità condizionata - 2 In generale, P(B A) = Supponiamo l esito sia in A P(A B) P(A) Per essere anche in B, deve essere in entrambi A e B, cioè in A B Sapendo che A è già accaduto, il nostro nuovo sample space diventa A la probabilità di A B viene calcolata rispetto ad A Nel caso dei dadi: P(B A) = P({(4, 6)}) P({(4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6)}) = 1/36 1/6 = 1 6 Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

58 Indipendenza In generale, sapere che A è accaduto modifica le chance che B accada. Nel caso ciò non avvenga, cioè se P(B A) = P(B), allora i 2 eventi si dicono indipendenti. In questo caso, sapere che A è accaduto non aggiunge alcuna informazione. Siccome P(A B) = P(B A)P(A) Abbiamo che B è indipendente da A se P(A B) = P(B)P(A) Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

59 Esercizi Svolgere gli esercizi di combinatoria 2 Si consideri il seguente esperimento casuale: si lancia tre volte una moneta. Qual è lo spazio degli esiti di questo esperimento casuale? Si scriva esplicitamente l evento si ottengono più teste che croci 3 Si consideri il seguente esperimento casuale: Si tirano due dadi. Si considerino gli eventi E = la somma dei punteggi è dispari, F = il primo dado realizza un 1 e G = la somma dei punteggi è 5. Si descrivano gli eventi E F, E F, F G, E F c e E F G Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

60 Esercizi Si consideri il seguente esperimento casuale: Un sistema è composto da 4 componenti, ciascuno dei quali o funziona oppure è guasto. Si osserva lo stato dei componenti ottenendo un vettore (x 1, x 2, x 3, x 4 ), dove x i è 1 oppure 0 a seconda che il componente i-esimo funzioni oppure no. 1 Da quanti elementi è formato lo spazio degli esiti? 2 Il sistema nel suo insieme funziona fintantoché entrambi i componenti 1 e 2 oppure entrambi i componenti 3 e 4 funzionano. Specifica tutti gli esiti dell evento il sistema funziona. 3 Sia E l evento i componenti 1 e 3 sono guasti. Quanti esiti contiene? Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

61 Esercizi Si dimostri che in uno spazio degli esiti Ω dotato di una probabilità P, per ogni evento E, F Ω vale la disuguaglianza seguente: P(E F ) P(E) + P(F ) 1 6 Un gruppo di 5 bambini e 10 bambine è in fila in ordine casuale, nel senso che tutte le 15! possibili permutazioni si suppongono equiprobabili. 1 Qual è la probabilità che il quarto della fila sia un bambino? 2 E il dodicesimo? 3 Qual è la probabilità che un determinato bambino occupi la terza posizione? Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

62 Esercizi In un comune vi sono 5 alberghi. Se 3 persone devono scegliere un albergo in cui pernottare, qual è la probabilità che finiscano tutte in alberghi differenti? Che cosa stiamo assumendo senza dirlo esplicitamente? 8 La media del salario annuale di un gruppo di 100 lavoratori impiegati nell amministrazione di una grande azienda è di dollari con una deviazione standard di dollari. Se si prende una persona a caso da questo gruppo cosa possiamo dire sulla probabilità che il suo salario sia 1 tra i e i dollari. 2 superiore a dollari? Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

63 Esercizi In una certa regione vi sono due ditte che producono forni a microonde. Quelli della fabbrica A sono difettosi con probabilità 0.05, mentre quelli della fabbrica B, con probabilità Supponi di aver acquistato due apparecchi prodotti dalla stessa ditta, che può essere la A o la B con probabilità del 50%. Se il primo microonde è difettoso, qual è la probabilità condizionata che sia difettoso anche il secondo? 10 Hai chiesto ad un vicino di innaffiare una piantina delicata mentre sei in vacanza. Pensi che senza acqua la piantina muoia con probabilità 0.8, mentre se innaffiata questa probabilità si ridurrebbe a La tua fiducia che il vicino si ricordi di innaffiarla è del 90%. 1 Qual è la probabilità che la pianta sia ancora viva al tuo ritorno? 2 Se fosse morta, quale sarebbe la probabilità che il vicino si sia dimenticato di innaffiarla? Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

64 Esercizi Una compagnia di assicurazioni classifica i suoi clienti in tre fasce: basso rischio, medio rischio, alto rischio. Le sue statistiche indicano che le probabilità che un cliente delle tre fasce abbia un incidente entro un periodo di un anno sono rispettivamente 0.05, 0.15, e Se il 20% dei clienti sono a basso rischio, il 50% a medio rischio e il 30% ad alto rischio, che percentuale dei clienti avrà mediamente incidenti in un lasso di un anno? Se un cliente non ha avuto incidenti nel 1987, qual è la probabilità che appartenga a ciascuna delle tre fasce? 12 Se un votante scelto a caso è favorevole ad una certa riforma con probabilità di 0.7, qual è la probabilità che su 10 votanti, esattamente 7 siano favorevoli? Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

65 Variabili aleatorie Una variabile aleatoria (o anche variabile aleatoria) è una variabile che può assumere valori diversi in dipendenza da qualche fenomeno aleatorio. fenomeno: lancio di 2 dadi variabile aleatoria: somma dei 2 dadi fenomeno: 3 lanci di una moneta variabile aleatoria: numero di teste complessivo Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

66 Funzione di Ripartizione Sia X una variabile aleatoria. Si chiama funzione di ripartizione di X la funzione F che associa ad ogni numero reale a la probabilità che X sia minore o uguale ad a, cioè P(X a) = F X (a) Nel caso della moneta (fair) lanciata 3 volte (X indica il numero di teste complessivo): 0, if a < 0 1/8, per 0 a < 1 F X (a) = 1/8 + 3/8 = 4/8, per 1 a < 2 4/8 + 3/8 = 7/8, per 2 a < 3 8/8 = 1, per a 3 Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

67 Funzione di densità o di massa Sia X una variabile aleatoria. Si chiama funzione di densità di X la funzione f che associa ad ogni numero reale a la probabilità che X sia uguale ad a, indicata con f X (a). Nel caso della moneta (fair) lanciata 3 volte (X indica il numero di teste complessivo): 1/8, per a = 0 3/8, per a = 1 f X (a) = 3/8, per a = 2 1/8, per a = 3 0 altrimenti Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

68 Valore Atteso Chiamato anche media (expectation in inglese), è appunto una media pesata dei possibili valori di una variabile aleatoria. Il peso dato a ciascun valore è la probabilità data a quello specifico valore. Esempio: dado truccato valore 6 con probabilità 7/12 E[X ] = a i P(X = a i ) i valori da 1 a 5 con probabilità 1/12 La variabile aleatoria X indica la faccia risultante dal lancio di un dado. E[X ] = = 4.75 Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

69 Valore Atteso - Proprietà Sia X una variabile aleatoria con valore atteso E[X ]. Se c è una costante, allora anche cx e X + c sono variabili casuali. In particolare, valgono le seguenti proprietà: E[cX ] = ce[x ] E[X + c] = E[X ] + c Sia Y una variabile aleatoria. Allora: E[X + Y ] = E[X ] + E[Y ] se e solo se X e Y sono independenti: E[XY ] = E[X ]E[Y ] Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

70 Varianza E il valore atteso del quadrato della differenza tra la variabile aleatoria e il suo valore atteso: Var(X ) = E[(X E[X ]) 2 ] = E[X 2 ] (E[X ]) 2 La radice quadrata viene detta deviazione standard di X. Esempio: dado truccato E[X 2 ] = Var(X ) = E[X 2 ] (E[X ]) Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

71 Varianza - proprietà Sia X una variabile aleatoria e c una costante. Allora valgono le seguenti proprietà: 1 Var(cX ) = c 2 Var(X ) 2 Var(X + c) = Var(X ) NOTA: Var(X + X ) Var(X ) + Var(X ) Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

72 Covarianza Siano X, Y due variabili aleatorie, con valore atteso rispettivamente E[X ] = µ X e E[Y ] = µ Y. La covarianza è definita come segue: Cov(X, Y ) = E[(X µ X )(Y µ Y )] =... = E[XY ] µ X µ Y Proprietà: 1 Cov(X, Y ) = Cov(Y, X ) 2 Cov(X, X ) = Var(X ) 3 Sia a una costante, allora: Cov(aX, Y ) = acov(x, Y ) 4 Sia Z una variabile aleatoria, allora: Cov(X + Z, Y ) = Cov(X, Y ) + Cov(Z, Y ) Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

73 Esercizi Consideriamo una variabile aleatoria X che può assumere i valori 1, 2 o 3. Se sappiamo che f X (1) = 1 3, f X (2) = Quanto vale f X (3)? 2 Disegnare il grafico di questa funzione di massa. 3 Disegnare il grafico della relativa funzione di ripartizione. 2 Dimostrare che se X 1 e X 2 hanno la stessa distribuzione, allora: Cov(X 1 + X 2, X 1 X 2 ) = 0 Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

74 Esercizi La funzione di ripartizione di X è definita come segue Se ne tracci il grafico. Quanto vale P(X > 1/2)? Quanto vale P(2 X 4)? Quanto vale P(X 3)? Quanto vale P(X = 1)? 0, per x 0 x/2, per 0 x < 1 F X (x) = 2/3, per 1 x < 2 11/12, per 2 x < 3 1 per x 3 Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

75 Esercizi Un tipo di prodotti vengono classificati a seconda dei loro difetti e della fabbrica che li ha prodotti. Sia X 1 il numero (1 o 2) della fabbrica, e sia X 2 il numero di difetti per pezzo (che possono essere da 0 a 3), di un prodotto scelto a caso tra la totalità di quelli esistenti. La tabella seguente riporta la funzione di massa di probabilità congiunta per queste due variabili aleatorie discrete. Le righe si riferiscono alla variabile X 1, mentre le colonne alla variabile X 2. Trova le distribuzioni marginali di X 1 e X 2. Calcola media e varianza di X /8 1/16 3/16 1/8 2 1/16 1/16 1/8 1/4 Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

76 Scipy Scipy è un modulo che permette di utilizzare varie distribuzioni di probabilità, sia di tipo discreto che continuo. La sintassi generale è la seguente: Scipy.stats.<nome distribuzione>.rvs(size=z): restituisce un vettore di numeri casuali estratti secondo la distribuzione, di lunghezza z.pdf(x): restituisce il vettore della densità della distribuzione valutata nei valori del vettore di input x (.pmf per le discrete).cdf(x): restituisce il vettore della funzione di ripartizione (o cumulativa) della distribuzione valutata nei valori del vettore di input x.ppf(q): restituisce il vettore dei quantili della distribuzione valutata nei valori del vettore di input q Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

77 Variabili aleatorie discrete: Binomiale >>> from scipy.stats import binom >>> rv = binom(n, p) rv.rvs(x) restituisce un vettore di x numeri estratti secondo una distribuzione Binomiale di parametri n, p rv.pmf(x) restituisce la probabilità di ottenere esattamente x successi in un esperimento dicotomico (0/1) ripetuto n volte con una probabilità di successo p (x può essere un vettore) rv.cdf(q) restituisce il valore della funzione di ripartizione in q (q può essere un vettore) rv.ppf(p) restituisce il valore del quantile di ordine p Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

78 Variabili aleatorie discrete: Ipergeometrica Supponiamo di avere M = 20 animali, di cui n = 7 cani. Se vogliamo sapere la probabilità di trovare un dato numero di cani se scegliamo N = 12 dei 20 animali in maniera casuale, possiamo usare una distribuzione ipergeometrica in questo modo: >>> from scipy.stats import hypergeom >>> [M, n, N] = [20, 7, 12] >>> rv = hypergeom(m, n, N) rv.pmf(x) restituisce la probabilità di estrarre esattamente x cani. Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

79 Variabili aleatorie discrete: Geometrica >>> from scipy.stats import geom >>> rv = geom(p) rv.pmf(x) restituisce la probabilità di avere un successo dopo esattamente x insuccessi in una successione di esperimenti dicotomici (esito 0/1) con una probabilità di successo p (x può essere un vettore) Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

80 Variabili aleatorie discrete: Poisson La distribuzione di Poisson viene usata spesso come modello per il numero di volte per cui un evento avviene in un dato intervallo di tempo (o spazio). Ad esempio, si può utilizzare per misurare il numero di chiamate ricevute da un call center in una mattinata. >>> from scipy.stats import poisson >>> mu = 2 >>> rv = poisson(mu) rv.pmf(x) restituisce il seguente valore: f (x) = exp( µ) µx x! In questo caso x rappresenta il numero di eventi per cui si vuole calcolare la probabilità, sapendo che in media ne accadono µ. Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

81 Variabili aleatorie continue: Uniforme In Scipy la funzione uniforme è soltanto continua. Questo significa che nella generazione di numeri casuali otterrò dati di tipo float. Possiamo tuttavia simulare una variabile discreta estraendo la parte intera del risultato ottenuto. >>> from scipy.stats import uniform >>> rv = uniform() Il comando uniform() crea una distribuzione uniforme nell intervallo [0, 1]. Possiamo creare una distribuzione uniforme qualsiasi usando uniform(x, y - x) per l intervallo [x, y] Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

82 Variabili aleatorie continue norm(mu, sigma): variabile Gaussiana (o Normale) di media µ e deviazione standard σ expon(scale = 1 / lambda): variabile Esponenziale di parametro λ Altre distribuzioni (con relativa documentazione) disponibili su: Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

83 Esercizi Un urna contiene 10 palline di cui 4 bianche e 6 nere. Si eseguono 5 estrazioni con reimmissione. 1 Tracciare grafico della funzione massa di probabilità della variabile casuale X = numero di palline bianche estratte 2 Calcolare la probabilità di estrarre 2 palline bianche 3 Calcolare la probabilità di estrarre al più 2 palline bianche 4 Calcolare la probabilità di estrarre almeno 2 palline bianche 5 Qual è il numero minimo x tale che la probabilità di estrarre al più x palline bianche sia almeno 0.8? Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

84 Esercizi Si eseguono 10 estrazioni senza reimmissione da un urna 1 Tracciare il grafico della funzione massa di probabilità della variabile casuale X = numero di palline bianche estratte nei seguenti casi: 1 l urna contiene 100 palline di cui 20 bianche e le restanti nere 2 l urna contiene 100 palline di cui 2 bianche e le restanti nere 2 Tracciare il grafico della funzione massa di probabilità della variabile casuale X nel caso dell urna 1 se si eseguono 25 estrazioni 3 Consideriamo l urna 1 e N = 10 estrazioni. Si aumenti il numero totale M di palline nell urna mantenendo uguale a 0.2 la frazione di palline bianche. Per ciascun valore di M confrontare graficamente la distribuzione di probabilità del numero di palline bianche estratte nel caso di estrazioni con e senza reimmissione. Provare con 20, 40 e 200 palline bianche Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

85 Esercizi Calcolare la probabilità di ottenere più teste che croci lanciando 7 volte una moneta truccata con probabilità di avere croce pari a Calcolare la probabilità di avere almeno 3 sei lanciando 5 dadi a 12 facce 5 Calcolare la probabilità di estrarre 20 euro da un sacco contenente 47 monete da 1 centesimo e 53 da 2 euro estraendo (uniformemente) a caso 10 monete senza reinserirle 6 Un grammo di uranio emette mediamente 2152 particelle α ogni millisecondo. Qual è con buona approssimazione la probabilità che un grammo di uranio emetta al più 2000 particelle α in un millisecondo? Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

86 Esercizi Un uomo si risveglia in mezzo al deserto senza acqua. Dopo ogni minuto ha una probabilità del 3% di perdere conoscenza per via delle condizioni estreme. Calcolare la probabilità che l uomo perda conoscenza dopo almeno due ore e la probabilità che l uomo perda conoscenza dopo esattamente un quarto d ora 8 Sia X una variabile aleatoria normale di parametri µ = 10 e σ = 36. Calcola: 1 P(X > 5) 2 P(4 X 16) 3 P(X 8) Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

87 Esercizi Il numero di errori tipografici per pagina di una certa rivista segue una distribuzione di Poisson. Sapendo che mediamente sono presenti 0.2 errori per pagina, determinare la probabilità che una pagina contenga: 1 nessun refuso 2 più refusi 10 Arrivi alla fermata dell autobus alle 10:00 e sei certo che ne passerà uno in un momento distribuito uniformemente tra le 10:00 e le 10:30 1 Qual è la probabilità che tu debba aspettare più di 10 minuti? 2 Se alle 10:15 l autobus non è ancora arrivato, qual è la probabilità che tu debba aspettare almeno altri 10 minuti? Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

88 Esercizi Il signor Jones è convinto che il tempo di vita di una automobile (in migliaia di chilometri percorse) sia una variabile aleatoria esponenziale di parametro 1/20. Il signor Smith ha una macchina usata da vendere che ha percorso circa chilometri. 1 Se il signor Jones decide di comprarla, che probabilità ha di farle fare almeno altri chilometri prima che sia da buttare? 2 Il modello assunto dal signor Jones è ragionevole? 12 Sia X una variabile casuale binomiale di parametri n = 100 e p = Tracciate la funzione di ripartizione di X 2 Calcolate il primo quartile, il quantile di ordine 0.9 e la mediana di X 3 Calcolare la probabilità P(X 60) 4 Calcolare la probabilità P(X 88) 5 Trovare il più piccolo valore x tale che P(X x) 0.9 Nicolò Campolongo (UniMi) SAD 2018/2019 January 12, / 88

Laboratorio di Statistica e Analisi dei Dati

Laboratorio di Statistica e Analisi dei Dati Laboratorio di Statistica e Analisi dei Dati Nicolò Campolongo Università degli Studi di Milano nicolo.campolongo@unimi.it November 16, 2018 Nicolò Campolongo (UniMi) Lezione 3 November 16, 2018 1 / 17

Dettagli

Laboratorio di Statistica e Analisi Dati: Lezione 8 (20)

Laboratorio di Statistica e Analisi Dati: Lezione 8 (20) Laboratorio di Statistica e Analisi Dati: Lezione 8 Tommaso C. & Marco G. 11-13 Gennaio 2017 1 of 24 10/01/2017 13:51 1. 2. 3. Si consideri il seguente esperimento casuale: si lancia tre volte una moneta.

Dettagli

Laboratorio di Statistica e Analisi dei Dati

Laboratorio di Statistica e Analisi dei Dati Laboratorio di Statistica e Analisi dei Dati Nicolò Campolongo Università degli Studi di Milano nicolo.campolongo@unimi.it December 14, 2018 Nicolò Campolongo (UniMi) Lezione 4 December 14, 2018 1 / 15

Dettagli

Laboratorio di Statistica e Analisi dei Dati

Laboratorio di Statistica e Analisi dei Dati Laboratorio di Statistica e Analisi dei Dati Nicolò Campolongo Università degli Studi di Milano nicolo.campolongo@unimi.it November 9, 2018 Nicolò Campolongo (UniMi) Lezione 1 November 9, 2018 1 / 14 Lezione

Dettagli

Calcolo delle Probabilità e Statistica Matematica Fisciano, 10/1/2012

Calcolo delle Probabilità e Statistica Matematica Fisciano, 10/1/2012 Fisciano, 10/1/2012 Esercizio 1 Un esperimento consiste nel generare a caso un vettore di interi (x 1, x 2, x 3, x 4 ), dove x i {1, 2, 3, 4, 5, 6} i. (i) Si individui lo spazio campionario, determinandone

Dettagli

Matematica e Statistica per Scienze Ambientali

Matematica e Statistica per Scienze Ambientali per Scienze Ambientali Variabili aleatorie - Appunti 1 1 Dipartimento di Matematica Sapienza, Università di Roma Roma, Gennaio 2013 Variabili aleatorie Un numero aleatorio è un esempio di variabile aleatoria.

Dettagli

Variabili casuali ad una dimensione Testi degli esercizi. Variabili casuali ad una dimensione a.a. 2012/2013 1

Variabili casuali ad una dimensione Testi degli esercizi. Variabili casuali ad una dimensione a.a. 2012/2013 1 Variabili casuali ad una dimensione Testi degli esercizi 1 Costruzione di variabile casuale discreta Esercizio 1. Sia data un urna contenente 3 biglie rosse, 2 biglie bianche ed una biglia nera. Ad ogni

Dettagli

Esercizi di Calcolo delle Probabilità

Esercizi di Calcolo delle Probabilità Esercizi di Calcolo delle Probabilità Versione del 1/05/005 Corso di Statistica Anno Accademico 00/05 Antonio Giannitrapani, Simone Paoletti Calcolo delle probabilità Esercizio 1. Un dado viene lanciato

Dettagli

Statistica ARGOMENTI. Calcolo combinatorio

Statistica ARGOMENTI. Calcolo combinatorio Statistica ARGOMENTI Calcolo combinatorio Probabilità Disposizioni semplici Disposizioni con ripetizione Permutazioni semplici Permutazioni con ripetizioni Combinazioni semplici Assiomi di probabilità

Dettagli

Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza

Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 16/06/2016 NOME: COGNOME: MATRICOLA: Esercizio 1 Cinque lettere

Dettagli

UNIVERSITÀ di ROMA TOR VERGATA

UNIVERSITÀ di ROMA TOR VERGATA UNIVERSITÀ di ROMA TOR VERGATA Corso di Laurea Magistrale in Scienze della Nutrizione Umana Corso di Statistica Medica, anno 05-6 P.Baldi Lista di esercizi, 8 gennaio 06. Esercizio Si sa che in una schedina

Dettagli

Lezione 12. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 12. A. Iodice.

Lezione 12. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 12. A. Iodice. discrete uniforme Bernoulli Poisson Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 56 Outline discrete uniforme Bernoulli Poisson 1 2 discrete 3

Dettagli

ESERCITAZIONE N. 5 corso di statistica

ESERCITAZIONE N. 5 corso di statistica ESERCITAZIONE N. 5corso di statistica p. 1/27 ESERCITAZIONE N. 5 corso di statistica Marco Picone Università Roma Tre ESERCITAZIONE N. 5corso di statistica p. 2/27 Introduzione Variabili aleatorie discrete

Dettagli

Variabili aleatorie discrete. Giovanni M. Marchetti Statistica Capitolo 5 Corso di Laurea in Economia

Variabili aleatorie discrete. Giovanni M. Marchetti Statistica Capitolo 5 Corso di Laurea in Economia Variabili aleatorie discrete Giovanni M. Marchetti Statistica Capitolo 5 Corso di Laurea in Economia 2015-16 1 / 45 Variabili aleatorie Una variabile aleatoria è simile a una variabile statistica Una variabile

Dettagli

LABORATORIO DI INFORMATICA ESERCITAZIONE VIII

LABORATORIO DI INFORMATICA ESERCITAZIONE VIII LABORATORIO DI INFORMATICA ESERCITAZIONE VIII Cercate di eseguire gli esercizi da soli. Se non ci riuscite, cercate di capire i messaggi di errore. Se non ci riuscite, provateci di nuovo. Poi chiamate

Dettagli

ESERCIZI DI PROBABILITA

ESERCIZI DI PROBABILITA ESERCIZI DI PROBABILITA Sezione 1. Spazi di Probabilità e Indipendenza. Per convenienza dello studente si danno le risposte di alcuni esercizi. 1) Si consideri lo spazio di probabilità corrispondente alla

Dettagli

STATISTICA: esercizi svolti sulle VARIABILI CASUALI

STATISTICA: esercizi svolti sulle VARIABILI CASUALI STATISTICA: esercizi svolti sulle VARIABILI CASUALI VARIABILI CASUALI 2 VARIABILI CASUALI. Variabili casuali generiche. Si supponga che un dado truccato, formato da sei facce contrassegnate dai numeri

Dettagli

Foglio di Esercizi 10 con Risoluzione 18 dicembre 2017

Foglio di Esercizi 10 con Risoluzione 18 dicembre 2017 Matematica per Farmacia, a.a. 07/8 Foglio di Esercizi 0 con Risoluzione 8 dicembre 07 ATTENZIONE: in alcuni degli esercizi di Probabilità puó essere utile usare il Teorema di Bayes. Esercizio (Vedere il

Dettagli

UNIVERSITÀ di ROMA TOR VERGATA

UNIVERSITÀ di ROMA TOR VERGATA UNIVERSITÀ di ROMA TOR VERGATA Corso di Laurea Magistrale in Scienze della Nutrizione Umana Corso di Statistica Medica, anno 205- P.Baldi Lista di esercizi 5, 8 febbraio 20. Esercizio Si fanno 25 estrazioni

Dettagli

Leggi di distribuzione

Leggi di distribuzione Leggi di distribuzione 1 Esercizio 0.1 Una sorgente binaria genera le cifre 0 e 1 in modo casuale, con probabilità 0.4 e 0.6, rispettivamente. Calcolare la probabilità che, in una sequenza a 5 cifre, si

Dettagli

ESERCIZI SU EVENTI E VARIABILI ALEATORIE DISCRETE

ESERCIZI SU EVENTI E VARIABILI ALEATORIE DISCRETE ESERCIZI SU EVENTI E VARIABILI ALEATORIE DISCRETE Docente titolare: Irene Crimaldi 26 novembre 2009 Es.1 Supponendo che la probabilità di nascita maschile e femminile sia la stessa, calcolare la probabilità

Dettagli

ES.2.2. Consideriamo un esperimento statistico definito da un insieme Ω di risultati possibili. Una partizione finita di Ω è una sequenza di K eventi

ES.2.2. Consideriamo un esperimento statistico definito da un insieme Ω di risultati possibili. Una partizione finita di Ω è una sequenza di K eventi ES22 1 Variabili aleatorie discrete Consideriamo un esperimento statistico definito da un insieme Ω di risultati possibili Una partizione finita di Ω è una sequenza di K eventi A 1, A 2 A k A K necessari

Dettagli

Esercitazione del 04/06/2015 Probabilità e Statistica Foglio 14

Esercitazione del 04/06/2015 Probabilità e Statistica Foglio 14 Esercitazione del 0/06/05 Probabilità e Statistica Foglio David Barbato Esercizio. Ci sono 0 monetine di cui 5 con due teste, con due croci e regolari una moneta regolare ha una faccia testa e una faccia

Dettagli

Programmare. Definire una sequenza di istruzioni che specificano come effettuare una elaborazione

Programmare. Definire una sequenza di istruzioni che specificano come effettuare una elaborazione Python Programmare Definire una sequenza di istruzioni che specificano come effettuare una elaborazione Le istruzioni devono essere date in un linguaggio comprensibile dal calcolatore. In generele questi

Dettagli

Esercizi svolti di statistica. Gianpaolo Gabutti

Esercizi svolti di statistica. Gianpaolo Gabutti Esercizi svolti di statistica Gianpaolo Gabutti (gabuttig@hotmail.com) 1 Introduzione Questo breve documento contiene lo svolgimento di alcuni esercizi di statistica da me svolti durante la preparazione

Dettagli

TEST n La funzione di ripartizione di una variabile aleatoria:

TEST n La funzione di ripartizione di una variabile aleatoria: TEST n. 1 1. Un esperimento consiste nell estrarre successivamente, con reimmissione nel mazzo, due carte da un mazzo di 52 carte. Individuare la probabilità di estrarre due assi. A 0.0059 B 0.0044 C 0.0045

Dettagli

ESERCITAZIONE 5: PROBABILITÀ DISCRETA

ESERCITAZIONE 5: PROBABILITÀ DISCRETA ESERCITAZIONE 5: PROBABILITÀ DISCRETA e-mail: tommei@dm.unipi.it web: www.dm.unipi.it/ tommei Ricevimento: Martedi 16-18 Dipartimento di Matematica, piano terra, studio 126 6 Novembre 2012 Esercizi 1-2

Dettagli

C = {C 1 = A B c H, C 2 = A c B H, C 3 = A B c H c, C 4 = A c B H c } ; P (C 1 ) = 21/100, P (C 2 ) = 9/100, P (C 3 ) = 49/100, P (C 4 ) = 21/100.

C = {C 1 = A B c H, C 2 = A c B H, C 3 = A B c H c, C 4 = A c B H c } ; P (C 1 ) = 21/100, P (C 2 ) = 9/100, P (C 3 ) = 49/100, P (C 4 ) = 21/100. CALCOLO DELLE PROBABILITÀ - 20 gennaio 2007 Motivare dettagliatamente le risposte su fogli allegati Elettronica: Es.1 4. Nettuno: Es.1 3. 1. Si effettuano due estrazioni con restituzione da un lotto contenente

Dettagli

Variabili Casuali multidimensionali

Variabili Casuali multidimensionali Probabilità e Statistica Esercitazioni a.a. 27/2 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Variabili Casuali multidimensionali Marco Pietro Longhi Probabilità e Statistica

Dettagli

Esercizi. 2. [Conteggio diretto] Due dadi vengono lanciati in successione. a) Qual è la probabilità che la somma dei due risultati faccia 7?

Esercizi. 2. [Conteggio diretto] Due dadi vengono lanciati in successione. a) Qual è la probabilità che la somma dei due risultati faccia 7? 1 E. Vitali Matematica (Scienze Naturali) Esercizi 1. [Conteggio diretto] Quattro ragazzi, A, B, C e D, dispongono di due biglietti per il teatro e decidono di tirare a sorte chi ne usufruirà. a) Qual

Dettagli

DISTRIBUZIONI DI PROBABILITA (parte 1) 1 / 19

DISTRIBUZIONI DI PROBABILITA (parte 1) 1 / 19 DISTRIBUZIONI DI PROBABILITA (parte 1) 1 / 19 Variabili casuali (o aleatorie) 2 / 19 Disponendo di metodi corretti per raccogliere i dati e costruire i campioni data una popolazione, i valori numerici

Dettagli

Prova di recupero di Probabilità e Statistica - A * 21/04/2006

Prova di recupero di Probabilità e Statistica - A * 21/04/2006 Prova di recupero di Probabilità e Statistica - A * /04/006 (NB: saranno prese in considerazione solo le risposte adeguatamente motivate) tempo di lavoro: Due ore. Per conseguire la patente di guida, un

Dettagli

Costruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini. Lezione 3: Variabili aleatorie discrete notevoli

Costruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini. Lezione 3: Variabili aleatorie discrete notevoli Costruzione di macchine Modulo di: Progettazione probabilistica e affidabilità Marco Beghini Lezione 3: Variabili aleatorie discrete notevoli Esperimenti binari ripetuti o esperimenti bernoulliani (Bernoulli

Dettagli

Facoltà di ECONOMIA Università di Pavia 20 Aprile 2004 Prova scritta di Analisi dei dati MODALITÀ A

Facoltà di ECONOMIA Università di Pavia 20 Aprile 2004 Prova scritta di Analisi dei dati MODALITÀ A MODALITÀ A Riportare sul foglio nome, cognome, numero di matricola e modalità del testo d esame. Problema 1 (8 PUNTI) Su un collettivo di 10 clienti iscritti al programma frequent flyer di una nota compagnia

Dettagli

STATISTICA AZIENDALE Modulo Controllo di Qualità

STATISTICA AZIENDALE Modulo Controllo di Qualità STATISTICA AZIENDALE Modulo Controllo di Qualità A.A. 009/10 - Sottoperiodo PROA DEL 14 MAGGIO 010 Cognome:.. Nome: Matricola:.. AERTENZE: Negli esercizi in cui sono richiesti calcoli riportare tutte la

Dettagli

Esame di AM2 & EAP (270/04) a.a. 2009/10

Esame di AM2 & EAP (270/04) a.a. 2009/10 Quarto appello del 16 Luglio 2010 1. Un urna contiene delle palline numerate e distribuite in seguente maniera: Vengono estratte due palline senza rimpiazzo e siano X e Y rispettivamente il numero della

Dettagli

Alcune v.a. discrete notevoli

Alcune v.a. discrete notevoli Alcune v.a. discrete notevoli Variabile aleatoria Bernoulliana Il risultato X di un esperimento aleatorio può essere classificato nel modo che segue: successo oppure insuccesso. Indichiamo: Successo =

Dettagli

Laboratorio di Statistica e Analisi Dati: Lezione 7

Laboratorio di Statistica e Analisi Dati: Lezione 7 Laboratorio di Statistica e Analisi Dati: Lezione 7 Tommaso C. & Marco G. 14 17 Dicembre 2016 file:///c:/users/tommasor/documents/uni%20 %20PhD/Tutoring/2016 17%20 %20Laboratorio%20di%20Statistica%20e%20Analisi%20dei%20Dati/repo/materialelezioni/statistica/lez7.html#(1)

Dettagli

Elaborazione statistica di dati

Elaborazione statistica di dati Elaborazione statistica di dati 1 CONCETTI DI BASE DI STATISTICA ELEMENTARE 2 Taratura strumenti di misura IPOTESI: grandezza da misurare identica da misura a misura Per la presenza di errori casuali,

Dettagli

Calcolo delle Probabilità 2

Calcolo delle Probabilità 2 Prova d esame di Calcolo delle Probabilità 2 Maggio 2006 Sia X una variabile aleatoria distribuita secondo la densità seguente ke x 1 x < 0 f X (x) = 1/2 0 x 1. 1. Determinare il valore del parametro reale

Dettagli

Probabilità: esercizi vari

Probabilità: esercizi vari 10 Probabilità: esercizi vari 10.1. Combinatorica e probabilità uniforme Esercizio 10.1.1. Si lancia una moneta non truccata per n volte e, ogni volta, si guarda se esce testa o croce. Quanti sono i possibili

Dettagli

Calcolo della probabilità

Calcolo della probabilità Calcolo della probabilità GLI EVENTI Un evento è un fatto che può accadere o non accadere. Se esso avviene con certezza si dice evento certo, mentre se non può mai accadere si dice evento impossibile.

Dettagli

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano Corso di STATISTICA EGA - Classe 1 aa 2017-2018 Docenti: Luca Frigau, Claudio Conversano Il corso è organizzato in 36 incontri, per un totale di 72 ore di lezione. Sono previste 18 ore di esercitazione

Dettagli

CALCOLO DELLE PROBABILITÀ - 9 giugno 1998 Scrivere le risposte negli appositi spazi Motivare dettagliatamente le risposte su fogli allegati

CALCOLO DELLE PROBABILITÀ - 9 giugno 1998 Scrivere le risposte negli appositi spazi Motivare dettagliatamente le risposte su fogli allegati CALCOLO DELLE PROBABILITÀ - 9 giugno 1998 1. Dati gli eventi A,B,C, ognuno dei quali implica il successivo, e tali che P (A) è metà della probabilità di B, che a sua volta ha probabilità metà di quella

Dettagli

Esercizi settimana 5. Esercizi applicati. Esercizio 1. Si considerino tre monete truccate, ognuna con probabilità 2 3

Esercizi settimana 5. Esercizi applicati. Esercizio 1. Si considerino tre monete truccate, ognuna con probabilità 2 3 1 Esercizi settimana 5 Esercizi applicati Esercizio 1. Si considerino tre monete truccate, ognuna con probabilità 3 di ottenere testa. Se scegliete la prima moneta vincete 10 punti se esce testa e punti

Dettagli

Due variabili aleatorie X ed Y si dicono indipendenti se comunque dati due numeri reali a e b si ha. P {X = a, Y = b} = P {X = a}p {Y = b}

Due variabili aleatorie X ed Y si dicono indipendenti se comunque dati due numeri reali a e b si ha. P {X = a, Y = b} = P {X = a}p {Y = b} Due variabili aleatorie X ed Y si dicono indipendenti se comunque dati due numeri reali a e b si ha P {X = a, Y = b} = P {X = a}p {Y = b} Una variabile aleatoria χ che assume i soli valori 1, 2,..., n

Dettagli

Variabili aleatorie. Variabile aleatoria discreta

Variabili aleatorie. Variabile aleatoria discreta Variabili aleatorie In molte situazioni, si vuole assegnare un valore numerico ad ogni possibile risultato di un esperimento. ale assegnamento viene chiamato variabile aleatoria o casuale. ω Esempio: lancio

Dettagli

2. Introduzione alla probabilità

2. Introduzione alla probabilità . Introduzione alla probabilità Carla Seatzu, 8 Marzo 008 Definizioni preliminari: Prova: è un esperimento il cui esito è aleatorio Spazio degli eventi elementari: è l insieme Ω di tutti i possibili esiti

Dettagli

STATISTICA ESERCITAZIONE 9

STATISTICA ESERCITAZIONE 9 STATISTICA ESERCITAZIONE 9 Dott. Giuseppe Pandolfo 19 Gennaio 2015 REGOLE DI CONTEGGIO Sequenze ordinate Sequenze non ordinate Estrazioni con ripetizione Estrazioni senza ripetizione Estrazioni con ripetizione

Dettagli

Modelli probabilistici variabili casuali

Modelli probabilistici variabili casuali Modelli probabilistici variabili casuali Le variabili casuali costituiscono il legame tra il calcolo della probabilità e gli strumenti di statistica descrittiva visti fino ad ora. Idea: pensiamo al ripetersi

Dettagli

Calcolo delle Probabilità

Calcolo delle Probabilità Calcolo delle Probabilità Il calcolo delle probabilità studia i modelli matematici delle cosiddette situazioni di incertezza. Molte situazioni concrete sono caratterizzate a priori da incertezza su quello

Dettagli

Scritto del

Scritto del Dip. di Ingegneria, Univ. Roma Tre Prof. E. Scoppola, Dott.M. Quattropani Probabilità e Statistica, 17-18, I semestre Settembre 18 Scritto del - 9-18 Cognome Nome Matricola Esercizio 1. Un urna contiene

Dettagli

UNIVERSITÀ di ROMA TOR VERGATA

UNIVERSITÀ di ROMA TOR VERGATA UNIVERSITÀ di ROMA TOR VERGATA Corso di Statistica, anno 00- P.Baldi Lista di esercizi. Corso di Laurea in Biotecnologie Esercizio Si sa che in una schedina del totocalcio i tre simboli, X, compaiono con

Dettagli

VARIABILI CASUALI CONTINUE

VARIABILI CASUALI CONTINUE p. 1/1 VARIABILI CASUALI CONTINUE Una variabile casuale continua può assumere tutti gli infiniti valori appartenenti ad un intervallo di numeri reali. p. 1/1 VARIABILI CASUALI CONTINUE Una variabile casuale

Dettagli

Facoltà di ECONOMIA Università di Pavia 26 Aprile 2006 Prova scritta di Analisi dei dati

Facoltà di ECONOMIA Università di Pavia 26 Aprile 2006 Prova scritta di Analisi dei dati Facoltà di ECONOMIA Università di Pavia 26 Aprile 2006 Prova scritta di Analisi dei dati MODALITÀ A Riportare sul foglio nome, cognome, numero di matricola e modalità del testo d esame. Problema 1 (8 PUNTI)

Dettagli

6) Una variabile aleatoria discreta V ha la seguente densità di probabilità:

6) Una variabile aleatoria discreta V ha la seguente densità di probabilità: (VHUFL]LVX&DOFRORGHOOHSUREDELOLWj PRGHOOLSUREDELOLVWLFLHYDULDELOLDOHDWRULH 1) Un fax può venir trasmesso a tre diverse velocità, a seconda di quali siano le condizioni di traffico sulla connessione tra

Dettagli

P(X > 0) = P(X 1 = 1) + P(X 1 = 1, X 2 = 1, X 3 = 1) =

P(X > 0) = P(X 1 = 1) + P(X 1 = 1, X 2 = 1, X 3 = 1) = 1 Esercizi settimana 3 Esercizio 1. Un urna contiene 8 palline bianche, 4 nere e rosse. Si assuma di vincere e ogni volta che si estragga una pallina nera, si perda 1e per ogni pallina bianca e non succeda

Dettagli

STATISTICA A K (63 ore) Marco Riani

STATISTICA A K (63 ore) Marco Riani STATISTICA A K (63 ore) Marco Riani mriani@unipr.it http://www.riani.it Esempio totocalcio Gioco la schedina mettendo a caso i segni 1 X 2 Qual è la prob. di fare 14? Esempio Gioco la schedina mettendo

Dettagli

I appello di calcolo delle probabilità e statistica

I appello di calcolo delle probabilità e statistica I appello di calcolo delle probabilità e statistica A.Barchielli, L. Ladelli, G. Posta 8 Febbraio 13 Nome: Cognome: Matricola: Docente: I diritti d autore sono riservati. Ogni sfruttamento commerciale

Dettagli

Statistica. Lezione : 18, 19. Variabili casuali

Statistica. Lezione : 18, 19. Variabili casuali Corsi di Laurea: a.a. 2017-18 Diritto per le Imprese e le istituzioni Scienze dell Amministrazione e Consulenza del Lavoro sienze Internazionali dello Sviluppo e della Cooperazione Statistica Variabili

Dettagli

PROBABILITÀ E STATISTICA - 23 Giugno 2017 Scrivere le risposte negli appositi spazi. Motivare dettagliatamente le risposte su fogli allegati

PROBABILITÀ E STATISTICA - 23 Giugno 2017 Scrivere le risposte negli appositi spazi. Motivare dettagliatamente le risposte su fogli allegati PROBABILITÀ E STATISTICA - 23 Giugno 2017 Scrivere le risposte negli appositi spazi. Motivare dettagliatamente le risposte su fogli allegati 1. - Un urna contiene 2 palline bianche e 28 nere; da essa vengono

Dettagli

Modelli descrittivi, statistica e simulazione

Modelli descrittivi, statistica e simulazione Modelli descrittivi, statistica e simulazione Master per Smart Logistics specialist Roberto Cordone (roberto.cordone@unimi.it) Statistica inferenziale Cernusco S.N., giovedì 18 febbraio 2016 (9.00/13.00)

Dettagli

Programmare. Definire una sequenza di istruzioni che specificano come effettuare una elaborazione

Programmare. Definire una sequenza di istruzioni che specificano come effettuare una elaborazione Python Programmare Definire una sequenza di istruzioni che specificano come effettuare una elaborazione Le istruzioni devono essere date in un linguaggio comprensibile dal calcolatore. In generele questi

Dettagli

ESERCIZI DI CALCOLO PROBABILITÀ DISTRIBUZIONI DOPPIE E NOTEVOLI

ESERCIZI DI CALCOLO PROBABILITÀ DISTRIBUZIONI DOPPIE E NOTEVOLI Variabili bidimensionali ESERCIZI DI CALCOLO PROBABILITÀ DISTRIBUZIONI DOPPIE E NOTEVOLI 1) Siano X 1 e X 2 due variabili casuali indipendenti che possono assumere valori 0, 1 e 3 rispettivamente con probabilità

Dettagli

Variabili casuali. - di Massimo Cristallo -

Variabili casuali. - di Massimo Cristallo - Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 16 e 27 maggio 2013 - di Massimo Cristallo - Variabili casuali

Dettagli

Test di preparazione all esame. Attenzione a non confonedere il coefficiente. n(n 1) (n m + 1) m(m 1) 2 1

Test di preparazione all esame. Attenzione a non confonedere il coefficiente. n(n 1) (n m + 1) m(m 1) 2 1 Test di preparazione all esame. Attenzione a non confonedere il coefficiente binomiale ( ) n m con la frazione n m. I coefficiente binomiale si può calcolare come ( ) n m = n(n 1) (n m + 1). m(m 1) 2 1

Dettagli

3 4 t t t 1. 5 k = 6. p(k) = 2

3 4 t t t 1. 5 k = 6. p(k) = 2 PROVE D'ESAME DI CCP, A.A. 2013/2014 12/06/2014 (1) Sia A un mazzo di 16 carte, contenente le carte di valore da 1 a 8 sia di cuori che di quadri. (a) Quanti sono i sottoinsiemi di 10 carte di A? (b) Quanti

Dettagli

Problema Posto s = n 2 a) calcolare la somma s per n=30 b) determinare il più piccolo intero n tale che s>30000

Problema Posto s = n 2 a) calcolare la somma s per n=30 b) determinare il più piccolo intero n tale che s>30000 Problema Posto s = 1 2 + 2 2 + 3 2 + + n 2 a) calcolare la somma s per n=30 b) determinare il più piccolo intero n tale che s>30000 Somma quadrati (for next).xlsm Somma quadrati (do loop).xlsm Nota La

Dettagli

Analisi e scelta dei dati di input

Analisi e scelta dei dati di input Analisi e scelta dei dati di input Corso di Tecniche di Simulazione, a.a. 2005/2006 Francesca Mazzia Dipartimento di Matematica Università di Bari 24 Aprile 2006 Francesca Mazzia (Univ. Bari) Analisi e

Dettagli

Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Teoria della probabilità A.A

Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Teoria della probabilità A.A Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Teoria della probabilità A.A. 2004-05 Alberto Perotti DELEN-DAUIN Esperimento casuale Esperimento suscettibile di più

Dettagli

Statistica Inferenziale

Statistica Inferenziale Statistica Inferenziale Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Riepilogo lezione 1 Abbiamo visto: Definizioni di statistica, statistica inferenziale, probabilità (interpretazione

Dettagli

Variabili aleatorie. Richiami e uso del Matlab

Variabili aleatorie. Richiami e uso del Matlab ω Variabili aleatorie Richiami e uso del Matlab X ( ω) x R S 1 In molte situazioni, si vuole assegnare un valore numerico ad ogni possibile risultato di un esperimento. Tale assegnamento viene chiamato

Dettagli

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.

Dettagli

Statistica Inferenziale

Statistica Inferenziale Statistica Inferenziale Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Riepilogo lezione 3 Abbiamo visto: Definizione di partizione di Teorema di Bayes Definizione di variabile aleatoria

Dettagli

Ψ PSICOMETRIA. Corso di laurea triennale (classe 34) STATISTICA INFERENZIALE

Ψ PSICOMETRIA. Corso di laurea triennale (classe 34) STATISTICA INFERENZIALE Ψ PSICOMETRIA Corso di laurea triennale (classe 34) STATISTICA INFERENZIALE STATISTICA INFERENZIALE CAMPIONE caratteristiche conosciute POPOLAZIONE caratteristiche sconosciute STATISTICA INFERENZIALE STIMA

Dettagli

p k q n k = p n (k) = n 12 = 1 = 12 1 12 11 10 9 1 0,1208. q = 1 2 e si ha: p 12 (8) = 12 8 4

p k q n k = p n (k) = n 12 = 1 = 12 1 12 11 10 9 1 0,1208. q = 1 2 e si ha: p 12 (8) = 12 8 4 CAPITOLO QUARTO DISTRIBUZIONE BINOMIALE (O DI BERNOULLI) Molti degli esempi che abbiamo presentato nei capitoli precedenti possono essere pensati come casi particolari di uno schema generale di prove ripetute,

Dettagli

1. Descrivere gli spazi campionari dei seguenti esperimenti casuali: 1. lancio di un dado 2. lancio di due dadi 3.

1. Descrivere gli spazi campionari dei seguenti esperimenti casuali: 1. lancio di un dado 2. lancio di due dadi 3. Corso di Laurea INTERFACOLTÀ - Esercitazione di Statistica n 6 ESERCIZIO 1: 1. Descrivere gli spazi campionari dei seguenti esperimenti casuali: 1. lancio di un dado 2. lancio di due dadi 3. lancio di

Dettagli

CALCOLO DELLE PROBABILITÀ

CALCOLO DELLE PROBABILITÀ CALCOLO DELLE PROBABILITÀ - gennaio 000 Elettronici: nn. 4 Informatici: nn. 6. Un lotto contiene pezzi buoni ed un solo pezzo difettoso. Si effettuano tre estrazioni senza restituzione, e sia E i = pezzo

Dettagli

Statistica A. Corsi di Laurea afferenti alla IV Facoltà Prova del Cognome e Nome...

Statistica A. Corsi di Laurea afferenti alla IV Facoltà Prova del Cognome e Nome... Compito A Statistica A Corsi di Laurea afferenti alla IV Facoltà Prova del 12-07-2007 Cognome e Nome...... N 0 di Matricola ISTRUZIONI: Copiare in modo chiaro e leggibile lo svolgimento di ciascun esercizio

Dettagli

Calcolo delle probabilità (3/7/2001) (Ing. Elettronica, Informatica, Telecomunicazioni - Latina)

Calcolo delle probabilità (3/7/2001) (Ing. Elettronica, Informatica, Telecomunicazioni - Latina) Calcolo delle probabilità (3/7/00). La distribuzione di probabilità di un numero aleatorio X non negativo soddisfa la condizione P (X > x + y X > y) = P (X > x), x > 0, y > 0. Inoltre la previsione di

Dettagli

esperimento casuale: è un esperimento condotto sotto l effetto del caso; evento elementare: ciascuno dei possibili esiti di un esperimento casuale;

esperimento casuale: è un esperimento condotto sotto l effetto del caso; evento elementare: ciascuno dei possibili esiti di un esperimento casuale; Capitolo 15 Suggerimenti agli esercizi a cura di Elena Siletti Esercizio 15.1: Suggerimento Si ricordi che: esperimento casuale: è un esperimento condotto sotto l effetto del caso; evento elementare: ciascuno

Dettagli

1 quartile. 2 quartile. 3 quartile. 1 percentile. 99 percentile. 5 percentile. 95 percentile. 10 percentile. 90 percentile.

1 quartile. 2 quartile. 3 quartile. 1 percentile. 99 percentile. 5 percentile. 95 percentile. 10 percentile. 90 percentile. ESERCIZIO 1 Il test di ammissione alla prestigiosa Università STUDY produce punteggi che seguono una distribuzione normale con media 500 e scarto quadratico medio 100. Il punteggio necessario per superare

Dettagli

1 Eventi. Operazioni tra eventi. Insiemi ed eventi. Insieme dei casi elementari. Definizione di probabilità.

1 Eventi. Operazioni tra eventi. Insiemi ed eventi. Insieme dei casi elementari. Definizione di probabilità. Quella che segue e la versione compatta delle slides usate a lezioni. NON sono appunti. Come testo di riferimento si può leggere Elementi di calcolo delle probabilità e statistica Rita Giuliano. Ed ETS

Dettagli

STATISTICA A D (72 ore)

STATISTICA A D (72 ore) STATISTICA A D (72 ore) Marco Riani mriani@unipr.it http://www.riani.it Tipologia di v.a. v.a. discreta numero finito di valori (infinità numerabile) x 1 x 2,, x k con probabilità p 1 p 2, p k Esempio:

Dettagli

Laboratorio di Calcolo B 67

Laboratorio di Calcolo B 67 Generazione di numeri casuali Abbiamo già accennato all idea che le tecniche statistiche possano essere utili per risolvere problemi di simulazione di processi fisici e di calcoli numerici. Dobbiamo però

Dettagli

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A) Prova scritta di STATISTICA CDL Biotecnologie (Programma di Massimo Cristallo - A) 1. Un associazione di consumatori, allo scopo di esaminare la qualità di tre diverse marche di batterie per automobili,

Dettagli

Esercitazione del 31/01/2012 Istituzioni di Calcolo delle Probabilità

Esercitazione del 31/01/2012 Istituzioni di Calcolo delle Probabilità Esercitazione del 1/01/2012 Istituzioni di Calcolo delle Probabilità Esercizio 1 Vengono lanciati due dadi regolari a 6 facce. (a) Calcolare la probabilità che la somma dei valori ottenuti sia 9? (b) Calcolare

Dettagli

Probabilità 1, laurea triennale in Matematica I prova scritta sessione estiva a.a. 2008/09

Probabilità 1, laurea triennale in Matematica I prova scritta sessione estiva a.a. 2008/09 Probabilità, laurea triennale in Matematica I prova scritta sessione estiva a.a. 2008/09. Due roulette regolari vengono azionate più volte; sia T il numero di volte che occorre azionare la prima roulette

Dettagli

9. VARIABILI CASUALI

9. VARIABILI CASUALI 9. VARIABILI CASUALI 9. Definizione di variabile casuale In molte situazioni reali l interesse è rivolto non tanto agli eventi che possono verificarsi nel corso di un esperimento, quanto al valore numerico

Dettagli

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ SCHEDA

Dettagli

CP110 Probabilità: esame del 20 giugno 2017

CP110 Probabilità: esame del 20 giugno 2017 Dipartimento di Matematica, Roma Tre Pietro Caputo 6-7, II semestre giugno, 7 CP Probabilità: esame del giugno 7 Cognome Nome Matricola Firma Nota:. L unica cosa che si puo usare durante l esame è una

Dettagli

Materiale didattico per il corso di Statistica I Quinta esercitazione SOLUZIONI

Materiale didattico per il corso di Statistica I Quinta esercitazione SOLUZIONI Materiale didattico per il corso di Statistica I Quinta esercitazione SOLUZIONI Claudia Furlan Anno Accademico 006-007 Ringrazio Carlo Gaetan, Nicola Sartori e Aldo Solari per il materiale, aggiunte e

Dettagli

CP110 Probabilità: Esame 27 gennaio Testo e soluzione

CP110 Probabilità: Esame 27 gennaio Testo e soluzione Dipartimento di Matematica, Roma Tre Pietro Caputo 212-13, II semestre 27 gennaio, 213 CP11 Probabilità: Esame 27 gennaio 213 Testo e soluzione 1. (6 pts) Tre amici dispongono di 6 monete da un euro e

Dettagli

P(X > 0) = P(X 1 = 1) + P(X 1 = 1, X 2 = 1, X 3 = 1) =

P(X > 0) = P(X 1 = 1) + P(X 1 = 1, X 2 = 1, X 3 = 1) = 1 Esercizi settimana 3 Esercizio 1. Un urna contiene 8 palline bianche, 4 nere e rosse. Si assuma di vincere e ogni volta che si estragga una pallina nera, si perda 1e per ogni pallina bianca e non succeda

Dettagli

Esercizi di Calcolo combinatorio: disposizioni

Esercizi di Calcolo combinatorio: disposizioni Calcolo combinatorio: disposizioni La Big Triple all ippodromo del luogo consiste nell indicare il corretto ordine di arrivo dei cavalli classificati tra i primi tre nella nona corsa. Se ci sono 12 cavalli

Dettagli

CP210 Introduzione alla Probabilità: Esonero 1

CP210 Introduzione alla Probabilità: Esonero 1 Dipartimento di Matematica, Roma Tre Pietro Caputo 018-19, II semestre 9 aprile, 019 CP10 Introduzione alla Probabilità: Esonero 1 Cognome Nome Matricola Firma Nota: 1. L unica cosa che si può usare durante

Dettagli

FENOMENI CASUALI. fenomeni casuali

FENOMENI CASUALI. fenomeni casuali PROBABILITÀ 94 FENOMENI CASUALI La probabilità si occupa di fenomeni casuali fenomeni di cui, a priori, non si sa quale esito si verificherà. Esempio Lancio di una moneta Testa o Croce? 95 DEFINIZIONI

Dettagli

Esercizi Biostatistica

Esercizi Biostatistica Esercizi Biostatistica Esercizio 1. Si supponga che la media e la deviazione standard del colesterolo in individui sani tra i 18 e i 25 anni valgano, rispettivamente, 150 e 25. Calcolare la probabilità

Dettagli

Calcolo delle Probabilità e Statistica, Ingegneria Civile e A&T e Informatica I prova finale a.a. 2016/17

Calcolo delle Probabilità e Statistica, Ingegneria Civile e A&T e Informatica I prova finale a.a. 2016/17 Calcolo delle Probabilità e Statistica, Ingegneria Civile e A&T e Informatica I prova finale aa 6/ Punteggi: : 3 + 6; : + + + ; 3: + Una scatola contiene monete; 8 di queste sono equilibrate, mentre le

Dettagli