IN MATLAB distribuzione di frequenza. >> x(1)=7.5; >> for i=2:7 x(i)=x(i-1)+5; end. IN MATLAB distribuzione di frequenza



Documenti analoghi
IN MATLAB distribuzione di frequenza. >> x(1)=7.5; >> for i=2:7 x(i)=x(i-1)+5; end. IN MATLAB distribuzione di frequenza

Facciamo qualche precisazione

Analisi di dati di frequenza

DISTRIBUZIONI DI PROBABILITÀ

Dai dati al modello teorico

Istituzioni di Statistica e Statistica Economica

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Prova di autovalutazione Prof. Roberta Siciliano

Statistica Applicata all edilizia: alcune distribuzioni di probabilità

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Variabili aleatorie. Richiami e uso del Matlab T T T. ω 2. ω 1. ω 3. ω 4. ω 5. ω 6. ω 7. ω 8

Verifica di ipotesi

Esercitazione n.1 (v.c. Binomiale, Poisson, Normale)

Statistica. Lezione 6

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Matlab per applicazioni statistiche

Prova scritta di Complementi di Probabilità e Statistica. 31 Ottobre 2012

DISTRIBUZIONI DI VARIABILI CASUALI DISCRETE

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE SIMULAZIONE della PROVA SCRITTA di STATISTICA 23/03/2011

Analisi statistica degli errori

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

Esercitazioni di Statistica

Slide Cerbara parte1 5. Le distribuzioni teoriche

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)

E naturale chiedersi alcune cose sulla media campionaria x n

Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Elementi di Psicometria

Tenendo conto che la funzione di probabilità per una v.c. binomiale X è definita dalla seguente notazione

Indici di dispersione

AFFIDABILITA DEI SISTEMI STOCASTICI (semplici)

Metodi statistici per le ricerche di mercato

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Corso di Automazione Industriale 1. Capitolo 4

Corso di Psicometria Progredito

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE

STATISTICA IX lezione

La grafica. La built-in funzione grafica plot. x spezzata poligonale. discretizzato

Variabili aleatorie. Richiami e uso del Matlab

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice

Il concetto di valore medio in generale

Statistica descrittiva

LA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di

Inferenza statistica. Statistica medica 1

Esercitazioni di Statistica con Matlab

l insieme delle misure effettuate costituisce il campione statistico

La distribuzione Normale. La distribuzione Normale

VERIFICA DELLE IPOTESI

1. Distribuzioni campionarie

Esercitazioni di Statistica


ESERCIZI SVOLTI PER LA PROVA DI STATISTICA

Dr. Marco Vicentini Anno Accademico Rev 30/03/2011

Tema A Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che

Programmazione Disciplinare: Calcolo Classe: Quarte - Quinte

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

Tutorato di Probabilità e Statistica

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA

i=1 Y i, dove Y i, i = 1,, n sono indipendenti e somiglianti e con la stessa distribuzione di Y.

Elementi di Psicometria con Laboratorio di SPSS 1

Grafici delle distribuzioni di frequenza

Test statistici di verifica di ipotesi

La distribuzione Gaussiana

Statistica inferenziale

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

LEZIONE n. 5 (a cura di Antonio Di Marco)

LA STATISTICA E IL CALCOLO DELLE PROBABILITÀ

STATISTICA DESCRITTIVA. Le misure di tendenza centrale

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

CENNI DI METODI STATISTICI

CORSO DI MISURE ANALISI DEI SEGNALI NEL DOMINIO DEL TEMPO

Il confronto fra proporzioni

11. Analisi statistica degli eventi idrologici estremi

Elementi di Psicometria con Laboratorio di SPSS 1

VARIABILI ALEATORIE CONTINUE

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE

COMPITO DI SCIENZE NATURALI 23 gennaio Modulo di probabilità e statistica

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7

Esercizi test ipotesi. Prof. Raffaella Folgieri aa 2009/2010

Statistica 4038 (ver. 1.2)

Temi di Esame a.a Statistica - CLEF

RISK MANAGEMENT: MAPPATURA E VALUTAZIONE DEI RISCHI AZIENDALI. UN COSTO O UN OPPORTUNITA?

Gli eventi sono stati definiti come i possibili risultati di un esperimento. Ogni evento ha una probabilità

Appunti relativi a Lab4

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Statistiche campionarie

Statistica descrittiva

Titolo della lezione. Analisi dell associazione tra due caratteri: indipendenza e dipendenza

1 di 6. Usando un modello di probabilità

TECNICHE DI SIMULAZIONE

Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V

La variabile casuale Binomiale

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6

Politecnico di Milano - Scuola di Ingegneria Industriale. I Prova in Itinere di Statistica per Ingegneria Energetica 9 maggio 2013

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

Analisi Statistica per le Imprese (6 CFU) - a.a Prof. L. Neri RICHIAMI DI STATISTICA DESCRITTIVA UNIVARIATA

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

Statistica Matematica A - Ing. Meccanica, Aerospaziale I prova in itinere - 19 novembre 2004

Transcript:

IN MATLAB distribuzione di frequenza 2-1 4. Usare la function histc(dati,x) 2-2 1. Riportare i dati in un file (ad esempio dati.mat); 2. load ascii dati: viene creata una variabile dati contenente il campione; 3. Costruire un vettore contenente gli estremi delle classi: >> x(1)=7.5; >> for i=2:7 x(i)=x(i-1)+5; end >> x x = >> n=histc(dati,x) n = 1 12 10 5 1 1 0 Numero di dati del c.c. che coincidono con l ultimo estremo >> x x = 7.5000 12.5000 17.5000 22.5000 27.5000 32.5000 37.5000 >> n n = 7.5000 12.5000 17.5000 22.5000 27.5000 32.5000 37.5000 1 12 10 5 1 1 0 IN MATLAB distribuzione di frequenza 2-3 IN MATLAB distribuzione di frequenza relativa 2-4 1. Costruire un vettore contenente i centri delle classi: A) Dividere la function histc per la taglia del campione: >> c(1)=10.0; >> for i=2:6 c(i)=c(i-1)+5; end >> c c = 2. Usare la function [n,xout]=hist(dati,c) 10 15 20 25 30 35 >> n=histc(dati,x)/30 n = 0.0333 0.4000 0.3333 0.1667 0.0333 0.0333 0 >> [n,xout]=hist(dati,c) B) Dividere il parametro di output n di hist per la taglia del campione: n = 1 12 10 5 1 1 >> n=n/30 n = xout = 0.0333 0.4000 0.3333 0.1667 0.0333 0.0333 10 15 20 25 30 35 IN MATLAB Istogramma (fr. assolute) 2-5 IN MATLAB Istogramma (fr. relative) 2-6 A) La function hist fornisce in output anche l istogramma. >> hist(dati,c) >> [n,xout]=hist(dati,c); >> n=n/30; >> bar(xout,n); 1

IN MATLAB Qualche didascalia 2-7 IN MATLAB Istogramma (fr. assolute) 2-8 >> title('frequenze relative'); >> xlabel('ore trascorse a studiare'); >> text(30,0.35,'istogramma'); E possibile costruire l istogramma anche con la function histc: >> [n,xout]=hist(dati,c); >> bar(xout,n) IN MATLAB Istogramma (fr. relative) 2-9 IN MATLAB Le function bar 2-10 >> [n,xout]=hist(dati,c); >> bar(xout,n/30) >> bar(xout,n/30,1) Le barre si toccano >> barh(xout,n/30) Barre orizzontali >> bar3(xout,n,1, r ) Grafici 3-D >> bar3h(xout,n,1) IN MATLAB Poligono di frequenza 2-11 IN MATLAB Distribuzione cumulativa 2-12 >> plot(c,n,'--rs') E possibile usare la funzione cdfplot: >> cdfplot(dati) 2

IN MATLAB Q-Q plot 2-13 IN MATLAB Calcolo dei percentili 2-14 E possibile usare la funzione normplot: >> normplot(dati) >>x=[96, 92, 91, 88, 86, 85, 84, 83, 82, 79, 78, 69]; >>prctile(x,25) ans = 80.5000 >> prctile(x,50) ans = 84.5000 >>prctile(x,75) ans = 89.5000 IN MATLAB Grafico del box-plot >> boxplot(x) 2-15 7. Box Plot >> boxplot(es3) OUTLIERS 2-16 >> [max(es3),min(es3)] ans = 4.6191 0.0117 2-17 Distribuzione uniforme discreta 2-18 Distribuzione di Bernoulli >> p= ; q=1-p; c=[0,1]; dat=[q,p]; bar(c,dat) In Matlab >>c=[1,2,3,4,5,6]; dat=unidpdf(c,6); bar(c,dat) 3

2-19 2-20 Distribuzione uniforme discreta (funzione cumulativa) Distribuzione binomiale >>dat1=unidcdf(c,6); >>stairs(c,dat1) >> x=0:10; >> y=binopdf(x,10,0.5); Distribuzione binomiale >> x=0:10; >> y=binopdf(x,10,0.01); 2-21 Binocdf Binoinv Binornd Binostat Distribuzione binomiale (funzione di ripartizione) >> x=0:10; >> y=binocdf(x,10,0.5); >> y1=binocdf(x,10,0.1); 2-22 >> stairs(x,y, r ); hold on; stairs(x,y1, g ) >> legend( 0.5, 0.1 ) 2-23 2-24 DISTRIB.BINOM: restituisce la distribuzione binomiale per il numero di successi scelto. Sintassi: DISTRIB.BINOM(num_successi;prove;probabilità_s;cumulativo) Num_successi è il numero di successi nelle prove, (ossia x=0,1, prove). Distribuzione geometrica >> x=1:10; >> y=geopdf(x,0.5); Prove è il numero di prove indipendenti, ossia n. Probabilità_s è la probabilità di successo per ciascuna prova, ossia p. Cumulativo è un valore logico che determina la forma assunta dalla funzione. Se il valore cumulativo è VERO, DISTRIB.BINOM restituirà la funzione di ripartizione, ovvero la probabilità che venga restituito un numero massimo di successi pari al valore di num_successi. Se il valore cumulativo è FALSO, verrà restituita la funzione massa di probabilità, ovvero la probabilità che venga restituito un numero massimo di successi pari al valore di num_successi. 4

2-25 2-26 Distribuzione geometrica >> x=1:10; >> y=geocdf(x,0.5); >> y1=geocdf(x,0.1); Distribuzione Poisson >> x=0:20; >> y=poisspdf(x,2); >> x=0:20; >> y=poisspdf(x,5); >> stairs(x,y, r ); hold on; stairs(x,y1, g ) >> legend( 0.5, 0.1 ) >> [media,var]=geostat(0.5) >> [media,var]=poisstat(2) >> [media,var]=poisstat(5) 2-27 2-28 >> x=0:20; >> y=poisspdf(x,10); >>x=0:20; >> y1=binopdf(x,50,1/5); >> bar(x,y1) >> x=0:100; >> y=poisspdf(x,50); >>x=0:50; >> y1=binopdf(x,500,1/10); >> bar(x,y1) Distribuzione Normale 2-29 Distribuzione Normale 2-30 [media,var]=binostat(500,0.1) [media,var]=binostat(10,0.5) media=50, var=45 media=5, var=2.5 >> x=0:0.1:100; >> y=normpdf(x,50,sqrt(45)); >> plot(x,y) >> x=0:0.01:10; >> y=normpdf(x,5,sqrt(2.5)); >> plot(x,y) 5

P POISSON: restituisce la distribuzione di probabilità di Poisson. Sintassi: POISSON(x;media;cumulativo) X Media è il numero degli eventi. è il valore numerico previsto. Cumulativo è un valore logico che determina la forma per la distribuzione di probabilità. Se cumulativo è VERO, POISSON restituirà la funzione di ripartizione di Poisson indicante la probabilità che il numero degli eventi casuali sia compreso tra zero e x inclusi. Se cumulativo è FALSO, verrà restituita la funzione massa di probabilità di Poisson indicante la probabilità che il numero di eventi sia esattamente uguale a x. 2-31 DISTRIB.NORM: restituisce la distribuzione normale per la media e la distribuzione standard specificate. Sintassi DISTRIB.NORM(x;media;dev_standard;cumulativo) X è il valore per il quale si desidera la distribuzione. Media è la media aritmetica della distribuzione. Dev_standard è la deviazione standard della distribuzione. Cumulativo è un valore logico che determina la forma assunta dalla funzione. Se cumulativo è VERO, DISTRIB.NORM restituirà la funzione di ripartizione, se è FALSO restituirà la funzione densità di probabilità. DISTRIB.NORM.ST: restituisce la funzione di ripartizione normale standard cumulativa. La distribuzione ha una media uguale a 0 (zero) e una deviazione standard uguale a uno. 2-32 Sintassi: DISTRIB.NORM.ST(z) Z è il valore per il quale si desidera la distribuzione. 2-33 2-34 INV.NORM: restituisce il quantile associato alla coda sinistra della distribuzione normale con media e varianza specificate. Sintassi: INV.NORM(probabilità;media; gradi_libertà) Distribuzione Ipergeometrica p = hygepdf(0:10,100,20,10) Probabilità è la probabilità della coda destra sotto la densità chi-quadrato. Media è la media aritmetica della distribuzione. Dev_standard è la deviazione standard della distribuzione. INV.NORM.ST: restituisce il quantile associato alla coda sinistra della distribuzione normale standard. Sintassi: INV.NORM(probabilità) Taglia popolazione successi Taglia campione >> bar(0:10,p) Probabilità è la probabilità della coda destra sotto la densità 2-35 DISTRIB.IPERGEOM: restituisce la distribuzione di probabilità di una variabile aleatoria ipergeometrica. 2-36 Ipergeometrica Sintassi: DISTRIB.IPERGEOM(successi_camp;num_campione;successi_pop;num_popolazione) Successi_camp è il numero di successi nel campione, ossia x. Num_campione è la dimensione del campione, ossia n. Successi_pop è il numero di successi nella popolazione, ossia K. Num_popolazione è la dimensione della popolazione, ossia N. Binomiale >>y=binopdf(0:10,10,2/10) >>bar(0:10,10,2/10) 6

Il test di K-S misura la distanza media tra la funzione di ripartizione Empirica e quella ipotizzata. Se tale distanza risulta maggiore di un prefissato quantile, il test K-S rigetta l ipotesi che la popolazione ha distribuzione di probabilità prefissata. 2-37 Kstest(x) Confronta la funzione di ripartizione empirica del campione x con la funzione di ripartizione di una gaussiana standard Se il campione casuale di dati non ha media nulla e varianza unitaria? I dati vanno standardizzati. 2-38 >> x=(weight-mu)/sigma; >> [H,P,KSSTAT,CV]=KSTEST(X) E se il campione casuale ha legge diversa da quella gaussiana standard? >> x=rand(100,1); >> ccf(:,1)=x; >> ccf(:,2)=x; >> [H,P,KSSTAT,CV]=KSTEST(x,ccf,0.05,0) >> [h,p,ksstat,cv]=kstest(x) h = p = 0 0.7172 ksstat = cv = >> 0.0687 0.1340 H = 0 => Do not reject the null hypothesis at significance level ALPHA. H = 1 => Reject the null hypothesis at significance level ALPHA. KSTEST(...) also returns the K-S test statistic KSSTAT defined above for the test type indicated by TAIL. 2-39 KSTEST(...) also returns the asymptotic P-value P. KSTEST(...) returns the critical value of the test CV. 2-40 Null Hypothesis: F(x) equal to CDF for all x. For TAIL = 0 (2-sided test), alternative: F(x) not equal to CDF. For TAIL = 1 (1-sided test), alternative: F(x) greater than CDF. For TAIL = -1 (1-sided test), alternative: F(x) less than CDF. 2-41 2-42 7

2-43 2-44 2-45 2-46 Test T sulla differenza tra medie popolazioni normali varianze incognite = Esempio: Da una serie di rilevazioni sulla quantità di specie presenti in alcuni Ambienti, sono stati rilevati I seguenti 20 valori di biodiversità (vedi tabella). Si Valuti se la tendenza centrale di questa serie è significativamente differente da 6.5, valore centrale dell area in studi precedenti. 2-47 2-48 2,5-2,7-2,9-2,9-3,1-3,1-3,1-3,8-3,9-4,2-4,5-4,9-5,3-6,5 0 6,5 0 8,9 + 9,7 + 11,7 + 15,7 + 18,9 + + N = 18, r = 13, r = 5 0,096252 8

2-49 2-50 2-51 2-52 2-53 2-54 Nel grafico, ogni media del livello viene rappresentata da un tondino che è situato al centro di un intervallo. L intervallo non ha alcun significato statistico. Due medie sono differenti in modo significativo se i corrispettivi intervalli sono disgiunti (in rosso). Due medie non sono differenti in modo significativo se i rispettivi intervalli non sono disgiunti (in grigio). La frase sotto il grafico segnala le medie dei livelli diverse. 9

2-55 2-56 Si può usare il mouse per selezionare un gruppo. Il grafico mette in evidenza gli altri gruppi (in rosso) che sono differenti significativamente dal livello esaminato. 2-57 2-58 2-59 2-60 10

2-61 11