Prof.ssa Paola Vicard



Documenti analoghi
Distribuzioni per unità

Lezione 4 Corso di Statistica. Domenico Cucina

Lezione 4 Corso di Statistica. Francesco Lagona

Quartili. Esempio Q 3 Q 1. Distribuzione unitaria degli affitti settimanali in euro pagati da 19 studenti U.S. A G I F B D L H E M C

Quartili. Esempio Q 3. Me Q 1. Distribuzione unitaria degli affitti settimanali in euro pagati da 19 studenti U.S. A G I F B D L H E M C

Fonti e strumenti statistici per la comunicazione

Esempio: distribuzione di frequenze. =, Pagina 90. Esempio: distribuzione di frequenze

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica

LE MISURE DI SINTESI (misure di tendenza centrale)

Fonti e strumenti statistici per la comunicazione

Prof.ssa Paola Vicard

Metodi statistici per le ricerche di mercato

Variabilità o Dispersione Definizione Attitudine di un fenomeno ad assumere diverse modalità

Lezione 4 Corso di Statistica. Francesco Lagona

COME CALCOLARE L INTERVALLO DI CONFIDENZA QUANDO E NECESSARIO STIMARE LA DEVIAZIONE STANDARD? (è quasi sempre così!)

Inferenza Statistica. L inferenza statistica cerca di risalire al modello del fenomeno sulla base delle osservazioni.

STATISTICA 1 ESERCITAZIONE 4

Metodi statistici per le ricerche di mercato

STATISTICA 1 ESERCITAZIONE 5

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

Lezione 5. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 5. A. Iodice.

Campionamento casuale da popolazione finita (caso senza reinserimento )

Alcuni concetti di statistica: medie, varianze, covarianze e regressioni

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica e Biometria

SUCCESSIONI DI FUNZIONI

Lezione III: Variabilità. Misure di dispersione o di variabilità. Prof. Enzo Ballone. Lezione 3a- Misure di dispersione o di variabilità

Statistica 1 A.A. 2015/2016

n=400 X= Km; s cor =9000 Km Livello di confidenza (1-α)=0,95 z(0,05)=1,96

Approfondimento 3.3. Calcolare gli indici di posizione con dati metrici singoli e raggruppati in classi

STATISTICA 1 ESERCITAZIONE 3

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

( 4) ( ) ( ) ( ) ( ) LE DERIVATE ( ) ( ) (3) D ( x ) = 1 derivata di un monomio con a 0 1. GENERALITÀ

ALCUNI ESERCIZI SUI TEST DI IPOTESI PARAMETRICHE PARTE 1

3. Calcolo letterale

Gli Indici di VARIABILITA

Caso studio 9. Distribuzioni doppie. Esempi

Metodi quantitativi per l analisi dello sviluppo

Elementi di statistica descrittiva. Tabella dei dati :

Elementi di statistica

LE MISURE DI TENDENZA CENTRALE

APPROSSIMAZIONE NORMALE. 1. Si tirano 300 dadi non truccati. Sia X la somma dei punteggi. Calcolare approssimativamente le probabilità seguenti.

Lezione 9. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 9. A. Iodice

Stime puntuali. Statistica e biometria. D. Bertacchi. Stime puntuali. Intervalli di confidenza. Approfondiamo

Confronto di due misure Campioni indipendenti

Esperimentazioni di Fisica 1. Prova scritta del 1 febbraio 2016 SOLUZIONI

ES 1.3. Data la distribuzione unitaria di una variabile quantitativa X. la media aritmetica di X è data dal rapporto tra il totale n

Senza reimmissione. Le n v.a. non sono più indipendenti e identicamante distribuite. Campionamento da universo

Anemia. Anemia - percentuali

Una funzione delle osservazioni campionarie è una statistica che, nel contesto della stima di un parametro, viene definita stimatore.

Statistica. Lezione 5

STATISTICA INFERENZIALE

Poiché n<30 e la deviazione standard non era nota a priori ma è stata stimata (s=14.4), la statistica test da utilizzare è t:

Metodi statistici per le ricerche di mercato

Metodi di valutazione delle prestazioni di rete

Corso di Statistica Canale E Bini, Cutillo A.A. 2017/2018. Esercitazione di riepilogo n.8 Test di ipotesi Soluzioni

Scrivere su ogni foglio NOME e COGNOME. Le risposte devono essere giustificate sui fogli protocollo e riportate nel foglio RISPOSTE.

Probabilità 1, laurea triennale in Matematica II prova scritta sessione estiva a.a. 2008/09

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Statistica inferenziale, Varese, 25 novembre 2008 Prima parte - Modalità A - soluzione

Esercitazione parte 1 Medie e medie per dati raggruppati. Esercitazione parte 2 - Medie per dati raggruppati

Domande di teoria. Chiorri, C. (2014). Fondamenti di psicometria - Risposte e soluzioni Capitolo 3

IPSAA U. Patrizi Città di Castello (PG) Classe 5A Tecnico Agrario. Lezione di martedì 10 novembre 2015 (4 e 5 ora) Disciplina: MATEMATICA

Programma della parte introduttiva: Lezione 4

Lezione 8. Statistica sociale Laurea specialistica in Progettazione e gestione del turismo culturale

Esercitazioni del corso: STATISTICA

Analisi Matematica Soluzioni prova scritta parziale n. 1

Corso di Statistica - Esercitazione 1

Lezioni del Corso di Fondamenti di Metrologia Meccanica

Intervalli di confidenza

Statistica inferenziale, Varese, 25 novembre 2008 Prima parte - Modalità B - soluzione

Entropia ed informazione

Insiemi numerici. Sono noti l insieme dei numeri naturali: N = {1, 2, 3, }, l insieme dei numeri interi relativi:

Corso di Statistica. Test per differenza tra medie e proporzioni. Prof.ssa T. Laureti a.a

Esercitazioni del Corso di Probabilitá e Statistica Lezione 6: Stime di parametri puntuali e per intervalli

TECNICA DELLE MISURAZIONI APPLICATE 17 OTTOBRE 2012

Distribuzione normale

Def. R si dice raggio di convergenza; nel caso i) R = 0, nel caso ii)

Daniela Tondini

Probabilità e Statistica (cenni)

POLITECNICO DI MILANO, POLO DI CREMONA CALCOLO DELLE PROBABILITA' E STATISTICA

Appunti di STATISTICA

Accenni al calcolo combinatorio

UNIVERSITÀ DEGLI STUDI DI MILANO - BICOCCA FACOLTÀ DI SOCIOLOGIA a. a Esame del STATISTICA

poco significativo. RAPPORTI INDICI / NUMERI INDICI RAPPORTI DI COMPOSIZIONE RAPPORTI DI DENSITÀ RAPPORTI DI DURATA RAPPORTI DI RIPETIZIONE AD ESEMPIO

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 6

UNIVERSITÀ DEGLI STUDI DI MILANO - BICOCCA

Stima di somme: esercizio

Corso di Laurea Triennale in Matematica Calcolo delle Probabilità I (docenti G. Nappo, F. Spizzichino)

( 1) k+1 x k + R N+1 (x), k. 1 + x 10 2, 5 R N+1 ( 1 3 ) ) )

Popolazione e Campione

Distribuzione normale o gaussiana

Università degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A

Esercitazioni del corso: ANALISI MULTIVARIATA

Formulario di Statistica (Cucina-Lagona)

Università degli Studi di Cassino, Anno accademico Corso di Statistica 2, Prof. M. Furno

Esercitazione n Supponendo che i giorni lavorativi in un anno siano 340, quanti chilometri percorre mediamente un tir in un anno?

Stima della media di una variabile X definita su una popolazione finita

Intervalli di confidenza

Radicali. Esistenza delle radici n-esime: Se n è pari: ogni numero reale non negativo (cioè positivo o nullo) ha esattamente una radice n-esima in R.

Transcript:

Statistica Computazioale Questa ota cosiste per la maggior parte ella traduzioe (co alcue modifiche e itegrazioi) da Descriptive statistics di J. Shalliker e C. Ricketts, 000, Uiversity of Plymouth Questa ota si occupa dell illustrazioe dei metodi per il calcolo degli idici di variabilità di ua distribuzioe. I particolare si vedrà l uso di Excel per il calcolo: i) del campo di variazioe (o rage) ii) dello scarto iterquartile iii) della variaza e della deviazioe stadard Nell illustrazioe dei metodi useremo il file esercizio4_dati.xls. Il campo di variazioe (o rage) Siao x,,x K le diverse modalità osservate del carattere Idichiamo co x max la modalità massima osservata, ossia max(x,,x K ), e co x mi la modalità miima osservata, ossia mi(x,,x K ); allora il rage è dato da R = x x Cosideriamo l esempio el foglio di lavoro statura. Osserviamo che elle celle F3:G4 abbiamo già calcolato l altezza massima (i G3) e miima (i G4). Per calcolare il rage: - ella cella F8 scrivere il titolo R= - ella cella G8 scrivere la formula =G3 G4 Nel ostro esempio si trova che il campo di variazioe è 4,5. Lo scarto iterquartile max Esso è dato dalla differeza tra il terzo quartile e il primo quartile. I formule Scarto iterquartile = Q3 Q abbiamo visto ella ota precedete come calcolare i quartili co Excel (el caso di distribuzioi sia uitarie sia di frequeze). Il calcolo dello scarto iterquartile, ua volta calcolati Q e Q 3, è molto semplice. Cosideriamo l esempio el foglio di lavoro statura e calcoliamo: ) lo scarto iterquartile esatto, ossia la differeza tra il terzo quartile (ella cella G5) e il primo quartile (ella cella G4) otteuti dalla distribuzioe di uità ) lo scarto iterquartile approssimato, ossia la differeza tra il terzo quartile approssimato (ella cella G7) e il primo quartile approssimato (ella cella G6) otteuti dalla distribuzioe di frequeza del carattere raggruppato i classi. Per calcolare lo scarto iterquartile - ella cella F9 scrivere il titolo Scarto iterquatile= - ella cella G9 scrivere la formula =G5 G4 Nel ostro esempio si trova che il campo di variazioe è 8,. Per calcolare lo scarto iterquartile approssimato - ella cella F30 scrivere il titolo Scarto iterquatile approssimato= - ella cella G30 scrivere la formula =G7 G6 Nel ostro esempio si trova che il campo di variazioe è 8,7. mi

Statistica Computazioale La variaza e la deviazioe stadard Si ricordi che la variaza e la deviazioe stadard si possoo calcolare quado il carattere è quatitativo. Vegoo presetate separatamete l aalisi dei dati sotto forma di distribuzioe per uità e l aalisi dei dati sotto forma di distribuzioe di frequeza. Distribuzioi per uità Data ua distribuzioe uitaria a, a,, a, avete media aritmetica µ, la variaza è data da ( ) σ = ai ai µ = µ le due formule sopra riportate soo del tutto equivaleti. La deviazioe stadard è data dalla radice quadrata della variaza ossia σ = i µ = µ ( ) a a i ache i questo caso, le due formule sopra riportate soo del tutto equivaleti. Cosideriamo come esempio il data set coteuto el foglio di lavoro statura. Lavoriamo sulla lista dei dati (D4:D0). Esiste ua fuzioe statistica i Excel che calcola automaticamete la variaza di ua distribuzioe data sotto forma di distribuzioe uitaria. Quidi per calcolare la variaza: - ella cella F3 scrivere il titolo Variaza= - ella cella G3 scrivere la formula =VAR.POP(D4:D0) Nel ostro esempio co la fuzioe VAR.POP si ottiee σ = 34,8 cm La fuzioe VAR.POP si riferisce al calcolo della variaza di ua popolazioe e quidi trova applicazioe ell ambito della statistica descrittiva. La fuzioe VAR, da o usare i questo caso, trova applicazioe ell ambito della statistica ifereziale e calcola la formula σ = ( a ) i µ -. - A questo puto potete ache cambiare il umero di cifre decimali che volete siao visualizzate. Per calcolare la deviazioe stadard: - ella cella F3 scrivere il titolo Deviazioe stadard= - ella cella G3 scrivere la formula =DEV.ST.POP(D4:D0) Se o vi ricordate la fuzioe da usare: ua volta posizioati ella cella G3, ella barra dei comadi cliccare su Iserisci e el meu che si apre scegliere Fuzioe. Si apre ua fiestra di dialogo. I questa scegliere le fuzioi statistiche (i questo modo vedrete la lista di tutte le fuzioi statistiche. I questa lista scegliere VAR.POP. Cliccare su OK. Si apre ua uova fiestra di dialogo. Nello spazio chiamato Num iserire l itervallo i cui si trovao i dati (ossia D4:D0). Cliccare su OK.

Statistica Computazioale Alterativamete, se si è già calcolata la variaza, la deviazioe stadard può essere calcolata come radice quadrata della variaza. Quidi, ad esempio, el ostro caso ella cella H3 basta scrivere la formula =RADQ(G3). Nel ostro esempio sia co la fuzioe DEV.ST.POP sia co RADQ si ottiee σ = 5,90 cm La fuzioe DEV.ST.POP, come VAR.POP, trova applicazioe ell ambito della statistica descrittiva. - A questo puto potete ache cambiare il umero di cifre decimali che volete siao visualizzate. Distribuzioi di frequeza I molto casi può accadere che o si dispoga della distribuzioe per uità ma solo della distribuzioe di frequeza. Allora, come già visto per gli idici di posizioe, Excel o dispoe di fuzioi per il calcolo automatico. Ricordiamo che data ua geerica distribuzioe di frequeze X i f i x f x i i f i x K K f K avete media µ la variaza si defiisce come segue K ( ) K = = i i i i x x σ µ µ se si usao le frequeze assolute o i modo equivalete se si usao le frequeze relative. K ( ) K = xi fi = xi fi σ µ µ Cosideriamo per esempio il data set coteuto el foglio di lavoro Voto chiarezza del file esercizio4_dati.xls. I particolare lavoriamo solo sulla tabella di frequeza (igorado la lista di dati). I calcoli per la media aritmetica soo stati eseguiti ella ota precedete e qui vego dati per assuti. Il calcolo della variaza prevede (se si usa la formula el riquadro azzurro) ) il calcolo del prodotto tra il quadrato di ciascua modalità e la sua rispettiva frequeza ) la somma dei prodotti eseguiti el passo precedete 3) la divisioe del totale per la umerosità della popolazioe 4) la sottrazioe a questo totale del quadrato della media aritmetica (abbiamo visto il calcolo della media aritmetica per distribuzioi i classi ella ota precedete). Vediamo come fare co Excel 3

Statistica Computazioale - ella cella J6 scrivere il titolo x^*freq. - ella cella J7 scrivere la formula =E7^*F7 e trasciare la formula fio a coprire la cella J3. - Nella cella J5 calcolare la somma del prodotti appea eseguiti usado il tasto di somma automatica Σ oppure scrivedo =somma(j7:j3). - Nella cella E4 scrivere Variaza= - Nella cella F4 scrivere la formula =J5/F5-F^. Si ricordi che ella cella F si trova le media aritmetica calcolata i precedeza. A questo puto, se si vuole, è possibile cambiare il formato del umero. Il risultato el ostro esempio è,8. Se volete potete verificare che il risultato che si ottiee i questo modo è lo stesso che si otterrebbe utilizzado la fuzioe VAR.POP sulla lista dei dati i C4:C55. La deviazioe stadard a questo puto si calcola come radice quadrata della variaza: - Nella cella E5 scrivere Deviazioe stadard= - Nella cella F5 scrivere la formula =RADQ(F4). Il risultato el ostro esempio è,35. Dati raggruppati i classi Data la distribuzioe di u carattere, avete media µ, raggruppato i classi X i f i c 0 c f c i- c i i f i c K- c K K f K esattamete come visto el caso del calcolo della media aritmetica, per ogi classe, ci ci diciamo c i e c i, si calcola il suo valore cetrale come segue: c xi = +. Quado la classe è aperta allora si fao opportue ipotesi sul valore rappresetativo della classe. La variaza si calcola co ua delle quattro espressioi sotto riportate. K K K K = ( c i ) i ( c i ) i c i i c i i x = x f = x x f = σ µ µ µ µ Cosideriamo come esempio il data set coteuto el foglio di lavoro statura del file esercizio4_dati.xls. I particolare lavoriamo solo sulla tabella di frequeza (igorado la lista di dati). Il calcolo della variaza i questo caso è approssimato visto che ogi classe viee rappresetata dal suo valore cetrale. Il calcolo si svolge ei segueti passi (se si usa la formula el riquadro rosso) ) calcolo del valore cetrale di ciascua classe (valore che chiamiamo qui cetro) el ostro esempio già dispoiamo del valore cetrale e quidi o è ecessario ricalcolarlo ) calcolo del prodotto tra il quadrato del cetro di ciascua classe e la sua rispettiva frequeza assoluta 3) somma dei prodotti eseguiti el passo precedete 4

Statistica Computazioale 4) divisioe del totale per la umerosità della popolazioe 5) sottrazioe a questo totale del quadrato della media aritmetica (abbiamo visto il calcolo della media aritmetica per distribuzioi i classi ella ota precedete). 6) divisioe del totale per la umerosità della popolazioe Vediamo come fare co Excel - ella cella O3 scrivere il titolo cetro^*freq. - ella cella O4 scrivere la formula =J4^*K4 e trasciare la formula fio a coprire la cella O5. - Nella cella O7 calcolare la somma del prodotti appea eseguiti usado il tasto di somma automatica Σ oppure scrivedo =somma(o4:o5). - Nella cella F33 scrivere Variaza approssimata= - Nella cella G33 scrivere la formula =O7/K7-G^. Si ricordi che ella cella G si trova le media aritmetica approssimata calcolata i precedeza. A questo puto, se si vuole, è possibile cambiare il formato del umero. La variaza approssimata el ostro esempio è 34,7 cm. I questo caso si verifica che la variaza approssimata (calcolata a partire dalla distribuzioe i classi) differisce, sebbee di poco, dalla variaza calcolata a partire dalla lista completa dei dati. La deviazioe stadard a questo puto si calcola come radice quadrata della variaza: - Nella cella F34 scrivere Deviazioe stadard approssimata= - Nella cella G34 scrivere la formula =RADQ(G33). Il risultato el ostro esempio è 5,89 cm. 5