A1. La curva normale (o di Gauss)

Documenti analoghi
LA DISTRIBUZIONE NORMALE (Vittorio Colagrande)

STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA

DISTRIBUZIONE NORMALE (1)

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

Esercitazione: La distribuzione NORMALE

Teoria e tecniche dei test. Concetti di base


le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Variabile casuale Normale

LE MISURE DI TENDENZA CENTRALE. Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva

LA DISTRIBUZIONE NORMALE

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

V.C. RETTANGOLARE o UNIFORME

Istituzioni di Statistica e Statistica Economica

TEORIA DEGLI ERRORI DI MISURA, IL CALCOLO DELLE INCERTEZZE

Esercitazione n. 3 - Corso di STATISTICA - Università della Basilicata - a.a. 2011/12 Prof. Roberta Siciliano

Scanned by CamScanner

INDICATORI DI TENDENZA CENTRALE

INDICATORI DI TENDENZA CENTRALE

Lezione 4 a - Misure di dispersione o di variabilità

MISURE DI SINTESI 54

Esercitazioni di Statistica

ISTOGRAMMI E DISTRIBUZIONI:

1/55. Statistica descrittiva

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

Questionario 1. Sono assegnati i seguenti dati

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali

DISTRIBUZIONI DI PROBABILITA

Variabile Casuale Normale

La distribuzione delle frequenze. T 10 (s)

REGRESSIONE E CORRELAZIONE

Statistica. Alfonso Iodice D Enza

Analisi degli Errori di Misura. 08/04/2009 G.Sirri

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

STATISTICA: esercizi svolti sulla DISTRIBUZIONE NORMALE

STATISTICA DESCRITTIVA (variabili quantitative)

PROVA SCRITTA DI STATISTICA. cod CLEA-CLAPI-CLEFIN-CLELI cod CLEA-CLAPI-CLEFIN-CLEMIT. 5 Novembre 2003 SOLUZIONI MOD.

Capitolo 6 La distribuzione normale

Capitolo 3 Sintesi e descrizione dei dati quantitativi

UNIVERSITÀ DEGLI STUDI DI ROMA LA SAPIENZA

Geometria analitica di base. Equazioni di primo grado nel piano cartesiano Funzioni quadratiche Funzioni a tratti Funzioni di proporzionalità inversa

Intervalli di confidenza

2. Variabilità mediante il confronto di valori caratteristici della

Esercitazioni di statistica

Lezione VI: Distribuzione normale. La distribuzione normale (curva di Gauss). Prof. Enzo Ballone. Lezione 6a- Ia distribuzione normale

Casa dello Studente. Casa dello Studente

Geometria analitica di base (seconda parte)

Capitolo 6. La distribuzione normale

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

UNITÀ DIDATTICA 2 LE FUNZIONI

STATISTICHE DESCRITTIVE Parte II

FENOMENI CASUALI. fenomeni casuali

La Variabilità statistica

Distribuzione Normale

Variabili aleatorie Parte I

Università di Cassino Corso di Laurea in Scienze Motorie Biostatistica Anno accademico 2011/2012

La SCALA di Probabilità varia tra 0.00 e 1.00.

ES.2.3. è pari ad 1. Una variabile aleatoria X che assume valori su tutta la retta si dice distribuita

Statistica descrittiva II

Valori Medi. Docente Dott.ssa Domenica Matranga

Statistica di base per l analisi socio-economica

Statistica Un Esempio

Statistica. Lezione 4

Indice della lezione. Incertezza e rischio: sinonimi? Le Ipotesi della Capital Market Theory UNIVERSITA DEGLI STUDI DI PARMA FACOLTA DI ECONOMIA

CORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Elaborazione dei dati Valori medi

Indici di variabilità ed eterogeneità

1 4 Esempio 2. Si determini la distribuzione di probabilità della variabile casuale X = punteggio ottenuto lanciando un dado. Si ha immediatamente:

Esercitazione 8 maggio 2014

SISTEMI LINEARI: APPROFONDIMENTI ED ESEMPI

Statistica4-29/09/2015

Andrea Bonanomi Università Cattolica del Sacro Cuore. Principi di Statistica Descrittiva. Milano, 9 gennaio 2015 Camera di Commercio

UNITÀ DIDATTICA 5 LA RETTA

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Statistica Sociale - modulo A

Teoria e tecniche dei test

Sintesi numerica di distribuzioni statistiche

Università degli Studi di Verona

Prontuario degli argomenti di Algebra

DISTRIBUZIONI DI PROBABILITA

Statistica Inferenziale

LEZIONI DI STATISTICA MEDICA

Esame di maturità scientifica, corso di ordinamento a. s

Sezione Prima Derivate di funzioni elementari: quadro riassuntivo e regole di derivazione. = ( n) lim x

STATISTICA ESERCITAZIONE

Statistica. Alfonso Iodice D Enza

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

Esercitazioni di statistica

Lezione 4. Statistica. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Lezione 4. A. Iodice. Indici di posizione.

SCOPO DELL ANALISI DI CORRELAZIONE

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

a) Determinare il dominio, i limiti agli estremi del dominio e gli eventuali asintoti di f. Determinare inoltre gli zeri di f e studiarne il segno.

Elementi di Statistica

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione

Transcript:

Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 202/203 lezione n. 8 dell aprile 203 - di Massimo Cristallo - A. La curva normale (o di Gauss) La curva normale (o di Gauss) è la distribuzione continua maggiormente utilizzata in Statistica. Solitamente viene indicata con il simbolo: X ~N( µ, ). In pratica, misurando più volte una stessa grandezza è ovvio che ci saranno degli errori di osservazione, la cui distribuzione è ottenuta dall espressione algebrica (dimostrata da Gauss) di seguito riportata: ( x µ ) 2 N 2 2 y = e 2π I parametri della curva normale sono la numerosità del collettivo, la media aritmetica e lo scaro quadratico medio: N, µ e. La curva di Gauss presenta, inoltre, le seguenti caratteristiche: - ha una forma campanulare; - è asintotica (presenta due rami asintotici all asse delle ascisse); - è simmetrica intorno alla media aritmetica; - in corrispondenza dell ascissa x = µ l ordinata assume il suo massimo valore; - in corrispondenza dei punti di ascissa µ e µ + ha i punti di flesso; - N indica l area compresa tra la curva normale e l asse delle ascisse; - al variare di µ la curva subisce traslazioni verso sinistra o destra, a seconda che µ diminuisce o aumenta; - al variare di la curva diventa più schiacciata o aguzza, a seconda che aumenta o diminuisce. In definitiva, le curve normali, pur assumendo diversi aspetti al variare dei 3 parametri, mantengono sempre la forma a campana. E possibile ricondurre le infinite curve normali ad un unica curva normale (detta standardizzata), ponendo: x µ z = cioè, cambiando le unità di misura della variabile in unità di deviazioni standard dalla media. Considerando, poi, le frequenze relative (cioè dividendo per il totale dei casi esaminati N) e tenendo conto della precedente assunzione, si ricava la seguente espressione algebrica della curva normale standardizzata: z2 2 y = e 2π ove ciascuno dei tre parametri assume sempre lo stesso valore: N = (area totale); µ = 0; =. La curva normale standardizzata è ovviamente simmetrica intorno allo zero.

Essendo i parametri costanti e z l unica variabile (indipendente), è possibile far ricorso alle tabulazioni presenti in letteratura, che forniscono direttamente l area interessata al di sotto della curva normale, senza ricorrere al calcolo degli integrali definiti. Si può verificare che per ogni distribuzione normale con media µ e deviazione standard, risulta: a. l intervallo [ µ, µ ] b. l intervallo [ µ 2, µ 2 ] c. l intervallo [ µ 3, µ 3 ] + comprende sempre il 68,3% delle osservazioni; + comprende sempre il 95,% delle osservazioni; + comprende sempre il 99,7% delle osservazioni. Si noti che gli intervalli precedenti sono tutti simmetrici intorno alla media aritmetica. Esempio Se l altezza di un gruppo di 00.000 persone si distribuisce secondo una curva normale X ~N(80,5), si può affermare che: 75,85 a. il 68,3% degli individui in esame ha un altezza contenuta nell intervallo [ ] b. il 95,% degli individui in esame ha un altezza contenuta nell intervallo [ 70,90 ] c. il 99,7% degli individui in esame ha un altezza contenuta nell intervallo [ 65,95 ]. In altri casi, occorre prima calcolare i valori di z corrispondenti all ascissa x, sottraendo la media aritmetica e dividendo il risultato ottenuto per la deviazione standard, e poi utilizzare la tavola della curva normale standardizzata. Se risulta, ad esempio, X ~N(0,), considerando l ascissa x=8 si ha: 8 0 z = = 0,5 Si deve, quindi, rintracciare sull apposita tavola il valore 0,5, trattandosi come è noto di una curva simmetrica intorno allo zero, e poi procedere a seconda del tipo di problema da risolvere. Se invece x è pari a 5, poiché risulta: 5 0 z = =,25 il valore da cercare all interno della tavola è proprio,25, in corrispondenza del quale compare il valore 0,0565, il quale sta a significare che la percentuale dei casi in cui x è maggiore di 5 risulta pari a circa il 0,56%. E possibile risolvere, sempre con l uso della apposita tavola, tipologie diverse di applicazioni. Allegato: tavola area della curva normale standardizzata, consegnata durante la lezione. A2. Indici di asimmetria e di curtosi La simmetria statistica indica l assenza di specularità di una distribuzione rispetto al suo asse di simmetria. Disponendo di N osservazioni di un certo carattere quantitativo, si dice che queste sono simmetriche rispetto ad un centro (valore medio) se le intensità ordinate x e x sono equidistanti ( i ) ( N i + ) dal centro µ. La relazione di simmetria comporta che il primo e l ultimo termine ordinato hanno uguale distanza dal centro di simmetria. Nell ipotesi di simmetria, il centro coincide con la Mediana, con la Media aritmetica e la Moda della distribuzione. 2

Si pone allora il problema di misurare l asimmetria. A tal fine, la costruzione dei corrispondenti indici deve essere tale da poter misurare di quanto la situazione rilevata si discosti da quella di simmetria, per cui tali indici devono presentare le seguenti caratteristiche:. devono assumere valore zero se e solo se esiste simmetria; 2. devono avere valore assoluto tanto più grande quanto più la situazione rilevata si discosta dalla situazione di simmetria; 3. devono assumere valore positivo o negativo, a seconda che la Mediana (Me) sia minore o maggiore della Media aritmetica µ. Si riportano di seguito una serie di indici di asimmetria, sia assoluti che relativi. INDICI ASSOLUTI DI ASIMMETRIA α = µ Me α = µ Mo 2 Il primo indice misura la distanza della media aritmetica rispetto alla Mediana, mentre il secondo misura la distanza della media aritmetica rispetto alla Moda. Entrambi gli indici assumono valori nulli, positivi o negativi, a seconda che la distribuzione presenti, rispettivamente, simmetria, asimmetria positiva o negativa. Altra misura assoluta di asimmetria è: α = Q Q Q Q ( ) ( ) 3 3 2 2 ove Q e Q 3 indicano il primo ed il terzo quartile, mentre Q2 coincide con la mediana. INDICI RELATIVI DI ASIMMETRIA In considerazione dei difetti che presentano in generale le misure assolute, si ricorre al seguente indice di asimmetria di Pearson: µ Mo αp = (è un numero puro) che presenta, però, i seguenti difetti:. non è adatto per distribuzioni plurimodali (cioè con più valori modali); 2. non varia tra limiti definiti; 3. contiene la moda, che non è facilmente calcolabile quando i casi osservati sono limitati. Per distribuzioni moderatamente asimmetriche si utilizza pertanto il seguente indice: ( µ ) 3 Me α = (numero puro, varia tra 3 e 3) Un secondo indice di asimmetria proposto da Fisher, molto più usato del precedente, è il coefficiente di asimmetria: λ 3 N xi µ = i = N numero puro OSSERVAZIONE Se esiste PERFETTA SIMMETRIA, allora gli indici precedenti sono nulli. Non vale, però, il contrario. 3

Un altro aspetto che interessa considerare è quello della curtosi. Essa si riferisce alla maggiore o minore sporgenza di una curva in prossimità del suo massimo e alla maggiore o minore lunghezza delle code. La valutazione di questo aspetto di forma della curva si effettua attraverso il confronto con la curva normale. INDICI DI CURTOSI Pearson ha proposto il seguente indice: β N xi µ 2 = i = N numero puro che assume valore 3 per una curva normale, valore maggiore di 3 per una distribuzione leptocurtica (o ipernormale, cioè più appuntita della curva normale), minore di 3 per una distribuzione platicurtica (o iponormale, cioè più piatta della curva normale). Fisher ha proposto invece l indice: λ2 = β2 3 numero puro che assume valore 0 per una curva normale, valore maggiore di 0 per una distribuzione leptocurtica, minore di 0 per una distribuzione platicurtica. Il coefficiente di asimmetria di Fisher e gli indici di curtosi riportati nel presente paragrafo sono riferiti al caso di serie di dati. Per distribuzioni di distribuzioni di frequenze, è necessario procedere con le relative ponderazioni. --------------------------------------------------------------------------------------------------------- B) Curva normale, asimmetria e curtosi - Applicazioni ) Supponendo che il diametro di una serie di un lotto di sferette di acciaio sia normale, con media 8.000 micron e scarto quadratico medio 50 micron, si determini la frequenza di sferette prodotte che hanno un diametro compreso tra 7.930 e 8.080 micron. Fonte: G. Girone e T. Salvemini, Lezioni di statistica, Cacucci Editore, Bari, 2007 Si proceda all operazione di standardizzazione degli estremi dell intervallo richiesto, cioè dei valori 7.930 e 8.080, e poi si faccia ricorso alla tavola dell area della curva normale standardizzata. Per ciascuno dei valori standardizzati trovati si trovi l area corrispondente nell apposita tavola (attenzione: essendo la curva normale standardizzata simmetrica intorno allo zero, il valore di z negativo deve essere letto come se fosse positivo). Si sommino, infine, le due aree rintracciate. 2) Si vuole calcolare la frazione dei ventenni italiani, sottoposti alla visita di leva, di statura inferiore a 60 cm nell ipotesi che la statura si distribuisca normalmente con media 72 cm e scarto quadratico medio 6 cm. Fonte: G. Girone e T. Salvemini, Lezioni di statistica, Cacucci Editore, Bari, 2007 Si proceda all operazione di standardizzazione del valore 60 e poi si faccia ricorso alla tavola dell area della curva normale standardizzata, individuando la relativa area in corrispondenza del valore di z (cambiato di segno), essendo z negativo nel caso in questione. Si calcoli l area della coda sinistra della curva normale standardizzata, che coincide con quella della coda destra,

sottraendo al valore 0,5 il valore dell area rintracciata nella tavola, poiché quest ultima fornisce il valore dell area nell intervallo [0,z]. 3) Ritenendo che la distribuzione degli investimenti di un gruppo di aziende omogenee sia normale con media pari a 200 milioni e scarto quadratico medio (s.q.m.) pari a 50 milioni, si determini in quale intervallo simmetrico intorno alla media aritmetica è compreso l 80% delle aziende. Fonte: G. Girone e T. Salvemini, Lezioni di statistica, Cacucci Editore, Bari, 2007 Si rintracci all interno della tavola dell area della curva normale standardizzata il valore di z più vicino a 0,0 (cioè a 0,80/2, essendo la curva normale perfettamente simmetrica). Infine, al valore medio si sottragga (per ottenere l estremo inferiore) e si aggiunga (per ottenere l estremo superiore) il risultato del prodotto di z con s.q.m. ) Il peso netto delle scatole di un certo prodotto è rappresentabile mediante una distribuzione normale con media uguale a 95 grammi. Sapendo che il 3% delle scatole viene scartato perché ha un peso inferiore a 80 grammi, si determini lo scarto quadratico medio della distribuzione. Fonte: A. Cerioli e M. A. Milioli, Esercizi di Statistica, parte II, UNI.NOVA, Parma, 2006 Si rintracci all interno della tavola dell area della curva normale standardizzata il valore di z più vicino a 0,7 (cioè a [0,50-0,03], essendo la curva normale perfettamente simmetrica). Poiché siamo collocati nella coda sinistra della curva normale, si consideri con il segno negativo il valore di z così trovato e si risolva l equazione: x µ z = la cui unica incognita è rappresentata dallo scarto quadratico medio. 5) Il diametro delle arance di una certa varietà è distribuito secondo una curva normale con media pari a 7,5 cm e varianza,. I. Si determini la percentuale di arance scartate in quanto il loro diametro è inferiore a 6 cm; II. Sapendo che il 20% delle arance più grosse viene venduto con la denominazione extra, si determini il diametro minimo che consente di attribuire tale qualifica. Fonte: A. Cerioli e M. A. Milioli, Esercizi di Statistica, parte II, UNI.NOVA, Parma, 2006 Per il punto I, si proceda all operazione di standardizzazione del valore 6 e poi si faccia ricorso alla tavola dell area della curva normale standardizzata, individuando la relativa area in corrispondenza del valore di z (cambiato di segno), essendo z negativo nel caso in questione; si calcoli l area della coda sinistra della curva normale standardizzata, che coincide con quella della coda destra, sottraendo al valore 0,5 il valore dell area rintracciata nella tavola, poiché quest ultima fornisce il valore dell area nell intervallo [0,z]. Per il punto II, si rintracci all interno della tavola dell area della curva normale standardizzata il valore di z più vicino a 0,30 (cioè a [0,50-0,20]), poiché siamo collocati nella coda destra (arance più grosse) della curva normale. Si risolva l equazione: x µ z = ove il segno di z è positivo e la cui unica incognita è rappresentata dal valore x (si faccia attenzione che lo s.q.m. non è noto ma si ottiene estraendo la radice quadrata della varianza). 5

6) Si valuti l asimmetria e la curtosi del numero di riviste mensili (X) venduti in una certa circoscrizione territoriale, avendo rilevato i seguenti dati: Mesi n riviste Gennaio Febbraio 7 Marzo 9 Aprile 0 Maggio 0 Giugno 5 Luglio 27 Agosto 32 Settembre 2 Ottobre Novembre Dicembre 8 Si utilizzino gli indici proposti da Fisher (nel caso di serie di dati) e si fornisca un interpretazione dei risultati ottenuti. Suggerimento. Dopo aver calcolato la media aritmetica semplice e lo scarto quadratico medio, si creino ulteriori colonne, costituiti dagli scarti di ciascuna osservazione dalla media aritmetica, elevati alla potenza 3 (per l asimmetria) e alla potenza (per la curtosi), e si rapportino i totali di colonna al prodotto di N per lo scarto quadratico medio al cubo (per l asimmetria) e alla quarta (per la curtosi). 6