Statistica. Antonio Azzollini

Documenti analoghi
Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

Rappresentazione dei dati

Le misure numeriche. La media aritmetica

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Scale di Misurazione Lezione 2

Modelli descrittivi, statistica e simulazione

La variabilità. Monia Ranalli. Ranalli M. Variabilità Settimana # 2 1 / 14

Teoria e tecniche dei test. Concetti di base

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica. a.a. 2015/2016

Indici di variabilità

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

Misure di dispersione (o di variabilità)

tabelle grafici misure di

Nozioni di statistica

Statistica Sociale - modulo A

STATISTICA DESCRITTIVA (variabili quantitative)

Media: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche.

Capitolo 3 Sintesi e descrizione dei dati quantitativi

Statistica di base per l analisi socio-economica

Statistica descrittiva

Statistica Compito A

Andrea Bonanomi Università Cattolica del Sacro Cuore. Principi di Statistica Descrittiva. Milano, 9 gennaio 2015 Camera di Commercio

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

Matematica Lezione 22

LA RAPPRESENTAZIONE E LA SINTESI DEI DATI

Prova scritta di Statistica

Statistica descrittiva II

STIME STATISTICHE. Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali. p. 2/2

La Variabilità statistica

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

Esercitazioni di statistica

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

MISURE DI SINTESI 54

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Statistica. Matematica con Elementi di Statistica a.a. 2017/18

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Seconda Lezione. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010 DISTRIBUZIONE DI FREQUENZA

Indici di. tendenza centrale: posizione: variabilità e dispersione: -quantili -decili -percentili. -Media -Moda -Mediana

Studio di osservazione, perché non viene imposto nessun trattamento alle unità campionarie

Variabilità e Concentrazione Esercitazione n 02

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Metodi Matematici e Informatici per la biologia. Esercizi

Distribuzione di Frequenza: Esempio

Statistica Un Esempio

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

ELEMENTI DI STATISTICA DESCRITTIVA

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

Dispersione. si cercano indici di dispersione che:

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

STATISTICHE DESCRITTIVE Parte II

Esercizi. Esercizio 1. Date le funzioni f(x) = x 2 3x + 2 e g(x) = 2x 1,

7. STATISTICA DESCRITTIVA

Indici di Dispersione

Elementi di Statistica

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

STATISTICA 1 ESERCITAZIONE 6

Le medie. Antonello Maruotti

Elementi di Economia e Statistica prof.ssa Valentina Raimondi. dott. Federico Andreis (Statistica)

1/55. Statistica descrittiva

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

Metodi Matematici ed Informatici per la Biologia Esame Finale, II appello 2 Luglio Matricola: Codice

Esercitazioni di statistica

ESERCIZI DI RIEPILOGO 1

Variabilità. ..senza variabilità non ci sarebbe la statistica

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Esame di Statistica A-Di Prof. M. Romanazzi

Medie. Monia Ranalli. Ranalli M. Medie Settimana # 2 1 / 22

VOTI ESERCIZIO 1. In Tabella 1 è mostrato l insieme dei 31 voti del primo appello dell esame scritto di cinese.

ESERCIZI DI STATISTICA SOCIALE

Esercitazioni di Statistica

Settimana 2. G. M. Marchetti. 4 Marzo 2017

p. 1/2 STIME STATISTICHE Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali.

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

2. Variabilità mediante il confronto di valori caratteristici della

ESERCIZI DI RIEPILOGO 1

Metodologie statistiche per l analisi del rischio ELEMENTI DI STATISTICA DESCRITTIVA PER L ANALISI DEL RISCHIO

Università di Cassino Corso di Laurea in Scienze Motorie Biostatistica Anno accademico 2011/2012

Statistica Inferenziale

Daniela Tondini

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini Anno accademico 2016/2017

Esercitazione 1.3. Indici di variabilità ed eterogeneità. Prof.ssa T. Laureti a.a

Corso di Laurea triennale Tecniche della Prevenzione PERCORSO STRAORDINARIO 2007/08. Insegnamento di STATISTICA MEDICA. Modulo II

Metodologie statistiche per l analisi del rischio ELEMENTI DI STATISTICA DESCRITTIVA PER L ANALISI DEL RISCHIO

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

II ESERCITAZIONE ESERCIZIO

Laboratorio di Statistica 1 con R Esercizi per la Relazione. I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i

STATISTICHE DESCRITTIVE

Statistica Elementare

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio

Transcript:

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica Antonio Azzollini antonio.azzollini@unibas.it Anno accademico 2018/2019

Quartili e distribuzioni di frequenze Stanze Appartamenti Frequenze cumulate 1 300 300 2 500 800 3 2.000 2.800 4 3.000 5.800 5 150 5.950 6 100 6.050 7 300 6.350 Per calcolare : A. Rango: B. Pertanto si colloca fra x ( 1587) e x ( 1588) C. Q1 Q1 ( 6350 +1) 0,25 = 1587,75 x ( 1587) = x ( 1588) = 3 = Q1 7 6 5 4 3 2 1 Stanze Per calcolare : A. Rango: B. Pertanto si colloca fra x ( 4763) e x ( 4764) C. Q3 ( 6350 +1) 0,75 = 4763,25 Q3 x ( 4763) = x ( 4764) = 4 = Q3

Quartili e distribuzioni di frequenze Per calcolare : A. Rango: Q1 ( 28 +1) 0,25 = 7,25 Modalità Frequenza Frequenza cumulata 1 1 1 2 2 3 3 3 6 4 4 10 5 5 15 6 6 21 7 7 28 M = 5 B. Pertanto si colloca fra x ( 7) e x ( 8) C. Q1 x ( 7) = x ( 8) = 4 = Q1 Per calcolare : A. Rango: B. Pertanto si colloca fra e C. x 21 Q3 Q3 ( ) x ( 22) ( 28 +1) 0,75 = 21,75 x ( 21) = 6, x ( 22) = 7 Q3 = 6 + ( 7 6) 0,75 0. 5 = 6,575

Quartili e distribuzioni di frequenze Q1 Per calcolare : Modalità Frequenza Frequenza cumulata 1 7 7 2 6 13 3 5 18 4 4 22 5 3 25 6 2 27 7 1 28 M = 3 A. Rango: B. Pertanto si colloca fra e C. x 7 ( 28 +1) 0,25 = 7,25 Q1 ( ) = 1 x ( 8) = 2 Per calcolare : A. Rango: B. Pertanto si colloca fra x ( 21) e x ( 22) C. ( ) Q1 = 1+ 2 1 Q3 ( 28 +1) 0,75 = 21,75 Q3 x ( 21) = x ( 22) = 4 = Q3 0,25 =1,25

Box-plot & simmetria Asimmetria: A = ( max M ) ( M min) 7 Per il box-plot rosso A = ( 7 5) 5 1 asimmetria negativa ( ) = 2 6 5 4 Per il box-plot blu A = ( 7 3) 3 1 asimmetria positiva ( ) = 2 3 2 1 Da 1 a 7 Da 7 a 1

Percentili Dopo una visita di controllo ad un bambino, il medico farà uso di un grafico come questo: Quindi,dopo aver constatato che il soggetto in questione è al 95-esimo percentile, si preoccuperà un po. Cosa significa percentile? Il percentile x è quel valore (non necessariamente appartenente al campione) che lascia a sinistra l x% dei dati. E allora dire che un bambino ha un peso al 95-esimo percentile vuol dire che il 95% della popolazione maschile di quell età ha un peso inferiore.

Percentili Riprendiamo l esempio della scuola 10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7; 16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3; 20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8. p = 90 : ( 30 +1) 0,90 = 27,9 Il 90-esimo percentile si colloca fra gli elementi di posizione 27 & 28, ossia fra 26,1 & 27,1: 26,1+ ( 27,1 26,1) 0,9 = 27 Conclusione: il 90% degli intervistati dedica allo studio non più di 27 ore. E se volessimo l informazione inversa

Percentili 1 0,9 0,75 0,5 0,25 0 27 13 15 17 18 20 23 27 Qual è la percentuale di studenti che non studia più di 27 ore? Numero studenti che studiano non più di 27 ore = 27. Taglia = 30 Calcolo la percentuale: p = 27 30 = 0,90

Percentili In sintesi: 27 è il 90 percentile del campione casuale perchè la percentuale di studenti del campione che studia 27 ore o meno è il 90%.

Mediana per classi di modalità Se non si conoscono i valori del campione ma solamente un riassunto in forma tabellare delle classi di frequenza... [10;14) [14;18) [18;22) [22;26) [26;30) [30;34] 5 9 9 3 3 1 Estremi classi Frequenze cumulate 10 0 14 5 18 14=5+9 22 23=14+9 26 26 30 29 34 30 } In 18 la frequenza cumulata è 14 < 30 2 = 15, mentre in 22 la frequenza cumulata è 23 > 30 2 = 15 23 14 30 25 20 15 10 5, 0 Pertanto la classe [18;22) contiene la mediana. 10 20 30 40 18? 22

Mediana per classi di modalità Se non si conoscono i valori del campione ma solamente un riassunto in forma tabellare delle classi di frequenza... Estremi classi Frequenze relative cumulate 10 0 14 0,17 18 0,47 22 0,77 26 0,87 30 0,97 [10;14) [14;18) [18;22) [22;26) [26;30) [30;34] 5 9 9 3 3 1 } Fra gli estremi 18 e 22 si passa da un valore inferiore a 0,50 ad uno superiore a 0,50. Risolvere: 34 1 Siccome non so come aumenta la frequenza all'interno della classe [18,22), assumo che l'incremento sia lineare (cioè quello della retta congiungente i punti P e Q) 1,0 0,8 0,7 0,5 0,4 0,2 0,1 P Q 10 20 30 40 Mediana y = 0,50

Mediana per classi di modalità Se non si conoscono i valori del campione ma solamente un riassunto in forma tabellare delle classi di frequenza... Estremi classi Frequenze relative cumulate 10 0 14 0,17 18 0,47 22 0,77 26 0,87 30 0,97 34 1 x = 18 + } 0,50 0,47 0,77 0,47 La mediana varrà x [10;14) [14;18) [18;22) [22;26) [26;30) [30;34] 5 9 9 3 3 1 Traccio una linea orizzontale in corrispondenza della frequenza 0,50 ed individuo l'intersezione. Risolviamo: y 0,47 0,77 0,47 = x 18 22 18 y = 0,50 ( 22 18) = 18,4 1,0 0,8 0,7 0,5 0,4 0,2 0,1-0,1 P Q Mediana y = 0,50 0 10 20 30 40

Quartili per classi di modalità Per calcolare i quartili Q1 e Q3 è possibile considerare di nuovo la tabella delle frequenze cumulate relative. Estremi classi Frequenze relative cumulate 10 0 14 0,17 18 0,47 } Per Q1: la frequenza cumulata relativa passa da un valore inferiore a 0,25 (ossia 0,17 in 14) ad un valore superiore a 0,25 (ossia 0,47 in 18). A. la classe di riferimento per B. Q1 = 14 + 0,25 0,17 0,47 0,17 Q1 è [14;18) ( 18 14) = 15,08.

Quartili per classi di modalità Per calcolare i quartili Q1 e Q3 è possibile considerare di nuovo la tabella delle frequenze cumulate relative. Estremi classi Frequenze relative cumulate 18 0,47 22 0,77 26 0,87 30 0,97 34 1 } PerQ3: la frequenza cumulata relativa passa da un valore inferiore a 0,87 (ossia 0,47 in 18) ad un valore superiore a 0,75 (ossia 0,77 in 22). A. la classe di riferimento per B. Q3 = 18 + 0,75 0,47 0,77 0,47 Q3 è [18;22) ( 22 18) = 21,72.

Box-plot di distribuzioni in classi Per costruire il box-plot della distribuzione in classi riportiamo come al solito i quartili per costruire la scatola ed all'interno disegnamo la linea della mediana. I baffi li disegniamo in relazione al minimo della prima classe ed al massimo dell'ultima classe. Box-plot dataset esatto Box-plot dataset per classi di modalità 30 30 25 25 20 15 10 20 15 10

Indici di dispersione Si dicono indici di dispersione (o indici di variabilità) quei parametri che misurano la variabilità del campione casuale. Fra di essi riconosciamo: 1. Campo di variazione: 2. Intervallo interquartile: CVar = max min IQR = Q3 Q1

Indici di dispersione Si dicono indici di dispersione (o indici di variabilità) quei parametri che misurano la variabilità del campione casuale. Fra di essi riconosciamo: 1. Campo di variazione: 2. Intervallo interquartile: CVar = max min IQR = Q3 Q1 Chiamiamo varianza (campionaria) il valore s 2 calcolato attraverso la formula s 2 = 1 n 1 ( x 1 X ( m) 2 +!+ ( x n ) 2 = 1 X X (x i ) X 2 ) 2 + x 2 n 1 n i=1 dove X è la media aritmetica del campione casuale. Un ulteriore indice di dispersione che introduciamo è

Indici di dispersione Si dicono indici di dispersione (o indici di variabilità) quei parametri che misurano la variabilità del campione casuale. Fra di essi riconosciamo: 1. Campo di variazione: 2. Intervallo interquartile: CVar = max min IQR = Q3 Q1 Chiamiamo varianza (campionaria) il valore s 2 calcolato attraverso la formula s 2 = 1 n 1 ( x 1 X ( m) 2 +!+ ( x n ) 2 = 1 X X (x i ) X 2 ) 2 + x 2 n 1 n i=1 dove X è la media aritmetica del campione casuale. Un ulteriore indice di dispersione che introduciamo è 3. Deviazione standard (campionaria): s = s 2 va s

Indici di dispersione Esempio 10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7; 16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3; 20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8. La media campionaria è X =19,01 10,3 12,9 13,5 13,7 19,01 19,7 20,3 20,7 20,8 21,4 La varianza vale s 2 = 1 29 10,3 19,01 ( ) 2 + 2( 12,9 19,01) 2 + ( 13,5 19,01) 2 +!+ ( 33,8 19,01) 2 = 28,7

Indici di dispersione Esempio 10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7; 16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3; 20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8. La media campionaria è X =19,01 10,3 12,9 13,5 13,7 19,01 19,7 20,3 20,7 20,8 21,4 La varianza vale s 2 = 1 29 10,3 19,01 ( ) 2 + 2( 12,9 19,01) 2 + ( 13,5 19,01) 2 +!+ ( 33,8 19,01) 2 = 28,7 La deviazione standard è la radice quadrata della varianza s = 28,7 = 5,36.

Indici di dispersione Esempio 10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7; 16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3; 20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8. La media campionaria è X =19,01 10,3 12,9 13,5 13,7 19,01 19,7 20,3 20,7 20,8 21,4 La varianza vale s 2 = 1 29 10,3 19,01 ( ) 2 + 2( 12,9 19,01) 2 + ( 13,5 19,01) 2 +!+ ( 33,8 19,01) 2 = 28,7 La deviazione standard è la radice quadrata della varianza s = 28,7 = 5,36 La deviazione standard fornisce una misura della concentrazione dei dati intorno alla media..

Indici di dispersione La deviazione standard non è una statistica robusta { 1,2,3,4,5 } { 1,2, 3, 4,15} { 1,2, 3, 4,100} CVar = 4 IQR = 43,. 2 IQR = 82. IQR = 5,0,5 2. s = 1,58 CVar = 14 s = 5,07 CVar = 99. s = 43,62

Indici di dispersione La deviazione standard non è una statistica robusta { 1,2,3,4,5 } { 1,2, 3, 4,15} { 1,2, 3, 4,100} CVar = 4 IQR = 43,. 2 IQR = 82. IQR = 5,0,5 2. s = 1,58 CVar = 14 s = 5,07 CVar = 99 s = 43,62 Per variabili quantitative: ordinate in scale sia intervallari che proporzionali. Per il suo calcolo vengono utilizzati tutti i dati. Un insieme di dati ha una sola deviazione standard. Vale zero quando tutti i dati assumono lo stasso valore (variabile statistica degenere). [Esempio: È invariante per traslazione. Ossia, se ad ogni dato viene aggiunta una quantità costante allora la deviazione standard non cambia..

Indici di dispersione La deviazione standard non è una statistica robusta { 1,2,3,4,5 } { 1,2, 3, 4,15} { 1,2, 3, 4,100} CVar = 4 IQR = 43,. 2 IQR = 82. IQR = 5,0,5 2. s = 1,58 Per variabili quantitative: ordinate in scale sia intervallari che proporzionali. Per il suo calcolo vengono utilizzati tutti i dati. Un insieme di dati ha una sola deviazione standard. Vale zero quando tutti i dati assumono lo stasso valore (variabile statistica degenere). [Esempio: CVar = 14 s = 5,07 CVar = 99 s = 43,62 È invariante per traslazione. Ossia, se ad ogni dato viene aggiunta una quantità costante allora la deviazione standard non cambia..

Indici di dispersione La deviazione standard non è una statistica robusta { 1,2,3,4,5 } { 1,2, 3, 4,15} { 1,2, 3, 4,100} CVar = 4 IQR = 43,. 2 IQR = 82. IQR = 5,0,5 2. s = 1,58 Per variabili quantitative: ordinate in scale sia intervallari che proporzionali. Per il suo calcolo vengono utilizzati tutti i dati. Un insieme di dati ha una sola deviazione standard. Vale zero quando tutti i dati assumono lo stasso valore (variabile statistica degenere). [Esempio: CVar = 14 s = 5,07 CVar = 99 s = 43,62 È invariante per traslazione. Ossia, se ad ogni dato viene aggiunta una quantità costante allora la deviazione standard non cambia..

Indici di dispersione La deviazione standard non è una statistica robusta { 1,2,3,4,5 } { 1,2, 3, 4,15} { 1,2, 3, 4,100} CVar = 4 IQR = 43,. 2 IQR = 82. IQR = 5,0,5 2. s = 1,58 CVar = 14 s = 5,07 Per variabili quantitative: ordinate in scale sia intervallari che proporzionali. Per il suo calcolo vengono utilizzati tutti i dati. CVar = 99 s = 43,62 Un insieme di dati ha una sola deviazione standard. Vale zero quando tutti i dati assumono lo stasso valore (variabile statistica degenere). [Esempio: { 2,2,2},.X µ = 2, s = 0]. È invariante per traslazione. Ossia, se ad ogni dato viene aggiunta una quantità costante allora la deviazione standard non cambia..

Indici di dispersione La deviazione standard non è una statistica robusta { 1,2,3,4,5 } { 1,2, 3, 4,15} { 1,2, 3, 4,100} CVar = 4 IQR = 43,. 2 IQR = 82. IQR = 5,0,5 2. s = 1,58 CVar = 14 s = 5,07 CVar = 99. s = 43,62 { 2, 3, 4,5,101} CVar = 99 IQR = 5,0,5 2.. s = 43,62 Per variabili quantitative: ordinate in scale sia intervallari che proporzionali. Per il suo calcolo vengono utilizzati tutti i dati. Un insieme di dati ha una sola deviazione standard. Vale zero quando tutti i dati assumono lo stasso valore (variabile statistica degenere). [Esempio: { 2,2,2},.X µ = 2, s = 0]. È invariante per traslazione. Ossia, se ad ogni dato viene aggiunta una quantità costante allora la deviazione standard non cambia.

Concentrazione dei valori Assumendo in un campione casuale di taglia n la media aritmetica X come indice centrale, considerando la deviazione standard come indice di dispersione dei dati, ci si pone la questione di stabilire a priori una stima della percentuale di dati che si "concentrano" in prossimità di X.

Concentrazione dei valori Assumendo in un campione casuale di taglia n la media aritmetica X come indice centrale, considerando la deviazione standard come indice di dispersione dei dati, ci si pone la questione di stabilire a priori una stima della percentuale di dati che si "concentrano" in prossimità di X. Più precisamente: che percentuale di dati si trova nell'intervallo [ X - s, X+ s]? Che percentuale nell'intervallo [ X - 2s, X + 2s]? E nell'intervallo? [ X - 3s, X + 3s]

La regola empirica vs la regola di Čebyšëv Quando la distribuzione dei dati non è caratterizzata da una forte asimmetria e le osservazioni sono concentrate in prossimità di media e mediana, vale la seguente regola empirica:

La regola empirica vs la regola di Čebyšëv Quando la distribuzione dei dati non è caratterizzata da una forte asimmetria e le osservazioni sono concentrate in prossimità di media e mediana, vale la seguente regola empirica: approssimativamente il 68% dei valori presenta uno scostamento dalla media pari ad 1 volta la deviazione standard; Approssimativamente il 95% dei valori presenta uno scostamento dalla media pari a 2 volte la deviazione standard. Approssimativamente il 99,7% dei valori presenta uno scostamento dalla media pari a 3 volte la deviazione standard.

La regola empirica vs la regola di Čebyšëv Quando la distribuzione dei dati non è caratterizzata da una forte asimmetria e le osservazioni sono concentrate in prossimità di media e mediana, vale la seguente regola empirica: approssimativamente il 68% dei valori presenta uno scostamento dalla media pari ad 1 volta la deviazione standard; approssimativamente il 95% dei valori presenta uno scostamento dalla media pari a 2 volte la deviazione standard; Approssimativamente il 99,7% dei valori presenta uno scostamento dalla media pari a 3 volte la deviazione standard.

La regola empirica vs la regola di Čebyšëv Quando la distribuzione dei dati non è caratterizzata da una forte asimmetria e le osservazioni sono concentrate in prossimità di media e mediana, vale la seguente regola empirica: approssimativamente il 68% dei valori presenta uno scostamento dalla media pari ad 1 volta la deviazione standard; approssimativamente il 95% dei valori presenta uno scostamento dalla media pari a 2 volte la deviazione standard; approssimativamente il 99,7% dei valori presenta uno scostamento dalla media pari a 3 volte la deviazione standard.