STATISTICA DESCRITTIVA (variabili quantitative)
|
|
|
- Agostina Palmieri
- 9 anni fa
- Просмотров:
Транскрипт
1 STATISTICA DESCRITTIVA (variabili quantitative) PRIMO ESEMPIO: Concentrazione di un elemento chimico in una roccia. File di lavoro di STATVIEW Cliccando sul tasto del pane control si ottiene il cosiddetto riassunto di statistica descrittiva:
2 Riassunto di statistica descrittiva Media x n xi n i = = --Variabili quantitative -- Vengono usati tutti i valori = n = n ( xi x) 0 La distanza dei valori dalla media è 0 i Non è una statistica robusta Una statistica è una caratteristica misurabile del campione Una statistica si dice ROBUSTA quando il suo valore numerico è stabile rispetto a perturbazioni (=errori) numeriche Qual è il significato statistico della media? 2
3 Riassunto di statistica descrittiva Varianza n 2 s = xi x n i= ( ) 2 -- Variabili quantitative -- Vengono usati tutti i valori E una statistica robusta Qual è il significato statistico della varianza? Deviazione standard n s = xi x n i= ( ) 2 Misura la dispersione della popolazione 3
4 Riassunto di statistica descrittiva Errore standard Misura la dispersione della media campionaria s e = n ossia è una misura della sua imprecisione 4
5 Riassunto di statistica descrittiva Coefficiente di variazione Il coefficiente di variazioneo deviazione standard relativapermette di confrontare misure di fenomeni riferite a unità di misure differenti in quanto si tratta di un numero puro (ovvero non riferito ad alcuna unità di misura). reddito in Lire è diverso dal reddito in euro I coefficienti di variazione sono uguali CV = s x = la media non è un indice corretto = 0 la media è un indice perfetto > 0.5 la media non è un indice corretto 0.5 la media è un indice perfetto 5
6 Riassunto di statistica descrittiva Range range = max min Regola empirica per determinare la dispersione di un campione: range >> s / 4 i dati appaiono concentrati range s / 4 la dispersione è "normale" range << s / 4 i dati appaiono dispersi COUNT: taglia del campione casuale SUM n i= x i MISSING CELL: dati mancanti SUM of squares n i= x 2 i 6
7 Indici di posizione: media.. Indici di dispersione: varianza range deviazione standard. MODA E il valore che appare maggiormente nel campione casuale. MEDIANA E quel valore che divide il campione casuale in due parti di peso 50%. 60,000 87,000 84,000 53,000 7,000 92,000 57,000 75,000 78,000 66,000 52,000 63,000 Ordinati in ordine crescente 52,000 53,000 57,000 60,000 63,000 66,000 7,000 75,000 78,000 84,000 87,000 92, = % 50% Ci sono anche altri metodi per determinare la mediana!! 7
8 Dal confronto tra media, moda e mediana si può intuire se la distribuzionedei dati del campione sull asse reale è simmetrica oppure no. ISTOGRAMMA. Si dividono i dati del campione in classi di modalità 2. Si conta il numero di dati del campione che ricadono in ciascuna classe.= frequenza assoluta. 3. Il totale deve restituire la taglia. 4. Si alzano delle barre rettangolari aventi per base le classi e per altezza le frequenze assolute Media = 68.7 Mediana = 64.5 Moda = 62 Moda < Mediana < Media Coda destra = asimmetria positiva 8
9 Asimmetria positiva Skewness positivo Simmetria Skewness nullo 9
10 Asimmetria negativa Skewness negativo Il confronto tra media e mediana non basta! Media = mediana = 5 Media = mediana = 3 Invece il coefficiente di asimmetria vale 2 e -2. 0
11 Media geometrica M g n = n i= x i Si applica in genere a tassi di crescita! Risente di meno della presenza di termini estremi. Ex: 0, 9,, 4, 97 Media: 28.2 Media geometrica: 6.8 Media armonica M i= Si applica in genere a dati nei quali si vuole dare importanza ai reciproci. I valori prossimi allo 0 sono più pesanti degli altri. Si usa in genere per le velocità. a = n n x i
12 0% Trimmed mean Si calcola come una media ordinaria, eliminando il 5% dei dati nelle due code della distribuzione. Nell esempio: 0.05*4 restituisce. Quindi 52,000 53,000 57,000 60,000 63,000 66,000 7,000 75,000 78,000 84,000 87,000 92,000 E un indice relativamente robusto rispetto agli outliers Kurtosis Indice di dispersione di confronto con la gaussiana standard. f ( x; µ, σ ) = exp σ 2π ( x µ ) 2 2 2σ 2
13 MAD=median absolute deviation MAD = mediana ( xi M ) dove M è la mediana del campione Statistica più robusta rispetto agli outliers della deviazione standard Ex: Per (,, 2, 2, 4, 6, 9) la mediana è 2. I residui sono (,, 0, 0, 2, 4, 7) che ordinati restituiscono (0, 0,,, 2, 4, 7). La dev. standard vale Se l istogramma si avvicina alla forma di una curva gaussianastandard allora: s.48 MAD IQR = Interval Inter-quartile IQR = Q3 Q Indice di dispersione 52,000 53,000 57,000 60,000 63,000 66,000 7,000 75,000 78,000 84,000 87,000 92,000 Q Q 2 Q 3 25% 25% 25% 25% 50% 50% QUARTILI 3
14 52,000 53,000 57,000 60,000 63,000 66,000 7,000 75,000 78,000 84,000 87,000 92,000 OUTLIERS 3 Sono quei valori che superano Q3 + IQR 4 Sono quei valori che sono inferiori 3 Q IQR 4 4
15 PERCENTILI 52,000 53,000 57,000 60,000 63,000 66,000 7,000 75,000 78,000 84,000 87,000 92,000 = x p quel valore che lascia a sinistra il p% dei dati p è una percentuale tra 0 e 00 Come modificare l istogramma L istogramma è stato creato con i seguenti passi: Selezionare Analyze, poi Descriptive statistics ed infine Frequency Dist-continuous 5
16 Appare la seguente finestra di dialogo. Doppio click sulla variabile in esame: Example e poi OK Per modificare il grafico che si ottiene Cliccare su Edit Analysis Appare il seguente DIALOG-BOX 6
17 Per la curtosi 7
18 Per realizzare questo grafico Qualche considerazione finale sulla lettura degli istogrammi in geologia. Un istogramma con due mode è generalmente dovuto alla presenza di due sottopopolazioni con medie differenti. 2. Un coefficiente di asimmetria positivo può essere imputabile alla presenza di due popolazioni sovrapposte con media e deviazione standarddiverse. 8
19 3. Un istogramma con un elevato Kurtosis è originato dalla sovrapposizione di due popolazioni. 4. Una asimmetria positiva è spesso interpretata come presenza di elevate concentrazioni di un determinato elemento o minerale, probabilmentenei pressi della sorgente. 9
La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali
Dip. di Scienze Umane e Sociali [email protected] Introduzione [1/2] Gli indici di variabilità consentono di riassumere le principali caratteristiche di una distribuzione (assieme alle medie) Le
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell
LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi
tabelle grafici misure di
Statistica Descrittiva descrivere e riassumere un insieme di dati in maniera ordinata tabelle grafici misure di posizione dispersione associazione Misure di posizione Forniscono indicazioni sull ordine
Nozioni di statistica
Nozioni di statistica Distribuzione di Frequenza Una distribuzione di frequenza è un insieme di dati raccolti in un campione (Es. occorrenze di errori in seconda elementare). Una distribuzione può essere
Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva
Fondamenti di Informatica Ester Zumpano Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Lezione 5 Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di
Elementi di Probabilità e Statistica
Elementi di Probabilità e Statistica Statistica Descrittiva Rappresentazione dei dati mediante tabelle e grafici Estrapolazione di indici sintetici in grado di fornire informazioni riguardo alla distribuzione
Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)
Sintesi dei dati in una tabella Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6) Sintesi dei dati Spesso si vuole effettuare una sintesi dei dati per ottenere indici
Teoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
Variabili aleatorie. continue. Discreto continuo
Variabili aleatorie continue Discreto continuo.18 Uniforme discreta, n=11 n=21 n=11 n=6 n=51 n=51 Uniforme.16.14.12.1.8.6?.4.2 1 1 2 2 3 3 4 4 5 5 6 6 7 7 Per passare dal modello discreto al modello continuo
MISURE DI SINTESI 54
MISURE DI SINTESI 54 MISURE DESCRITTIVE DI SINTESI 1. MISURE DI TENDENZA CENTRALE 2. MISURE DI VARIABILITÀ 30 0 µ Le due distribuzioni hanno uguale tendenza centrale, ma diversa variabilità. 30 0 Le due
Statistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo [email protected] Definizioni di base Una popolazione è l insieme
Statistica descrittiva
Statistica descrittiva Caso di 1 variabile: i dati si presentano in una tabella: Nome soggetto Alabama Dato 11.6.. Per riassumere i dati si costruisce una distribuzione delle frequenze. 1 Si determina
STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA
STATISTICA DESCRITTIVA Elementi di statistica medica STATISTICA DESCRITTIVA È quella branca della statistica che ha il fine di descrivere un fenomeno. Deve quindi sintetizzare tramite pochi valori(indici
Sperimentazioni di Fisica I mod. A Statistica - Lezione 2
Sperimentazioni di Fisica I mod. A Statistica - Lezione 2 A. Garfagnini M. Mazzocco C. Sada Dipartimento di Fisica G. Galilei, Università di Padova AA 2014/2015 Elementi di Statistica Lezione 2: 1. Istogrammi
Misure di dispersione (o di variabilità)
08/04/014 Misure di dispersione (o di variabilità) Range Distanza interquartile Deviazione standard Coefficiente di variazione Misure di dispersione 7 8 9 30 31 9 18 3 45 50 x 9 range31-74 x 9 range50-941
le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:
DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano [email protected] si basano su tre elementi: le scale di misura sistema empirico: un insieme di entità non numeriche (es. insieme di persone; insieme
1/55. Statistica descrittiva
1/55 Statistica descrittiva Organizzare e rappresentare i dati I dati vanno raccolti, analizzati ed elaborati con le tecniche appropriate (organizzazione dei dati). I dati vanno poi interpretati e valutati
LA RAPPRESENTAZIONE E LA SINTESI DEI DATI
Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 LA RAPPRESENTAZIONE E LA SINTESI
Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale
DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis [email protected] www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie
Università del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva Variabili numeriche
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Statistica Descrittiva Variabili numeriche Misure di tendenza centrale Media (aritmetica) Mediana Media
Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza
XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6
Modulo di Statistica e Tecnologia (Dott. Giorgio Poletti
Laurea in Scienze dell Educazione Insegnamento di Pedagogia Sperimentale (Prof. Paolo Frignani) Modulo di Statistica e Tecnologia (Dott. Giorgio Poletti [email protected]) MEDIA aritmetica semplice
Indice. L Editore ringrazia. Ringraziamenti. Autori. Prefazione. Obiettivi formativi XIII XVII
Indice XI XI XIII XV XVII L Editore ringrazia Ringraziamenti Autori Prefazione Obiettivi formativi XIX Istruzioni per gli studenti XIX Un po di storia XX Cosa è la Statistica XXI Come usare questo libro
Lezione 4 a - Misure di dispersione o di variabilità
Lezione 4 a - Misure di dispersione o di variabilità Abbiamo visto che la media è una misura della localizzazione centrale della distribuzione (il centro di gravità). Popolazioni con la stessa media possono
Andrea Bonanomi Università Cattolica del Sacro Cuore. Principi di Statistica Descrittiva. Milano, 9 gennaio 2015 Camera di Commercio
Andrea Bonanomi Università Cattolica del Sacro Cuore Principi di Milano, 9 gennaio 2015 Camera di Commercio RIPETIBILITA ATTUALE RILEVAZIONE TOTALE RIPETIBILITA VIRTUALE RILEVAZIONE PARZIALE UNIVERSO CAMPIONE
Scale di Misurazione Lezione 2
Last updated April 26, 2016 Scale di Misurazione Lezione 2 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura II anno, II semestre Tipi di Variabili 1 Scale di Misurazione 1. Variabile
Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)
Statistica La statistica può essere vista come la scienza che organizza ed analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva:
Università del Piemonte Orientale. Corso di Laurea in Biotecnologie. Corso di Statistica Medica. Statistica Descrittiva: Variabili numeriche
Università del Piemonte Orientale Corso di Laurea in Biotecnologie Corso di Statistica Medica Statistica Descrittiva: Variabili numeriche Corso triennale biotecnologie - Statistica Medica Statistica descrittiva
Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.
Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza. Misure ripetute forniscono dati numerici distribuiti attorno ad un valore centrale indicabile con un indice (indice
Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 04-Grafici delle distribuzioni vers. 1.0 (17 ottobre 2014) Germano Rossi 1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca
LA DISTRIBUZIONE NORMALE (Vittorio Colagrande)
LA DISTRIBUZIONE NORMALE (Vittorio Colagrande) Allo scopo di interpolare un istogramma di un carattere statistico X con una funzione continua (di densità), si può far ricorso nell analisi statistica alla
Daniela Tondini
Daniela Tondini [email protected] Facoltà di Medicina veterinaria CdS in Tutela e benessere animale Università degli Studi di Teramo 1 INDICI STATISTICI La moda M O di una distribuzione di frequenza X,
Capitolo 3 Sintesi e descrizione dei dati quantitativi
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 3 Sintesi e descrizione dei dati quantitativi Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e tecnologie Alimentari" Unità
Dispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
TEST DI AUTOVALUTAZIONE STATISTICA DESCRITTIVA
TEST DI AUTOVALUTAZIONE STATISTICA DESCRITTIVA Metodi statistici per la biologia 1 Parte A 1.1 La media relativa ai dati 1,3,4,5,2.5 è 3.1; 3; 2.5. 1.2 La mediana relativa ai dati 1,3,4,5,2.5 è 3.1; 3;
Statistica descrittiva II
Probabilità e Statistica Esercitazioni a.a. 009/010 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Statistica descrittiva II Ines Campa Probabilità e Statistica - Esercitazioni
Statistica Inferenziale
Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione
LEZIONI DI STATISTICA MEDICA
LEZIONI DI STATISTICA MEDICA A.A. 2010/2011 Lezione n.3 - Indici di posizione 1 Per i caratteri qualitativi, la tabella e le rappresentazioni grafiche esauriscono quasi completamente gli aspetti descrittivi.
Statistica. Matematica con Elementi di Statistica a.a. 2017/18
Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati
Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi
ISTITUZIONI DI STATISTICA A A 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona
http://www.biostatistica.unich.it STATISTICA DESCRITTIVA LE MISURE DI TENDENZA CENTRALE OBIETTIVO Individuare un indice che rappresenti significativamente un insieme di dati statistici. Esempio: Nella
Esercitazioni di Metodi Statistici per la Biologia
Esercitazioni di Metodi Statistici per la Biologia Francesco Caravenna E-mail: [email protected] Web: http://www.math.unipd.it/ fcaraven/didattica Indirizzo: Dipartimento di Matematica,
SOLUZIONI DI ALCUNI ESERCIZI. Appello del
SOLUZIONI DI ALCUNI ESERCIZI Appello del 21-06- 2012 E stato osservato per un certo tempo un tipo di piccoli animali galleggianti (zooplankton- Daphnia magna) e si è notato che questi animali tendono ad
Una statistica è una quantità numerica il cui valore è determinato dai dati.
STATISTICHE CAMPIONARIE Quando i dati sono molti e illeggibili nella forma grezza, si rende necessario introdurre quantità numeriche che possano essere usate per sintetizzarli. Queste misure riassuntive
Esplorazione dei dati. Lucidi e dataset tratti da Turini - Analisi dei Dati, Dip. Inf. Unipi
Esplorazione dei dati Lucidi e dataset tratti da Turini - Analisi dei Dati, Dip. Inf. Unipi Analisi mono e bivariata Si utilizzano indicatori sintetici che individuano, con un singolo valore, proprieta`
INDICI DI FORMA: L ASIMMETRIA
INDICI DI FORMA Per sintetizzare una distribuzione, oltre gli indici di posizione e di variabilità, si possono utilizzare anche indici di forma. Gli indici di forma sono indici descrittivi che mettono
MISURE DI DISPERSIONE
MISURE DI DISPERSIONE 78 MISURE DI DISPERSIONE Un insieme di dati numerici può essere sintetizzato da alcuni valori tipici, che indicano il grado di variabilità dei dati stessi. Grado di Variabilità o
Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica
Indicatori di Posizione e di Variabilità Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Indici Sintetici Consentono il passaggio da una pluralità
Prova scritta di Statistica
Prova scritta di Statistica 5 Febbraio 2016 1. Da un indagine riguardante l utilizzo del telefono cellulare si sono ottenuti i seguenti risultati: Età No.telefonini Chiamate Spesa sett. Bluetooth 20 2
Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)
Prova scritta di STATISTICA CDL Biotecnologie (Programma di Massimo Cristallo - A) 1. Un associazione di consumatori, allo scopo di esaminare la qualità di tre diverse marche di batterie per automobili,
TEST DI AUTOVALUTAZIONE STATISTICA DESCRITTIVA
TEST DI AUTOVALUTAZIONE STATISTICA DESCRITTIVA Statistica 1 Parte A 1.1 La media relativa ai dati 1,3,4,5,2.5 è 3.1; 3; 2.5. 1.2 La mediana relativa ai dati 1,3,4,5,2.5 è 3.1; 3; 2.5. 1.3 Un esperimento
Statistica Elementare
Statistica Elementare 1. Frequenza assoluta Per popolazione si intende l insieme degli elementi che sono oggetto di una indagine statistica, ovvero l insieme delle unità, dette unità statistiche o individui
ISTOGRAMMI E DISTRIBUZIONI:
ISTOGRAMMI E DISTRIBUZIONI: i 3 4 5 6 7 8 9 0 i 0. 8.5 3 0 9.5 7 9.8 8.6 8. bin (=.) 5-7. 7.-9.4 n k 3 n k 6 5 n=0 =. 9.4-.6 5 4.6-3.8 3 Numero di misure nell intervallo 0 0 4 6 8 0 4 6 8 30 ISTOGRAMMI
