Capitolo 2 Distribuzioni di frequenza
|
|
- Severino Bello
- 8 anni fa
- Visualizzazioni
Transcript
1 Edizioni Simone - Vol. 43/1 Compendio di statistica Capitolo 2 Distribuzioni di frequenza Sommario 1. Distribuzioni semplici Distribuzioni doppie Distribuzioni parziali: condizionate e marginali Misure sintetiche di distribuzioni statistiche. 1. Distribuzioni semplici La distribuzione di frequenza è una particolare tipologia di rappresentazione dei dati statistici. Per illustrare una distribuzione di frequenza è necessario costruire una tabella statistica nella quale ad ogni modalità o classe di modalità (qualitativa o quantitativa), corrisponde la rispettiva frequenza assoluta o relativa. Il passaggio dalla frequenza assoluta alla frequenza relativa, è utile in tutti i casi in cui si intende confrontare due o più distribuzioni caratterizzate da un numero complessivo di osservazioni differenti. Una tabella statistica può essere semplice o multipla a seconda che si rilevino le modalità relative ad uno o più caratteri. La tabella seguente indica la distribuzione (semplice) di frequenza di un carattere X discreto: Modalità di X Frequenze x 1 n 1 x 2 n 2 : : x i : : n i x k Totale n k n Tabella 1 (a)
2 16 Capitolo 2 La tabella seguente indica, invece, la distribuzione (semplice) di frequenza di un carattere continuo (con modalità raggruppate in classi): Classi di modalità di X Frequenze x 1 =x 2 n 1 x 2 =x 3 n 2 : : x i =x i+1 n i : : x k =x k+1 Totale n k n Tabella 1 (b) Nulla vieta di disporre la distribuzione, anziché per colonne, per righe, per cui le modalità (o le classi di modalità) del carattere saranno indicate nella prima riga mentre le frequenze corrispondenti nella seconda riga. L individuazione del numero di classi di frequenza da costruire in tabella, rappresenta una problematica piuttosto rilevante nella statistica descrittiva poiché la ricostruzione della distribuzione reale di un fenomeno, è attendibile solo qualora vi siano un numero sufficientemente elevato di osservazioni. In genere, il numero ottimale di classi utilizzate abitualmente in un indagine campionaria, varia da un minimo di 4-5, fino ad un massimo di 10-15; la determinazione nel caso concreto, avverrà sulla base della valutazione del numero complessivo di osservazioni. Infatti, un numero di classi estremamente esiguo, determinerebbe, una sostanziale perdita di informazioni a causa dell eccessivo raggruppamento dei dati, mentre un numero troppo elevato di classi disperderebbe eccessivamente i valori della distribuzione. I due metodi più utilizzati per la determinazione ottimale delle classi sono: quello proposto da Sturges 10 C = 1 + $ log 3 10 (N) ove C indica il numero ottimale di classi, e N la numerosità delle osservazioni; metodo di Scott, espresso dalla relazione: 3,5 $ S h = N ove S è la deviazione standard (di cui si tratterà oltre).
3 Distribuzioni di frequenza 17 Nel caso si consideri un carattere qualitativo, nella tabella, invece delle modalità, figurano gli attributi. Esempio 1 Nella tabella seguente è riportata la distribuzione di frequenza delle famiglie residenti in un quartiere per numero di componenti: Componenti Numero delle famiglie Totale Tabella 2 Determinare le frequenze relative, le frequenze cumulate assolute e le frequenze cumulate relative. Nella distribuzione riportata la frequenza relativa corrispondente alla modalità 1 componente è ottenuta nel modo seguente: 803 f i = = 0, La frequenza cumulata assoluta della modalità 2 componenti è: nl i = = mentre, la frequenza cumulata relativa è: fl i = + = 0, È ovvio che la frequenza cumulata assoluta o relativa corrispondente alla 1 a modalità del carattere è pari alla frequenza assoluta o relativa della modalità 1 componente. Modalità Frequenze Frequenze relative Frequenze cumulate assolute cumulate relative 1 0, , , , , ,93703 (Segue)
4 18 Capitolo 2 4 0, , , , , , , Totale 1,00000 Schema 1 Esempio 2 Nella seguente tabella è riportata la distribuzione di frequenza di 270 impiegati di un azienda tessile per classi di età: Classi di età Numero di impiegati Tabella 3 Determinare il valore centrale, la frequenza relativa e la frequenza cumulata di ogni classe. I valori centrali, le frequenze relative e le frequenze cumulate di ogni classe sono indicati nello schema seguente: Classi di età Frequenza assoluta Valore centrale Frequenza relativa Frequenza cumulata ,5 0, ,5 0, ,5 0, ,5 0, ,5 0, ,5 0, (Segue)
5 Distribuzioni di frequenza ,5 0, ,5 0, ,5 0, Schema 2 2. Distribuzioni doppie La distribuzione doppia è una distribuzione congiunta di due caratteri X e Y, i quali si suppone possano essere legati da una relazione, ed è esaminata rispetto al contemporaneo verificarsi di una modalità x i per X e di una modalità y j per Y. Verosimilmente in una distribuzione doppia, dall analisi delle modalità assunte rispettivamente da X e Y, alcune frequenze risulteranno essere più elevate rispetto ad una situazione in cui vi è assenza di qualsiasi legame fra le variabili esaminate. Una tabella a doppia entrata, o tabella tetracorica, è una tabella statistica in cui sono riportate le frequenze assolute o relative riguardanti le diverse combinazioni di modalità o classi di modalità di due caratteri X e Y, desumibili da una distribuzione doppia. Si consideri la tabella seguente: X Y y 1 y 2 y j y c Totale x 1 n 11 n 12 n 1j n 1c n 1. x 2 n 21 n 22 n 2j n 2c n 2. : : : : : : x i n i1 n i2 n ij n ic n i. : : : : : : x r n r1 n r2 n rj n rc n r. Totale n.1 n.2 n.j n.c n Tabella 4 La prima riga della tabella è detta riga madre, in essa figurano le modalità del carattere Y: y 1, y 2,, y c La prima colonna, invece, è detta colonna madre, in essa figurano le modalità del carattere X: x 1, x 2,, x r
6 20 Capitolo 2 Il corpo della tabella è una matrice r c (con r righe e c colonne), in essa figurano frequenze del tipo n ij (i = 1, 2,, r; j = 1, 2,, c) in cui il primo indice rappresenta la riga e il secondo la colonna, la frequenza n ij indica il numero di elementi della popolazione n che possiedono le modalità: x i di X e y j di Y, simultaneamente. Nell ultima riga, detta riga marginale, figurano le frequenze marginali, che rappresentano i totali delle c colonne, e precisamente la frequenza: n.j = r / n ij i = 1 indica il numero di elementi che possiedono la modalità y j del carattere Y, indipendentemente da come essa sia in combinazione con le modalità del carattere X. Per esempio, in una tabella che rileva le frequenze doppie di peso (X) e altezza (Y), la frequenza marginale n.j indica quanti individui sono alti un dato numero di centimetri, a prescindere dal loro peso. Analogamente, nell ultima colonna, detta colonna marginale, figurano le frequenze marginali rappresentanti i totali delle r righe, e precisamente la frequenza: n i. = / c n ij j = 1 indica il numero di elementi che possiedono la modalità x i, del carattere X, indipendentemente da come essa sia in combinazione con le modalità del carattere Y. Nella medesima tabella relativa al peso (X) e all altezza (Y), la frequenza marginale n i. indica quanti individui pesano un dato numero di chili, a prescindere dalla loro altezza. Ovviamente, il totale generale è: r c r c n = / n i. = / n.j = / / n ij i = 1 j = 1 Le considerazioni esposte possono essere estese al caso di variabili continue le cui modalità sono raggruppate in classi, e al caso di variabili qualitative per le quali, invece delle modalità, figurano gli attributi. i = 1 j = 1 Esempio 3 Nella seguente tabella è riportata la distribuzione doppia di lavoratori per settori di attività economica e per posizione professionale:
7 Distribuzioni di frequenza 21 Settori Posizione professionale Dipendenti Autonomi Totale Agricoltura Industria Altre attività Totale Tabella 5 Nella tabella, la frequenza marginale di riga corrispondente alla modalità Agricoltura del primo carattere Occupati per settore di attività è calcolata sommando 485 a 776; essa sta ad indicare che persone sono occupate in Agricoltura, a prescindere dalla posizione professionale. La frequenza marginale di colonna corrispondente alla modalità Dipendenti del secondo carattere Occupati per posizione professionale è ottenuta sommando i seguenti valori: 485, 4.147, 4.941; essa sta ad indicare che persone sono lavoratori dipendenti, a prescindere dal settore in cui sono occupati. La somma delle frequenze marginali di riga è pari alla somma delle frequenze marginali di colonna e corrisponde alla numerosità della popolazione oggetto di osservazione. Esempio 4 Nella seguente tabella è riportato il numero complessivo di lavoratori dipendenti impiegati nelle varie sedi di una grande azienda, distinti per settore d impiego (X) e genere (Y). X/Y M F Amministrazione Vendite Logistica Totale Tabella 6 Calcolare: Le distribuzioni marginali n i., n.j ; Le frequenze relative congiunte f ij ; Le distribuzioni di frequenza marginali relative f i., f.j ; Per ciascuna modalità x i del carattere X, la frequenza marginale ni. si ottiene sommando le frequenze congiunte che si trovano sulla riga corrispondente. Analogamente le frequenze marginali n.j per ciascuna modalità y i del carattere Y, si ottengono sommando le frequenze congiunte che si trovano sulla colonna corrispondente.
8 22 Capitolo 2 n i. = n.j = 2 / n ij j = 1 3 / n ij i = 1 X/Y M F Totale Amministrazione Vendite Logistica Totale Tabella 7 Per ottenere le frequenze relative congiunte si dividono, invece, le frequenze assolute congiunte per la numerosità totale n = 535. Esempio: f ij = n ij /n numerosità dei maschi impiegati nel settore amministrativo = 22 numerosità totale n = 535 quindi: 22/535= 0,041. Ripetendo la medesima operazione per ciascuna frequenza assoluta congiunta, si ottiene la tabella seguente (Tabella 8). In essa sono riportate, quindi, le frequenze marginali relative f i., f.j per i due sessi. X/Y M F Totale Amministrazione 0,041 0,058 0,099 Vendite 0,529 0,316 0,845 Logistica 0,035 0,020 0,055 Totale 0,605 0,394 1 Tabella 8
9 Distribuzioni di frequenza Distribuzioni parziali: condizionate e marginali Da una tabella a doppia entrata si desumono distribuzioni che consentono di evidenziare caratteristiche diverse di una distribuzione doppia di frequenza; esse sono denominate distribuzioni parziali e sono: le distribuzioni condizionate e le distribuzioni marginali. A) Distribuzioni condizionate Una distribuzione condizionata è una distribuzione semplice ottenuta associando, in una tabella a doppia entrata (v. Tabella 4), la riga madre con una qualsiasi delle r righe successive, oppure associando la colonna madre con una qualsiasi delle c colonne successive. La distribuzione Y _ X = x i i è la distribuzione condizionata del carattere Y dato il valore x i del carattere X. La tabella derivata è la 9 (a) seguente. Analogamente, la distribuzione X _ Y = y j i è la distribuzione condizionata del carattere X dato il valore y j del carattere Y. La tabella statistica risultante è la 9 (b). Y Frequenze X Frequenze y 1 n i1 x 1 n 1j y 2 n i2 x 2 n 2j y j n ij x i n ij y c n ic x r n rj Totale n i. Totale n.j Tabella 9 (a) Tabella 9 (b) Da una tabella a doppia entrata, quindi, si desumono: r distribuzioni condizionate del carattere Y alle corrispondenti modalità del carattere X; c distribuzioni condizionate del carattere X alle corrispondenti modalità del carattere Y.
10 24 Capitolo 2 B) Distribuzioni marginali Una distribuzione marginale è una distribuzione semplice ottenuta associando, in una tabella a doppia entrata (v. Tabella 4), la riga madre con la riga marginale, oppure la colonna madre con la colonna marginale. La prima distribuzione indica gli elementi della popolazione che possiedono le modalità y 1, y 2,, y c del carattere Y indipendentemente da come esse siano associate alle modalità x 1, x 2, x r del carattere X. La tabella statistica risultante è la 10 (a) a pagina seguente. La seconda distribuzione indica gli elementi della popolazione che possiedono le modalità x 1, x 2,, x r del carattere X, indipendentemente da come esse siano associate alle modalità y 1, y 2,, y c del carattere Y. La tabella statistica risultante è la 10 (b) a pagina seguente. Y Frequenze X Frequenze y 1 n.1 x 1 n 1. y 2 n.2 x 2 n 2. y j n.j x i n i. y c n.c x r n r. Totale n Totale n Tabella 10 (a) Tabella 10 (b) Da una tabella a doppia entrata si desumono: 1 distribuzione marginale per il carattere X; 1 distribuzione marginale per il carattere Y. Esempio Facendo riferimento alla distribuzione doppia riportata in tabella 5, determinare: a) gli occupati nei settori a prescindere dalla posizione professionale; b) gli occupati per posizione professionale a prescindere dal settore.
11 Distribuzioni di frequenza 25 La distribuzione riportata nella tabella 5 è doppia e attinente ai due caratteri: Occupati per settori di attività economica e Occupati per posizione professionale. a) Il primo punto richiede la determinazione della distribuzione marginale del carattere Occupati per settori di attività economica. Essa si ottiene associando la colonna madre con la colonna marginale: Settori Occupati Agricoltura Industria Altre attività Totale Tabella 11 Pertanto, a prescindere dalla loro posizione professionale, gli occupati in agricoltura sono 1.261, gli occupati nell industria sono 5.103, gli occupati in altre attività sono, invece, b) Al secondo punto si chiede di determinare la distribuzione marginale del carattere Occupati per posizione professionale. Essa si ottiene associando la riga madre con la riga marginale: Posizione professionale Occupati Dipendenti Autonomi Totale Tabella 12 Pertanto, a prescindere dal settore di attività economica, i lavoratori dipendenti sono 9.573, mentre i lavoratori autonomi sono Misure sintetiche di distribuzioni statistiche L analisi statistica fornisce misure sintetiche per valutare aspetti complessi e globali della distribuzione di un fenomeno X mediante un solo numero reale costruito in modo da disperdere al minimo le informazioni sui dati originari. In rapporto alle caratteristiche che si misurano si parla di rapporti statistici, indici di posizione, indici di variabilità, indici di forma, di essi ci occuperemo, rispettivamente, nei capitoli quarto, quinto, sesto e settimo.
12 26 Capitolo 2 In rapporto alla natura, gli indici si distinguono in: indici assoluti che sono introdotti per valutare in modo sintetico un aspetto di una distribuzione e sono espressi nella stessa unità di misura del fenomeno o in sua funzione; indici relativi che non dipendono dall unità di misura del fenomeno, e si ottengono rapportando due misure assolute oppure un indice assoluto al suo massimo. Infine, gli indici normalizzati sono indici relativi che assumono valori in un intervallo finito quasi sempre [0, 1] oppure [ 1, +1]. Questionario 1. Quando una distribuzione di frequenza si dice semplice e quando si dice multipla? (par. 1) 2. Quali sono i principali metodi per l individuazione del numero ottimale di classi di frequenza da costruire in tabella? (par. 1) 3. In una tabella a doppia entrata, cosa esprimono le frequenze marginali? (par. 2) 4. Da una tabella a doppia entrata costituita da 6 righe e 4 colonne quante distribuzioni condizionate si traggono? (par. 3) 5. Da una tabella a doppia entrata costituita da 6 righe e 4 colonne quante distribuzioni marginali si traggono? (par. 3) 6. In quale unità di misura sono espressi gli indici relativi di un dato fenomeno statistico? (par. 4)
OCCUPATI SETTORE DI ATTIVITA' ECONOMICA
ESERCIZIO 1 La tabella seguente contiene i dati relativi alla composizione degli occupati in Italia relativamente ai tre macrosettori di attività (agricoltura, industria e altre attività) negli anni 1971
DettagliCLASSIFICAZIONE DEI CARATTERI
CLASSIFICAZIONE DEI CARATTERI Come abbiamo visto, su ogni unità statistica si rilevano una o più informazioni di interesse (caratteri). Il modo in cui un carattere si manifesta in un unità statistica è
DettagliCorso di. Dott.ssa Donatella Cocca
Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile
Dettagli1. L analisi statistica
1. L analisi statistica Di cosa parleremo La statistica è una scienza, strumentale ad altre, concernente la determinazione dei metodi scientifici da seguire per raccogliere, elaborare e valutare i dati
DettagliIndice Statistiche Univariate Statistiche Bivariate
Indice 1 Statistiche Univariate 1 1.1 Importazione di un file.data.............................. 1 1.2 Medie e variabilità................................... 6 1.3 Distribuzioni di frequenze...............................
DettagliIl concetto di valore medio in generale
Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo
DettagliCorso di laurea in Scienze Motorie. Corso di Statistica. Docente: Dott.ssa Immacolata Scancarello Lezione 2: Misurazione, tabelle
Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione : Misurazione, tabelle 1 Misurazione Definizione: La misura è l attribuzione di un valore numerico
DettagliAppunti di complementi di matematica
Appunti di complementi di matematica UITA STATISTICA: è l unità su cui si raccolgono le informazioni oggetto dell indagine e possono essere individui, famiglie, oggetti. UIVERSO STATISTICO O POLAZIOE STATISTICA
DettagliProva di autovalutazione Prof. Roberta Siciliano
Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.
DettagliUn po di statistica. Christian Ferrari. Laboratorio di Matematica
Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di
DettagliSTATISTICA IX lezione
Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri
DettagliDott.ssa Caterina Gurrieri
Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo
DettagliLezione 1. Concetti Fondamentali
Lezione 1 Concetti Fondamentali 1 Sonetto di Trilussa Sai ched è la statistica? E E na cosa che serve pe fa un conto in generale de la gente che nasce, che sta male, che more, che va in carcere e che sposa.
DettagliSlide Cerbara parte1 5. Le distribuzioni teoriche
Slide Cerbara parte1 5 Le distribuzioni teoriche I fenomeni biologici, demografici, sociali ed economici, che sono il principale oggetto della statistica, non sono retti da leggi matematiche. Però dalle
DettagliRelazioni statistiche: regressione e correlazione
Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica
Dettagli5. IL PC E INTERNET NELLE DIVERSE TIPOLOGIE FAMILIARI
5. IL PC E INTERNET NELLE DIVERSE TIPOLOGIE FAMILIARI 5.1 Considerazioni generali Il livello di informatizzazione delle famiglie toscane è stato esaminato, oltre che sulla base del territorio, anche tenendo
DettagliLA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di
STATISTICA LA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di oggetti; cerca, attraverso l uso della matematica
DettagliAnalisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it
Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri
DettagliUniversità del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria. Statistica descrittiva
Università del Piemonte Orientale Corsi di Laurea Triennale di Area Tecnica Corso di Statistica e Biometria Statistica descrittiva 1 Statistica Funzioni Descrittiva Induttiva (inferenziale) Statistica
DettagliSTATISTICA DESCRITTIVA - SCHEDA N. 1 VARIABILI QUALITATIVE
Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) STATISTICA DESCRITTIVA
DettagliESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE
ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE e-mail: tommei@dm.unipi.it web: www.dm.unipi.it/ tommei Ricevimento: su appuntamento Dipartimento di Matematica, piano terra, studio 114
DettagliAnalisi di dati di frequenza
Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato
DettagliNote per la lettura dei report
Note per la lettura dei report Report strutturali 0. IMPRESE REGISTRATE PER STATO DI ATTIVITÀ. ANNO 2012 E TASSO DI CRESCITA 2012 Contiene la distribuzione dell insieme delle imprese registrate, ovvero
Dettagli[ Analisi della. concentrazione] di Luca Vanzulli. Pag. 1 di 1
[ Analisi della concentrazione] di Luca Vanzulli Pag. 1 di 1 LA CONCENTRAZIONE NELL ANALISI DELLE VENDITE L analisi periodica delle vendite rappresenta un preziosissimo indicatore per il monitoraggio del
DettagliESERCIZI SVOLTI PER LA PROVA DI STATISTICA
ESERCIZI SVOLTI PER LA PROVA DI STATISTICA Stefania Naddeo (anno accademico 4/5) INDICE PARTE PRIMA: STATISTICA DESCRITTIVA. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE. VALORI CARATTERISTICI
DettagliCome descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca
Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva Brugnaro Luca Progetto formativo complessivo Obiettivo: incrementare le competenze degli operatori sanitari nelle metodiche
Dettagli19txtI_BORRA_2013 18/11/13 10:52 Pagina 449 TAVOLE STATISTICHE
19txtI_BORRA_2013 18/11/13 10:52 Pagina 449 TAVOLE STATISTICHE Nell inferenza è spesso richiesto il calcolo di alcuni valori critici o di alcune probabilità per le variabili casuali che sono state introdotte
Dettagli1. Distribuzioni campionarie
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie
DettagliCome archiviare i dati per le scienze sociali
Come archiviare i dati per le scienze sociali ADPSS-SOCIODATA Archivio Dati e Programmi per le Scienze Sociali www.sociologiadip.unimib.it/sociodata E-mail: adpss.sociologia@unimib.it Tel.: 02 64487513
DettagliDimensione di uno Spazio vettoriale
Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione
DettagliIntroduzione alle relazioni multivariate. Introduzione alle relazioni multivariate
Introduzione alle relazioni multivariate Associazione e causalità Associazione e causalità Nell analisi dei dati notevole importanza è rivestita dalle relazioni causali tra variabili Date due variabili
DettagliTitolo della lezione. Analisi dell associazione tra due caratteri: indipendenza e dipendenza
Titolo della lezione Analisi dell associazione tra due caratteri: indipendenza e dipendenza Introduzione Analisi univariata, bivariata, multivariata Analizzare le relazioni tra i caratteri, per cercare
DettagliElementi di Statistica descrittiva Parte I
Elementi di Statistica descrittiva Parte I Che cos è la statistica Metodo di studio di caratteri variabili, rilevabili su collettività. La statistica si occupa di caratteri (ossia aspetti osservabili)
DettagliIl significato della MEDIA e della MEDIANA in una raccolta di dati numerici
Il significato della MEDIA e della MEDIANA in una raccolta di dati numerici Ogni qual volta si effettua una raccolta di dati di tipo numerico è inevitabile fornirne il valore medio. Ma che cos è il valore
DettagliStatistica. Esercitazione 3 5 maggio 2010 Serie storiche. Connessione e indipendenza statistica
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2008/2009 Statistica Esercitazione 3 5 maggio 2010 Serie storiche. Connessione e indipendenza
DettagliLEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010
LEZIONE 3 "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando uno
DettagliLA CORRELAZIONE LINEARE
LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione
DettagliStatistica 1. Esercitazioni. Dott. Luigi Augugliaro 1. Università di Palermo
Statistica 1 Esercitazioni Dott. 1 1 Dipartimento di Scienze Statistiche e Matematiche S. Vianelli, Università di Palermo ricevimento: lunedì ore 15-17 mercoledì ore 15-17 e-mail: luigi.augugliaro@unipa.it
DettagliLE SUCCESSIONI 1. COS E UNA SUCCESSIONE
LE SUCCESSIONI 1. COS E UNA SUCCESSIONE La sequenza costituisce un esempio di SUCCESSIONE. Ecco un altro esempio di successione: Una successione è dunque una sequenza infinita di numeri reali (ma potrebbe
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato
Dettagliu 1 u k che rappresenta formalmente la somma degli infiniti numeri (14.1), ordinati al crescere del loro indice. I numeri u k
Capitolo 4 Serie numeriche 4. Serie convergenti, divergenti, indeterminate Data una successione di numeri reali si chiama serie ad essa relativa il simbolo u +... + u +... u, u 2,..., u,..., (4.) oppure
DettagliAnno 3. Funzioni: dominio, codominio e campo di esistenza
Anno 3 Funzioni: dominio, codominio e campo di esistenza 1 Introduzione In questa lezione parleremo delle funzioni. Ne daremo una definizione e impareremo a studiarne il dominio in relazione alle diverse
DettagliStima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una
DettagliAnalisi e diagramma di Pareto
Analisi e diagramma di Pareto L'analisi di Pareto è una metodologia statistica utilizzata per individuare i problemi più rilevanti nella situazione in esame e quindi le priorità di intervento. L'obiettivo
DettagliMonitoraggio sulla conversione dei prezzi al consumo dalla Lira all Euro
ISTAT 17 gennaio 2002 Monitoraggio sulla conversione dei prezzi al consumo dalla Lira all Euro Nell ambito dell iniziativa di monitoraggio, avviata dall Istat per analizzare le modalità di conversione
DettagliLuigi Piroddi piroddi@elet.polimi.it
Automazione industriale dispense del corso 10. Reti di Petri: analisi strutturale Luigi Piroddi piroddi@elet.polimi.it Analisi strutturale Un alternativa all analisi esaustiva basata sul grafo di raggiungibilità,
DettagliESERCIZIO N 4. Fatturato Supermercati [0;500) 340 [500;1000) 368 [1000;5000) 480 [5000;10000) 37 [10000;20000) 15 taglia = 1240
ESERCIZIO N 4 Fatturato Supermercati [0;500) 340 [500;1000) 368 [1000;5000) 480 [5000;10000) 37 [10000;20000) 15 taglia = 1240 PUNTO a CALCOLO MODA E QUARTILI La moda rappresenta quell'elemento del campione
DettagliCapitolo 11 Test chi-quadro
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova
DettagliPROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE
Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ -
DettagliModelli descrittivi, statistica e simulazione
Modelli descrittivi, statistica e simulazione Master per Smart Logistics specialist Roberto Cordone (roberto.cordone@unimi.it) Statistica descrittiva Cernusco S.N., giovedì 21 gennaio 2016 (9.00/13.00)
DettagliSTATISTICA 1 ESERCITAZIONE 1 CLASSIFICAZIONE DELLE VARIABILI CASUALI
STATISTICA 1 ESERCITAZIONE 1 Dott. Giuseppe Pandolfo 30 Settembre 2013 Popolazione statistica: insieme degli elementi oggetto dell indagine statistica. Unità statistica: ogni elemento della popolazione
DettagliIL CAPOLUOGO AL MICROSCOPIO
IL CAPOLUOGO AL MICROSCOPIO Il Servizio Statistica della Provincia di Mantova coltiva il progetto di costituire una banca dati provinciale di provenienza anagrafica che non vuole divenire una duplicazione
DettagliLezione 6: Forma di distribuzione Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria
Lezione 6: Forma di distribuzione Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Standardizzazione di una variabile Standardizzare una variabile statistica
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1 Dott.ssa Antonella Costanzo a.costanzo@unicas.it A.Studio dell interdipendenza tra variabili: riepilogo Concetto relativo allo studio delle relazioni tra
DettagliI sistemi di numerazione
I sistemi di numerazione 01-INFORMAZIONE E SUA RAPPRESENTAZIONE Sia dato un insieme finito di caratteri distinti, che chiameremo alfabeto. Utilizzando anche ripetutamente caratteri di un alfabeto, si possono
DettagliSTATISTICA DESCRITTIVA BIVARIATA
STATISTICA DESCRITTIVA BIVARIATA Si parla di Analisi Multivariata quando su ogni unità statistica, appartenente ad una determinata popolazione, si rileva un certo numero s di caratteri X 1, X 2,,X s. Si
DettagliStatistica. Le rappresentazioni grafiche
Statistica Le rappresentazioni grafiche Introduzione Le rappresentazioni grafiche costituiscono uno dei mezzi più efficaci, sia per descrivere in forma visiva i risultati di numerose osservazioni riguardanti
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Distribuzione di probabilità, funzione di ripartizione di una v.c. discreta Il tasso di cambio
DettagliLezione n. 2 (a cura di Chiara Rossi)
Lezione n. 2 (a cura di Chiara Rossi) QUANTILE Data una variabile casuale X, si definisce Quantile superiore x p : X P (X x p ) = p Quantile inferiore x p : X P (X x p ) = p p p=0.05 x p x p Graficamente,
DettagliFunzioni funzione dominio codominio legge argomento variabile indipendente variabile dipendente
Funzioni In matematica, una funzione f da X in Y consiste in: 1. un insieme X detto dominio di f 2. un insieme Y detto codominio di f 3. una legge che ad ogni elemento x in X associa uno ed un solo elemento
DettagliSISTEMI DI NUMERAZIONE E CODICI
SISTEMI DI NUMERAZIONE E CODICI Il Sistema di Numerazione Decimale Il sistema decimale o sistema di numerazione a base dieci usa dieci cifre, dette cifre decimali, da O a 9. Il sistema decimale è un sistema
DettagliUniversità del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva
Università del Piemonte Orientale Corsi di Laurea Triennale Corso di Statistica e Biometria Introduzione e Statistica descrittiva Corsi di Laurea Triennale Corso di Statistica e Biometria: Introduzione
DettagliE NECESSARIO RICORRERE ALLE VARIABILI CASUALI
IL CONCETTO DI VARIABILE CASUALE Associare una misura di probabilità al verificarsi di un certo evento (come esito di un esperimento) non sempre è sufficiente a risolvere gran parte dei problemi reali
Dettagli4. Operazioni elementari per righe e colonne
4. Operazioni elementari per righe e colonne Sia K un campo, e sia A una matrice m n a elementi in K. Una operazione elementare per righe sulla matrice A è una operazione di uno dei seguenti tre tipi:
DettagliSTATISTICA DESCRITTIVA UNIVARIATA
Capitolo zero: STATISTICA DESCRITTIVA UNIVARIATA La STATISTICA è la scienza che si occupa di fenomeni collettivi che richiedono lo studio di un grande numero di dati. Il termine STATISTICA deriva dalla
DettagliProbabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)
Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:
DettagliIgiene nelle Scienze motorie
Igiene nelle Scienze motorie Epidemiologia generale Epidemiologia Da un punto di vista etimologico, epidemiologia è una parola di origine greca, che letteralmente significa «discorso riguardo alla popolazione»
DettagliLezione 1. Concetti Fondamentali
Lezione 1 Concetti Fondamentali Sonetto di Trilussa Sai ched è la statistica? E na cosa che serve pe fa un conto in generale de la gente che nasce, che sta male, che more, che va in carcere e che sposa.
DettagliClustering. Utilizziamo per la realizzazione dell'esempio due tipologie di software:
Esercizio Clustering Utilizziamo per la realizzazione dell'esempio due tipologie di software: - XLSTAT.xls - Cluster.exe XLSTAT.xls XLSTAT.xls è una macro di Excel che offre la possibilità di effettuare
DettagliLA MASSIMIZZAZIONE DEL PROFITTO ATTRAVERSO LA FISSAZIONE DEL PREZZO IN FUNZIONE DELLE QUANTITÀ
LA MASSIMIZZAZIONE DEL PROFITTO ATTRAVERSO LA FISSAZIONE DEL PREZZO IN FUNZIONE DELLE QUANTITÀ In questa Appendice mostreremo come trovare la tariffa in due parti che massimizza i profitti di Clearvoice,
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliMisure della dispersione o della variabilità
QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.
DettagliCon il termine Variabile di solito si indica qualcosa che varia, cioè che assume più modi di essere, detti modalità, attributi, valori
Le Variabili Con il termine Variabile di solito si indica qualcosa che varia, cioè che assume più modi di essere, detti modalità, attributi, valori 1. Genericamente, il termine variabile indica un carattere
DettagliFonti e strumenti statistici per la comunicazione (prof.ssa I.Mingo) Esercizi (soluzioni e suggerimenti )
Esercizio 1 Fonti e strumenti statistici per la comunicazione (prof.ssa I.Mingo) Esercizi (soluzioni e suggerimenti ) Qualitativo Sconnesso: Marca di Jeans preferita, Partito votato nelle ultime elezioni,
DettagliCome visto precedentemente l equazione integro differenziale rappresentativa dell equilibrio elettrico di un circuito RLC è la seguente: 1 = (1)
Transitori Analisi nel dominio del tempo Ricordiamo che si definisce transitorio il periodo di tempo che intercorre nel passaggio, di un sistema, da uno stato energetico ad un altro, non è comunque sempre
DettagliUSO DI EXCEL CLASSE PRIMAI
USO DI EXCEL CLASSE PRIMAI In queste lezioni impareremo ad usare i fogli di calcolo EXCEL per l elaborazione statistica dei dati, per esempio, di un esperienza di laboratorio. Verrà nel seguito spiegato:
DettagliEsercitazione 23 maggio 2016
Esercitazione 5 maggio 016 Esercitazione 3 maggio 016 In questa esercitazione, nei primi tre esercizi, analizzeremo il problema del moral hazard nel mercato. In questo caso prenderemo in considerazione
DettagliPremesse alla statistica
Premesse alla statistica Versione 22.10.08 Premesse alla statistica 1 Insiemi e successioni I dati di origine sperimentale si presentano spesso non come singoli valori, ma come insiemi di valori. Richiamiamo
DettagliSTATISTICA E PROBABILITá
STATISTICA E PROBABILITá Statistica La statistica è una branca della matematica, che descrive un qualsiasi fenomeno basandosi sulla raccolta di informazioni, sottoforma di dati. Questi ultimi risultano
DettagliMETODOLOGIA STATISTICA E CLASSIFICAZIONE DEI DATI
METODOLOGIA STATISTICA E CLASSIFICAZIONE DEI DATI 1.1 La Statistica La Statistica è la scienza che raccoglie, elabora ed interpreta i dati (informazioni) relativi ad un dato fenomeno oggetto di osservazione.
DettagliUniversità di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008
Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica 18 dicembre 008 Esame sull intero programma: esercizi da A a D Esame sulla seconda parte del programma: esercizi
DettagliELEMENTI DI DEMOGRAFIA
ELEMENTI DI DEMOGRAFIA 2. Caratteristiche strutturali della popolazione Posa Donato k posa@economia.unisalento.it Maggio Sabrina k s.maggio@economia.unisalento.it UNIVERSITÀ DEL SALENTO DIP.TO DI SCIENZE
Dettagli2.1 Definizione di applicazione lineare. Siano V e W due spazi vettoriali su R. Un applicazione
Capitolo 2 MATRICI Fra tutte le applicazioni su uno spazio vettoriale interessa esaminare quelle che mantengono la struttura di spazio vettoriale e che, per questo, vengono dette lineari La loro importanza
DettagliTasso di occupazione per fasce di età. Provincia di Piacenza, 2009 90,3 83,1 77,7 27,6 16,4. 15-24 anni. 25-34 anni. 45-54 anni.
La situazione occupazionale dei giovani in provincia di Piacenza Premessa Una categoria di soggetti particolarmente debole nel mercato del lavoro è rappresentata, di norma, dai lavoratori di età più giovane
DettagliEsercitazioni del corso di Statistica Prof. Mortera a.a. 2008/2009
Esercitazioni del corso di Statistica Prof. Mortera a.a. 2008/2009 Esercizi di statistica descrittiva 1. Secondo i dati ISTAT 1997 sull occupazione, la Lombardia e il Veneto presentano le seguenti distribuzione
DettagliStatistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.
Iniziamo con definizione (capiremo fra poco la sua utilità): DEFINIZIONE DI VARIABILE ALEATORIA Una variabile aleatoria (in breve v.a.) X è funzione che ha come dominio Ω e come codominio R. In formule:
DettagliESERCIZI DI STATISTICA DESCRITTIVA
ESERCIZI DI STATISTICA DESCRITTIVA ES1 Data la seguente serie di dati su Sesso e Altezza di 8 pazienti, riempire opportunamente due tabelle per rappresentare le distribuzioni di frequenze dei due caratteri,
DettagliQUANTIZZAZIONE diverse fasi del processo di conversione da analogico a digitale quantizzazione
QUANTIZZAZIONE Di seguito lo schema che illustra le diverse fasi del processo di conversione da analogico a digitale. Dopo aver trattato la fase di campionamento, occupiamoci ora della quantizzazione.
DettagliChiusura lineare. N.B. A può essere indifferentemente un insieme, finito o no, o un sistema. Es.1. Es.2
Chiusura lineare Def. Sia A V (K) con A. Si dice copertura lineare (o chiusura lineare) di A, e si indica con L(A), l insieme dei vettori di V che risultano combinazioni lineari di un numero finito di
DettagliPROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO
PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO L indagine si è svolta nel periodo dal 26 agosto al 16 settembre 2014 con l obiettivo di conoscere l opinione dei residenti
DettagliIl test del Chi-quadrato
Il test del Chi-quadrato Prof.ssa Montomoli- Univ. di Pavia Prof.ssa Zanolin Univ. di Verona Il rischio di contrarre epatite C è associato all avere un tatuaggio? Cosa vuol dire ASSOCIAZIONE tra due variabili?
DettagliStatistica. Alfonso Iodice D Enza iodicede@unicas.it
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 2 Outline 1 2 3 4 () Statistica 2 / 2 Misura del legame Data una variabile doppia (X, Y ), la misura
DettagliEpidemiologia generale
Epidemiologia Da un punto di vista etimologico, epidemiologia è una parola di origine greca, che letteralmente significa «discorso riguardo alla popolazione» Epidemiologia generale Disciplina che ha come
DettagliSPC e distribuzione normale con Access
SPC e distribuzione normale con Access In questo articolo esamineremo una applicazione Access per il calcolo e la rappresentazione grafica della distribuzione normale, collegata con tabelle di Clienti,
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Un breve riepilogo: caratteri, unità statistiche e collettivo UNITA STATISTICA: oggetto dell osservazione
DettagliAnalisi di Mercato. Facoltà di Economia. Analisi sui consumi. Metodo delle inchieste familiari. Metodo delle disponibilità globali
Obiettivi delle aziende Analisi di Mercato Facoltà di Economia francesco mola Analisi sui consumi Conoscere i bisogni e i gusti dei consumatori Valutare la soddisfazione della clientela Lanciare nuovi
Dettaglimatematica probabilmente
IS science centre immaginario scientifico Laboratorio dell'immaginario Scientifico - Trieste tel. 040224424 - fax 040224439 - e-mail: lis@lis.trieste.it - www.immaginarioscientifico.it indice Altezze e
DettagliOgni azienda ha la necessità di conoscere il proprio sistema dei costi sia per controllare la situazione esistente che per verificare il
Ogni azienda ha la necessità di conoscere il proprio sistema dei costi sia per controllare la situazione esistente che per verificare il raggiungimento degli obiettivi avendo come fine il mantenimento
DettagliElementi di statistica. Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena 2015-2016 1 / 1
Elementi di statistica Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena 2015-2016 1 / 1 Statistica La statistica si può definire come: l insieme dei metodi
Dettagli