Introduzione all Analisi Esplorativa dei Dati mediante R 1
|
|
- Marina Grilli
- 6 anni fa
- Visualizzazioni
Transcript
1 Introduzione all Analisi Esplorativa dei Dati mediante R 1 Giovanna Menardi Giovanna.Menardi@econ.units.it A.A. 2008/ Materiale liberamente tratto da appunti a cura di M. Trevisani. Menardi Lezione () 2 1 / 33
2 Prime funzioni statistiche Per iniziare costruiamo il seguente vettore, che si riferisce all età di 16 studenti che frequentano un corso di formazione post lauream x <- c(23, 23, 24, 24, 24, 25, 25, 25, 25, 25, 26, + 26, 27, 27, 27, 37 ). Menardi Lezione () 2 2 / 33
3 Prime funzioni utili allo statistico La media di un insieme di dati µ = P n i=1 x i n La varianza di un insieme di dati σ 2 P n i=1 = (x i µ) 2 n La mediana di un insieme ordinato di dati x (1), x (2),..., x ( n+1 2 ),..., x (n 1), x (n). Menardi Lezione () 2 3 / 33
4 Prime funzioni utili allo statistico La media P n di un insieme di dati i=1 µ = x i n >mu<-sum(x)/length(x) oppure >mu<-mean(x) La varianza di un insieme di dati σ 2 P n i=1 = (x i µ) 2 n La mediana di un insieme ordinato di dati x (1), x (2),..., x ( n+1 2 ),..., x (n 1), x (n). Menardi Lezione () 2 4 / 33
5 Prime funzioni utili allo statistico La media P n di un insieme di dati i=1 µ = x i n >mu<-sum(x)/length(x) oppure >mu<-mean(x) La varianza di un insieme di dati σ 2 P n i=1 = (x i µ) 2 n >sigma2<-sum((x-mean(x))^2)/length(x) oppure >sigma2<-var(x)*(length(x)-1)/length(x) La mediana di un insieme ordinato di dati x (1), x (2),..., x ( n+1 2 ),..., x (n 1), x (n). Menardi Lezione () 2 5 / 33
6 Prime funzioni utili allo statistico La media P n di un insieme di dati i=1 µ = x i n >mu<-sum(x)/length(x) oppure >mu<-mean(x) La varianza di un insieme di dati σ 2 P n i=1 = (x i µ) 2 n >sigma2<-sum((x-mean(x))^2)/length(x) oppure >sigma2<-var(x)*(length(x)-1)/length(x) La mediana di un insieme ordinato di dati x (1), x (2),..., x ( n+1 2 ),..., x (n 1), x (n) >xord<-sort(x) >pos<-(length(x)+1)/2 >med<-xord[pos] oppure >med<-median(x). Menardi Lezione () 2 6 / 33
7 Prime funzioni utili allo statistico la distribuzione delle frequenze assolute VALORE FREQ. ASSOLUTA x (1) f i. x (k). f k...e relative VALORE FREQ. RELATIVA x (1) f i /n.. x (k) f k /n. Menardi Lezione () 2 7 / 33
8 Prime funzioni utili allo statistico la distribuzione delle frequenze assolute VALORE FREQ. ASSOLUTA >table(x) x (1) f i x x (k) f k...e relative VALORE FREQ. RELATIVA x (1) f i /n.. x (k) f k /n >table(x)/length(x) x Menardi Lezione () 2 8 / 33
9 Prime funzioni utili allo statistico i quantili di una distribuzione Il quantile di ordine p di un insieme di valori è quel valore x p che ripartisce la distribuzione ordinata dei valori in due parti tali che la proporzione di osservazioni minori di x p è pari a p > quantile(x,0.25) 25% 24 > quantile(x,c(0.25,0.50,0.75)) 25% 50% 75% La funzione summary fornisce in un unico comando vari indicatori di sintesi > summary(x) Min. 1st Qu. Median Mean 3rd Qu. Max Menardi Lezione () 2 9 / 33
10 Esercizio Ad una classe di studenti è stato chiesto con quante persone condividessero l abitazione. Il risultato è: Si vuole: (2, 3, 5, 2, 2, 1, 3, 4, 1, 1, 2, 3, 3, 8, 5, 4, 1, 3, 3, 1). Determinare la numerosità della classe Determinare il numero di persone con cui vivono il terzo e il sesto studente Ordinare in senso decrescente le osservazioni Calcolare il valore medio e la mediana delle osservazioni e verificare che la moda è 3. Calcolare la deviazione standard delle osservazioni Determinare i decili del vettore.. Menardi Lezione () 2 10 / 33
11 Matrici Una matrice è un insieme ordinato di vettori di uguale lunghezza. Si crea una matrice con l istruzione > x <- matrix(c(2,1,3,4,9,4), nrow=3,ncol=2,byrow=f) > x [,1] [,2] [1,] 2 4 [2,] 1 9 [3,] 3 4 gli elementi di una matrice sono identificati da due indici > x[2,1] [1] 1. Menardi Lezione () 2 11 / 33
12 Richiamare righe e colonne Per estrarre una colonna di una matrice, si lascia vuoto il posto dell indice di riga e si indica la colonna > x[,2] [1] > x[1,]?. Menardi Lezione () 2 12 / 33
13 Estrazioni di elementi Tutte le tecniche viste per estrarre elementi da un vettore si applicano anche alle matrici > x[c(1,3),2] [1] 4 4 > x[c(1,3),c(f,t)] [1] 4 4 > x[-c(2),c(f,t)] [1] 4 4. Menardi Lezione () 2 13 / 33
14 Esercizio Si costruisca una matrice di 1 e si verifichi di averla realizzata correttamente visualizzando solo le prime 5 righe e le ultime 5. Si controlli inoltre che: l oggetto costruito sia realmente una matrice (si ricordi quanto visto per i vettori) le dimensioni della matrice siano quelle desiderate (si utilizzi la funzione dim). Menardi Lezione () 2 14 / 33
15 Data frame Un data frame è quanto comunemente si indica con il termine tabella di dati (data set) Può essere pensato come un insieme di vettori (colonne del data frame) della stessa lunghezza. mese sesso peso eta gest ordine Menardi Lezione () 2 15 / 33
16 Creazione e importazione in R di data frame Si crea un data frame con l istruzione >neonati<-data.frame(nomevariabile1=c(...), + nomevariabile2=c(...)...) Oppure una tabella contenuta in un file può essere caricata in R come data frame col comando >neonati <- read.table(file="neonati.txt",header=t) dove: header=t fa sì che la prima riga del file vanga interpretata come contenente i nomi delle variabili "neonati.txt" è un file di testo contenuto nella working directory. Menardi Lezione () 2 16 / 33
17 Struttura del data frame > neonati mese sesso peso eta gest ordine riga=individuo (177 righe) colonna=variabile (6 colonne). Menardi Lezione () 2 17 / 33
18 Estrazioni di parti del data frame Per richiamare singole variabili del data frame mediante il loro nome: > neonati$mese [1] [34] [67]... o, equivalentemente, mediante l indicatore di colonna > neonati[,1] > neonati[[1]] Per richiamare elementi del dataframe >neonati$mese[3]. Menardi Lezione () 2 18 / 33
19 Estrazione in base a condizioni R consente di estrarre parti delle variabili (vettori) in base a condizioni, ad esempio > neonati$peso[neonati$sesso==1] estrae i valori di peso per gli individui per cui sesso è pari a 1. Questo permette di determinare frequenze e indicatori sintetici condizionati. >mean(neonati$peso[neonati$sesso=1]) In alternativa, è utile la funzione tapply: >tapply(neonati$peso,neonati$sesso,mean) che calcola il valore di una funzione (in questo caso la media) su ciascun gruppo di componenti del primo argomento (in questo caso il peso), dove i gruppi sono definiti dal secondo argomento (in questo caso il genere). Menardi Lezione () 2 19 / 33
20 Accedere direttamente alle singole variabili L istruzione >attach(neonati) rende le variabili del data frame neonati direttamente accessibili per nome. Sarà quindi sufficiente, per l intera sessione di lavoro, digitare mese, peso, ecc. anziché neonati$mese, neonati$peso. L istruzione detach(neonati) ripristina la situazione iniziale. Le modifiche fatte sulle singole variabili cui si ha avuto accesso solo mediante il nome, non hanno effetto sul data frame di partenza.. Menardi Lezione () 2 20 / 33
21 Esercizio A partire dali dati contenuti nel file neonati.txt determinare: La durata media gestazionale La varianza delle età delle madri I quantili di ordine 0.1 e 0.9 del peso Il peso medio dei nati maschi L età media delle madri che hanno partorito il primo figlio La tabella delle frequenze assolute e relative della variabile sesso Il numero di maschi e femmine tra i nati con più di 3 Kg La percentuale di neonati con peso inferiore ai 2.5 Kg Costruire una tabella delle frequenze dei nati nelle diverse stagioni (si considerino stagioni di 3 mesi con dicembre, gennaio e febbraio mesi invernali) e si dica se tra le famiglie di Camposampiero esiste una tendenza ad avere figli in una stagione piuttosto che in un altra.. Menardi Lezione () 2 21 / 33
22 Rappresentazioni grafiche Come possiamo rappresentare graficamente dati univariati? Variabili qualitative Variabili quantitative discrete con poche modalità Variabili quantitative discrete Variabili quantitative continue 9 >= >; 9 = ; diagrammi a barre diagrammi a torta istogrammi diagrammi a scatola, diagrammi a ramo-e-foglia, diagrammi dei quantili. Menardi Lezione () 2 22 / 33
23 Esempi: i neonati di Camposampiero Dal campione di dati abbiamo osservazioni individuali su: sesso: variabile qualitativa dicotomica mese: variabile qualitativa sconnessa ordine: variabile quantitativa discreta peso: variabile quantitativa continua G. Menardi Lezione () 2 23 / 33
24 Grafici: barplot Una tabella di frequenze può essere rappresentata graficamente con un diagramma a barre > barplot(table(neonati$mese), Grafico a barre del mese main="grafico a barre del mese") mese. Menardi Lezione () 2 24 / 33
25 Grafici: pie Una tabella di frequenze può essere rappresentata graficamente con una torta > pie(table(neonati$mese)) Menardi Lezione () 2 25 / 33
26 Grafici: ramo e foglia Si usa quando si vuole rappresentare un numero ridotto di valori (riferiti ad una variabile quantitativa) senza perdita di informazione > stem(neonati$gest) The decimal point is 1 digit(s) to the right of the Menardi Lezione () 2 26 / 33
27 Grafici: hist Le osservazioni sono suddivise in classi di ampiezza non necessariamente uguale Le aree dei rettangoli sono proporzionali alle frequenze delle classi cui si riferiscono.. Menardi Lezione () 2 27 / 33
28 peso del neonato peso: variabile quantitativa continua Si definiscono classi di ampiezza diversa per il peso dei neonati. classi (g) N i i k=1 N i f i i k=1 f i a i d i 1 (2000,2500] (2500,3000] (3000,3200] (3200,3400] (3400,3600] (3600,3800] (3800,4000] (4000,5000] Menardi Lezione () 2 28 / 33
29 Dettagli sugli istogrammi >isto<-hist(neonati$peso,breaks=c(2000,2500,3000,3200,3400,3600,3800,4000 +,5000),xlab="peso",ylab="densità",main="Istogramma) >isto $breaks [1] $counts [1] $intensities [1] e e e e e-04 [6] e e e-05 $density [1] e e e e e-04 [6] e e e-05 $mids [1] $xname [1] "neonati$peso" $equidist [1] FALSE attr("class") [1] "histogram". Menardi Lezione () 2 29 / 33
30 Grafici: boxplot peso dei neonati Menardi Lezione () 2 30 / 33
31 Boxplot La scatola corrisponde alla parte centrale della distribuzione, delimitata da x 0.25 e x Un segmento verticale all interno della scatola segna la posizione della mediana x La lunghezza della scatola è lo scarto interquartile (SIQ) e misura la dispersione dei dati compresi nella parte centrale. Il diagramma scatola-baffi incorpora una regola empirica per il riconoscimento di dati statisticamente anomali, cioè molto diversi dalla maggior parte dei dati del campione (outliers). Un dato si deve considerare anomalo se è esterno all intervallo I = [x SIQ, x SIQ]. La posizione di ciascun dato anomalo è indicata con un asterisco o altro simbolo grafico. I baffi corrispondono alle code della distribuzione. Sono segmenti che partono dai lati della scatola e si prolungano fino ai dati osservati interni ad I e più vicini agli estremi.. Menardi Lezione () 2 31 / 33
32 Grafici: boxplot >box<-boxplot(neonati$peso,main="peso dei neonati") >box $stats [,1] [1,] 2050 [2,] 3000 [3,] 3300 [4,] 3650 [5,] 4600 $n [1] 177 $conf [,1] [1,] [2,] $out [1] 4680 $group... Menardi Lezione () 2 32 / 33
33 Rappresentare graficamente la distribuzione della variabile sesso (mediante grafico a barre e torta) la distribuzione delle età delle madri che hanno partorito il primo figlio (mediante istogramma) la distribuzione del peso per i nati femmina (mediante boxplot) confrontare i pesi di maschi e femmine mediante due boxplot tracciati sullo stesso grafico G. Menardi Lezione () 2 33 / 33
Uso elementare di R in Statistica G. Marchetti
Uso elementare di R in Statistica G. Marchetti Lezione 1 Introduzione R è un ambiente statistico di pubblico dominio. Il software è libero e può essere scaricato dal sito https: //cran.r-project.org/.
DettagliStatistica descrittiva
Statistica descrittiva Caso di 1 variabile: i dati si presentano in una tabella: Nome soggetto Alabama Dato 11.6.. Per riassumere i dati si costruisce una distribuzione delle frequenze. 1 Si determina
DettagliStatistica descrittiva con R
Statistica descrittiva con R Silvia Parolo 21 Novembre 2014 Sintesi dei dati Le votazioni in matematica di 20 studenti della Yale University sono state le seguenti: 68 84 75 82 68 90 62 88 76 93 73 79
DettagliLaboratorio di ST1 Lezione 2
Laboratorio di ST1 Lezione 2 Claudia Abundo Dipartimento di Matematica Università degli Studi Roma Tre Frequenze in R ESEMPIO Fiori preferiti da n=6 ragazze In R: fiori=c("rosa", "orchidea", "violetta",
DettagliCorso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio
Corso di Laurea: Diritto per le Imprese e le istituzioni a.a. 2016-17 Statistica Statistica Descrittiva 3 Esercizi: 5, 6 Docente: Alessandra Durio 1 Contenuti I quantili nel caso dei dati raccolti in classi
DettagliLivello di misura Scala Nominale Scala Ordinale Scala di Rapporti. Scala Nominale
Esercitazione Supponiamo che il collettivo che si vuole studiare sia composto da un gruppo di turisti. La seguente tabella raccoglie l osservazione di alcuni caratteri di interesse. Costo Soggetto Titolo
DettagliEsercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa
Esercizi Svolti Esercizio 1 Per una certa linea urbana di autobus sono state effettuate una serie di rilevazioni sui tempi di attesa ad una determinata fermata; la corrispondente distribuzione di frequenza
DettagliStatistica descrittiva II
Probabilità e Statistica Esercitazioni a.a. 009/010 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Statistica descrittiva II Ines Campa Probabilità e Statistica - Esercitazioni
DettagliSTATISTICA 1 ESERCITAZIONE 2
Frequenze STATISTICA 1 ESERCITAZIONE 2 Dott. Giuseppe Pandolfo 7 Ottobre 2013 RAPPRESENTAZIONE GRAFICA DEI DATI Le rappresentazioni grafiche dei dati consentono di cogliere la struttura e gli aspetti caratterizzanti
DettagliRelazione tra variabili (cont.) In questo parte del corso analizziamo la relazione tra una variabile continua e un altra qualitativa o discreta.
Relazione tra variabili (cont.) In questo parte del corso analizziamo la relazione tra una variabile continua e un altra qualitativa o discreta. María Eugenia Castellanos Nueda (DEIO) Estadística Aplicada
DettagliStatistica descrittiva con R
Statistica descrittiva con R Monica Marabelli 6 Novembre 2015 Sintesi dei dati Le votazioni in matematica di 20 studenti della Yale University sono state le seguenti: 68 84 75 82 68 90 62 88 76 93 73 79
DettagliLaboratorio di Statistica 1 con R Esercizi per la Relazione. I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati
Laboratorio di Statistica 1 con R Esercizi per la Relazione I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati nel corso. Esercizio 1. 1. Facendo uso dei comandi
DettagliLezione 2. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 2. A. Iodice. Distribuzioni unitarie
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 39 Outline 1 2 3 4 5 6 7 8 () Statistica 2 / 39 La distribuzione unitaria semplice di un carattere
DettagliCompiti tematici dai capitoli 2,3,4
Compiti tematici dai capitoli 2,3,4 a cura di Giovanni M. Marchetti 2016 ver. 0.8 1. In un indagine recente, i rispondenti sono stati classificati rispetto al sesso, lo stato civile e l area geografica
DettagliEsercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:
Istituzioni di Statistica 1 Esercizi su indici di posizione e di variabilità Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche: Durata (ore) Frequenza 0 100? 100 200
DettagliUniversità del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva Variabili numeriche
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Statistica Descrittiva Variabili numeriche Misure di tendenza centrale Media (aritmetica) Mediana Media
DettagliQ1 = /4 0 4 = Me = /2 4 = 3
Soluzioni Esercizi Capitolo - versione on-line Esercizio.: Calcoliamo le densità di frequenza x i x i+1 n i N i a i l i F i 0 1 4 4 1 4/1=4 4/10 = 0.4 1 5 6 4 /4=0.5 6/10 = 0.6 5 10 4 10 5 4/5=0.8 10/10
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 Dott.ssa Antonella Costanzo a.costanzo@unicas.it TIPI DI MEDIA: GEOMETRICA, QUADRATICA, ARMONICA Esercizio 1. Uno scommettitore puntando una somma iniziale
DettagliTeoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
DettagliSTATISTICA AZIENDALE Modulo Controllo di Qualità
STATISTICA AZIENDALE Modulo Controllo di Qualità A.A. 009/10 - Sottoperiodo PROA DEL 14 MAGGIO 010 Cognome:.. Nome: Matricola:.. AERTENZE: Negli esercizi in cui sono richiesti calcoli riportare tutte la
DettagliEsplorazione dei dati
Esplorazione dei dati Introduzione L analisi esplorativa dei dati evidenzia, tramite grafici ed indicatori sintetici, le caratteristiche di ciascun attributo presente in un dataset. Il processo di esplorazione
DettagliObiettivi Strumenti Cosa ci faremo? Probabilità, distribuzioni campionarie. Stimatori. Indici: media, varianza,
Obiettivi Strumenti Cosa ci faremo? inferenza Probabilità, distribuzioni campionarie uso stima Stimatori significato teorico descrizione Indici: media, varianza, calcolo Misure di posizione e di tendenza
DettagliIstituzioni di Statistica e Statistica Economica
Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 1 A. I dati riportati nella seguente tabella si riferiscono
Dettagli14/12/2016 IL SOFTWARE EXCEL 4 I GRAFICI I GRAFICI. E se questi dati volessimo trasformarli in grafico?
IL SOFTWARE EXCEL 4 I GRAFICI I GRAFICI E se questi dati volessimo trasformarli in grafico? 1 I GRAFICI: I GRAFICI: Ogni tipo di grafico ha una sua peculiarità. Dal punto di vista statistico i grafici
DettagliLe rappresentazioni grafiche
Le rappresentazioni grafiche Descrivono diversi aspetti dell informazione contenuta nei dati e si basano sulla rappresentazione di corrispondenze tra dati numerici e enti geometrici elementari (punti,
DettagliIstituzioni di Statistica 1 Esercizi su tabelle di contingenza
Istituzioni di Statistica 1 Esercizi su tabelle di contingenza Esercizio 1 Per stimare la percentuale di fumatori nella popolazione italiana adulta viene intervistato un campione di 60 donne e uno di 40
DettagliUniversità di Cassino Corso di Statistica 1 Esercitazione del 14/01/2008 Dott. Alfonso Piscitelli
Università di Cassino Corso di Statistica 1 Esercitazione del 14/01/2008 Dott. Alfonso Piscitelli Esercizio 1 Supponiamo che il collettivo che si vuole studiare sia composto da un gruppo di amici. La seguente
DettagliUniversità di Cassino Corso di Statistica 1 Esercitazione del 15/10/2007 Dott. Alfonso Piscitelli. Esercizio 1
Università di Cassino Corso di Statistica 1 Esercitazione del 15/10/2007 Dott. Alfonso Piscitelli Esercizio 1 Il seguente data set riporta la rilevazione di alcuni caratteri su un collettivo di 20 soggetti.
DettagliI principali tipi di grafici
I principali tipi di grafici Esiste una grande varietà di rappresentazioni grafiche. I grafici più semplici e nello stesso tempo più efficaci e comunemente utilizzati sono: I GRAFICI A BARRE I GRAFICI
DettagliLa variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali
Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione [1/2] Gli indici di variabilità consentono di riassumere le principali caratteristiche di una distribuzione (assieme alle medie) Le
DettagliCasa dello Studente. Casa dello Studente
Esercitazione - 14 aprile 2016 ESERCIZIO 1 Di seguito si riporta il giudizio (punteggio da 0 a 5) espresso da un gruppo di studenti rispetto alle diverse residenze studentesche di un Ateneo: a) Si calcolino
DettagliEsercitazioni di statistica
Esercitazioni di statistica Boxplot e numeri indici Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 14 Ottobre 014 Stefania Spina Esercitazioni di statistica 1/37 Definizioni La
DettagliLezione 4 a - Misure di dispersione o di variabilità
Lezione 4 a - Misure di dispersione o di variabilità Abbiamo visto che la media è una misura della localizzazione centrale della distribuzione (il centro di gravità). Popolazioni con la stessa media possono
DettagliCorso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 4: Rappresentazioni grafiche
Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 4: Rappresentazioni grafiche 1 Una rappresentazione grafica Per una rappresentazione sintetica della
DettagliUniversità del Piemonte Orientale. Corso di Laurea in Biotecnologie. Corso di Statistica Medica. Statistica Descrittiva: Variabili numeriche
Università del Piemonte Orientale Corso di Laurea in Biotecnologie Corso di Statistica Medica Statistica Descrittiva: Variabili numeriche Corso triennale biotecnologie - Statistica Medica Statistica descrittiva
DettagliMisure di dispersione (o di variabilità)
08/04/014 Misure di dispersione (o di variabilità) Range Distanza interquartile Deviazione standard Coefficiente di variazione Misure di dispersione 7 8 9 30 31 9 18 3 45 50 x 9 range31-74 x 9 range50-941
DettagliLaboratorio di ST1 - Lezione 7. Antonietta di Salvatore. Dipartimento di Matematica Universitá degli Studi Roma Tre
Laboratorio di ST1 - Lezione 7 Antonietta di Salvatore Dipartimento di Matematica Universitá degli Studi Roma Tre Outline Statistica descrittiva e grafici Verifica di ipotesi e intervalli di confidenza
DettagliCapitolo 3 Sintesi e descrizione dei dati quantitativi
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 3 Sintesi e descrizione dei dati quantitativi Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e tecnologie Alimentari" Unità
DettagliStatistica a.a Autovalutazione 1
Statistica a.a. 016-17 Autovalutazione 1 CORSO: Diritto per le Imprese e le Istituzioni ATTENZIONE: alle domande aperte è stato dato un possibile esempio di risposta, altre parole possono essere usate
DettagliFonte:
Fonte: http://www3.istat.it/servizi/studenti/valoredati/ prima sintesi dopo aver raccolto i dati punto di partenza per rappresentazione, lettura, interpretazione, elaborazione. caratteristiche: deve presentare
DettagliStatistica Sociale - modulo A
Statistica Sociale - modulo A e-mail: stella.iezzi@uniroma2.it i quartili IL TERZO QUARTILE per un carattere diviso in classi ESEMPIO: il boxplot I QUARTILI I quartili sono tre indici che dividono la distribuzione
Dettagli1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl
1/4 Capitolo 4 La variabilità di una distribuzione Intervalli di variabilità Box-plot Indici basati sullo scostamento dalla media Confronti di variabilità Standardizzazione Statistica - Metodologie per
DettagliLa statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci
La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni
DettagliStatistica. Matematica con Elementi di Statistica a.a. 2015/16
Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica / 27 Outline () Statistica 2 / 27 Outline 2 () Statistica 2 / 27 Outline 2 3 () Statistica 2 / 27 Outline
DettagliDistribuzione di frequenza e rappresentazioni grafiche
Distribuzione di frequenza e rappresentazioni grafiche Argomenti della lezione La distribuzione di frequenza in classi La rappresentazione grafica Le tabelle di frequenza Le distribuzioni di frequenza
DettagliProva scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)
Prova scritta di STATISTICA CDL Biotecnologie (Programma di Massimo Cristallo - A) 1. Un associazione di consumatori, allo scopo di esaminare la qualità di tre diverse marche di batterie per automobili,
DettagliIndicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica
Indicatori di Posizione e di Variabilità Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Indici Sintetici Consentono il passaggio da una pluralità
DettagliIndici di variabilità relativa
Fonti e strumenti statistici per la comunicazione Prof.ssa Isabella Mingo A.A. 2014-2015 Indici di variabilità relativa Consentono di effettuare confronti sulla variabilità di fenomeni che presentano unità
DettagliSTATISTICA LAB. Analisi dei dati con R - Ex 2. Marta Nai Ruscone. LIUC - Università Carlo Cattaneo, Castellanza STATISTICA LAB
Analisi dei dati con R - Ex 2 Marta Nai Ruscone LIUC - Università Carlo Cattaneo, Castellanza Funzioni Una funzione è un insieme di comandi elementari. In R sono disponibili un gran numero di funzioni
DettagliUniversità di Cassino Corso di Laurea in Scienze Motorie Biostatistica Anno accademico 2011/2012
Università di Cassino Corso di Laurea in Scienze Motorie Biostatistica Anno accademico 2011/2012 Bruno Federico b.federico@unicas.it Cattedra di Igiene - Università degli Studi di Cassino Indici di sintesi
DettagliElementi di Statistica
Università degli Studi di Palermo Dipartimento di Ingegneria Informatica Informatica ed Elementi di Statistica 3 c.f.u. Anno Accademico 2010/2011 Docente: ing. Salvatore Sorce Elementi di Statistica Statistica
DettagliSTATISTICHE DESCRITTIVE Parte II
STATISTICHE DESCRITTIVE Parte II INDICI DI DISPERSIONE Introduzione agli Indici di Dispersione Gamma Differenza Interquartilica Varianza Deviazione Standard Coefficiente di Variazione introduzione Una
DettagliSTATISTICA DESCRITTIVA - SCHEDA N. 2 VARIABILI QUANTITATIVE (RAPPRESENTAZIONI GRAFICHE E QUANTILI)
STATISTICA DESCRITTIVA - SCHEDA N. 2 VARIABILI QUANTITATIVE (RAPPRESENTAZIONI GRAFICHE E QUANTILI) Una variabile si dice quantitativa se è una grandezza misurabile. Per esempio: il peso, l altezza, il
DettagliMatematica ed elementi di statistica Corso di laurea in Scienze e tecnologie per i beni culturali - a.a Esercizi 12: Statistica Descrittiva
Matematica ed elementi di statistica Corso di laurea in Scienze e tecnologie per i beni culturali - a.a. 2014-15 Esercizi 12: Statistica Descrittiva 1. Si sono pesate 25 confezioni di pasta di semola di
DettagliESAME. 9 Gennaio 2017 COMPITO B
ESAME 9 Gennaio 2017 COMPITO B Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto
DettagliStatistica Un Esempio
Statistica Un Esempio Un indagine sul peso, su un campione di n = 100 studenti, ha prodotto il seguente risultato. I pesi p sono espressi in Kg e sono stati raggruppati in cinque classi di peso. classe
DettagliEsercizi in preparazione all esame di. Laboratorio del corso di Principi di Informatica. Prof.sse M. Anselmo e R. Zizza. a.a.
Esercizi in preparazione all esame di Laboratorio del corso di Principi di Informatica Prof.sse M. Anselmo e R. Zizza a.a. 2012/13 NOTA: E necessario salvare il file come .xlsx e inserire
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Indici di posizione variabilità e forma per caratteri qualitativi Il seguente data set riporta la rilevazione
DettagliUNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.
Lezione 4 DISTRIBUZIONE DI FREQUENZA 1 DISTRIBUZIONE DI PROBABILITA Una variabile i cui differenti valori seguono una distribuzione di probabilità si chiama variabile aleatoria. Es:il numero di figli maschi
DettagliStatistica. Lezione 1
Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 1 a.a 2011-2012 Dott.ssa Daniela
DettagliLE RAPPRESENTAZIONI GRAFICHE DELLE DISTRIBUZIONI DI FREQUENZA
LE RAPPRESENTAZIONI GRAFICHE DELLE DISTRIBUZIONI DI FREQUENZA Obiettivo Cogliere rapidamente, attraverso le rappresentazioni grafiche più opportune, le informazioni più importanti sull andamento e/o sulla
DettagliIstituzioni di Statistica 1 Esercizi su strumenti grafici e funzione di frequenza relativa cumulata
Istituzioni di Statistica 1 Esercizi su strumenti grafici e funzione di frequenza relativa cumulata Esercizio 1 La seguente tabella riguarda il tempo per passare da 0 a 100 km/h di 17 automobili tedesche
DettagliProgrammazione con Foglio di Calcolo Cenni di Statistica Descrittiva
Fondamenti di Informatica Ester Zumpano Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Lezione 5 Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di
DettagliLE RAPPRESENTAZIONI GRAFICHE DELLE DISTRIBUZIONI DI FREQUENZA
LE RAPPRESENTAZIONI GRAFICHE DELLE DISTRIBUZIONI DI FREQUENZA Obiettivo: cogliere rapidamente, attraverso le rappresentazioni grafiche più opportune, le informazioni più importanti sull andamento e/o sulla
DettagliStatistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)
Statistica La statistica può essere vista come la scienza che organizza ed analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva:
Dettaglia.a Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno
a.a. 2007-2008 Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno Dott.ssa Daniela Alessi daniela.alessi@med.unipmn.it 1 Argomenti:
DettagliEsercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano:
4. STATISTICA DESCRITTIVA ESERCIZI Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano: 138 164 150 132 144 125 149 157 146 158 140 147 136 148 152 144
DettagliMISURE DI SINTESI 54
MISURE DI SINTESI 54 MISURE DESCRITTIVE DI SINTESI 1. MISURE DI TENDENZA CENTRALE 2. MISURE DI VARIABILITÀ 30 0 µ Le due distribuzioni hanno uguale tendenza centrale, ma diversa variabilità. 30 0 Le due
DettagliCORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Stimatore media campionaria Il tempo in minuti necessario a un certo impiegato dell anagrafe
DettagliGrafici e tabelle permettono di fare valutazioni qualitative, non quantitative. E necessario poter sintetizzare i dati attraverso due importanti
Grafici e tabelle permettono di fare valutazioni qualitative, non quantitative. E necessario poter sintetizzare i dati attraverso due importanti indici : Indici di posizione Indici di variazione Indici
DettagliData set relativo a 40 titolari di esercizi commerciali. Durata del percorso casa lavoro (in minuti) Numero dipendenti che lavorano nel negozio
ESERCITAZIONE 1: VARIABILI E DISTRIBUZIONI 1.TIPOLOGIA DEI DATI 2. CALCOLO DI FREQUENZE 3. RAPPRESENTAZIONE GRAFICA DI UNA VARIABILE A Roma nel 2006 è stata effettuata un indagine, tramite questionario,
DettagliMisure di dispersione (o di variabilità)
14/1/01 Misure di dispersione (o di variabilità) Range Distanza interquartile Deviazione standard Coefficiente di variazione Misure di dispersione 7 8 9 30 31 9 18 3 45 50 x = 9 range=31-7=4 x = 9 range=50-9=41
DettagliStatistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione
Statistica Esercitazione alessandro polli facoltà di scienze politiche, sociologia, comunicazione Obiettivo Esercizio 1. Questo e alcuni degli esercizi che proporremo nei prossimi giorni si basano sul
DettagliEsercitazione 1.3. Indici di variabilità ed eterogeneità. Prof.ssa T. Laureti a.a
Corso di Statistica Esercitazione.3 Indici di variabilità ed eterogeneità Concentrazione Asimmetria Prof.ssa T. Laureti a.a. 202-203 Esercizio Si considerino i seguenti dati relativi al numero di addetti
DettagliSTATISTICA. La Statistica è la scienza che studia i fenomeni collettivi utilizzando metodi matematici.
STATISTICA La Statistica è la scienza che studia i fenomeni collettivi utilizzando metodi matematici. Essa si occupa della tecnica per raccogliere ed elaborare Dati (studenti, abitanti, oggetti, ecc.)
DettagliEsercitazioni di Statistica
Esercitazioni di Statistica Rappresentazioni grafiche Prof. Livia De Giovanni statistica@dis.uniroma1.it Esercizio 1 Si consideri la seguente distribuzione delle industrie tessili secondo il fatturato
DettagliSperimentazioni di Fisica I mod. A Statistica - Lezione 2
Sperimentazioni di Fisica I mod. A Statistica - Lezione 2 A. Garfagnini M. Mazzocco C. Sada Dipartimento di Fisica G. Galilei, Università di Padova AA 2014/2015 Elementi di Statistica Lezione 2: 1. Istogrammi
DettagliLA RAPPRESENTAZIONE E LA SINTESI DEI DATI
Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 LA RAPPRESENTAZIONE E LA SINTESI
DettagliFonte: Esempio a fini didattici
I principali tipi di grafici Esiste una grande varietà di rappresentazioni grafiche. I grafici più semplici e nello stesso tempo più efficaci e comunemente utilizzati sono: i grafici a barre i grafici
DettagliStatistica. Alfonso Iodice D Enza
Statistica Il e Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 21 Outline Il e 1 2 3 Il 4 e 5 () Statistica 2 / 21 Il e Due distribuzioni aventi stessa posizione
DettagliLA STATISTICA
http://www.biostatistica.unich.it LA STATISTICA E l insieme dei metodi che consentono di raccogliere, ordinare, riassumere, presentare ed analizzare dati e informazioni, trarne valide conclusioni e prendere
DettagliUniversità del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria
Università del Piemonte Orientale Corsi di Laurea Triennale di Area Tecnica Corso di Statistica e Biometria Statistica descrittiva: Dati numerici: statistiche di tendenza centrale e di variabilità Corsi
DettagliSTATISTICA 1 ESERCITAZIONE 1 CLASSIFICAZIONE DELLE VARIABILI CASUALI
STATISTICA 1 ESERCITAZIONE 1 Dott. Giuseppe Pandolfo 6 Ottobre 2014 Popolazione statistica: insieme degli elementi oggetto dell indagine statistica. Unità statistica: ogni elemento della popolazione statistica.
DettagliSTATISTICA DESCRITTIVA - SCHEDA N. 2 VARIABILI QUANTITATIVE Rappresentazioni grafiche e quantili
Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) STATISTICA DESCRITTIVA
DettagliTRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative
TRACCIA DI STUDIO Un indice di tendenza centrale non è sufficiente a descrivere completamente un fenomeno. Gli indici di dispersione assolvono il compito di rappresentare la capacità di un fenomeno a manifestarsi
DettagliElementi di Probabilità e Statistica
Elementi di Probabilità e Statistica Statistica Descrittiva Rappresentazione dei dati mediante tabelle e grafici Estrapolazione di indici sintetici in grado di fornire informazioni riguardo alla distribuzione
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliQuestionario 1. Sono assegnati i seguenti dati
Questionario 1. Sono assegnati i seguenti dati 30 30 10 30 50 30 60 60 30 20 20 20 30 20 30 30 20 10 10 40 20 30 10 10 10 30 40 30 20 20 40 40 40 dire se i dati illustrati sono unità statistiche valori
DettagliCon riferimento ai dati riportati nella seguente tabella, indicare la tipologia dei caratteri rilevati.
Corso di Laurea INTERFACOLTÀ - Esercitazione di Statistica n 1 ESERCIZIO 1: Con riferimento ai dati riportati nella seguente tabella, indicare la tipologia dei caratteri rilevati. ESERCIZIO 1 Soluzione:
DettagliSTATISTICHE DESCRITTIVE
STATISTICHE DESCRITTIVE ARGOMENTI DELLA LEZIONE concetti introduttivi indici di tendenza centrale indici di dispersione indici di posizione 2 concetti introduttivi Unità statistiche elementi che costituiscono
DettagliProva Pratica di Statistica I+II - Prof. M. Romanazzi
1 Università di Venezia - Corso di Statistica I + II (Cb-Ga) Prova Pratica di Statistica I+II - Prof. M. Romanazzi 3 Giugno 2008 Cognome e Nome............................................ N. Matricola............
DettagliScale di Misurazione Lezione 2
Last updated April 26, 2016 Scale di Misurazione Lezione 2 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura II anno, II semestre Tipi di Variabili 1 Scale di Misurazione 1. Variabile
DettagliEsercitazioni di Statistica per Biotecnologie. Francesca Pizzorni Ferrarese
Esercitazioni di Statistica per Biotecnologie Francesca Pizzorni Ferrarese Esercitazione I Statistica descrittiva Es.1 Rilevando con uno strumento di misurazione il numero di particelle cosmiche in 40
DettagliEsempi di confronti grafici
Esempi di confronti grafici Esempi di confronti grafici 7/3 Capitolo 3 LE MEDIE La media aritmetica La media geometrica La trimmed mean La mediana La moda I percentili Statistica - Metodologie per
DettagliDistribuzioni e rappresentazioni grafiche
Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Outline 1 Distribuzioni unitarie e di frequenza 2 3 4 5 Outline 1 Distribuzioni unitarie e di frequenza 2 3 4 5 Distribuzione unitaria [1/2] Data
DettagliNote. Comportamento in laboratorio. Ulteriori Conoscenze di Informatica e Statistica. Piano della lezione
Ulteriori Conoscenze di Informatica e Statistica Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 (I piano) tel.: 06 55 17 72 17 meneghini@fis.uniroma3.it Comportamento in laboratorio Durante
DettagliRappresentazione dei dati
Rappresentazione dei dati Riprendiamo il data set Ore: > setwd(..) > ore
DettagliCostruire il grafico di una distribuzione di frequenza
Università degli Studi di Firenze Facoltà di Scienze Politiche Cesare Alfieri Costruire il grafico di una distribuzione di frequenza Luciano Matrone Avanti Maggio 2007 Qualitativo Mutabile Tipo di carattere
DettagliLe rappresentazioni grafiche
Le rappresentazioni grafiche Rappresentazione grafica La rappresentazione grafica è un disegno ottenuto facendo corrispondere ai numeri delle tabelle: - enti geometrici elementari (punti, linee, superfici.)
Dettagli