La statistica descrittiva seconda parte. a cura della prof.ssa Anna Rita Valente

Documenti analoghi
Esercitazioni di statistica

2. Variabilità mediante il confronto di valori caratteristici della

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

L indagine statistica

ITCS Erasmo da Rotterdam. Anno Scolastico 2014/2015. CLASSE 4^ M Costruzioni, ambiente e territorio

Appunti di complementi di matematica

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016

7. Si confronti la variabilità del carattere età nel gruppo dei maschi ed in quello delle femmine.

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

MISURA DELLA DISTANZA FOCALE DI UNA LENTE CONVERGENTE

Analisi dei Dati - Prof. Marozzi Rilevazione dei caratteri "titolo di studio" e "qualifica professionale". Collettivo: addetti di un'azienda.

Analisi della varianza

VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD. Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza.

Elementi di Psicometria con Laboratorio di SPSS 1

STATISTICA DESCRITTIVA UNIVARIATA

Generazione di Numeri Casuali- Parte 2

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA

Lezione n. 2 (a cura di Chiara Rossi)

STATISTICA (A-K) a.a Prof.ssa Mary Fraire Test di STATISTICA DESCRITTIVA Esonero del 2007

Grafici delle distribuzioni di frequenza

Esercitazioni di Statistica Dott.ssa Cristina Mollica

Indici (Statistiche) che esprimono le caratteristiche di simmetria e

Istituto Professionale di Stato per l Industria e l Artigianato Giancarlo Vallauri. Classi I C I G

Titolo della lezione. Analisi dell associazione tra due caratteri: indipendenza e dipendenza

Dipendenza tra caratteri: connessione. N:B: Si tratta di coppie di caratteri sia qualitativi

Prova di autovalutazione Prof. Roberta Siciliano

Statistica Applicata all edilizia Lezione 3: i numeri indice

Capitolo 3. Errori di misura. 3.1 L'incertezza nella misura

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

AREA LOGICO - MATEMATICA TEMA PARI E DISPARI

Statistica. Alfonso Iodice D Enza iodicede@unicas.it

Indici di dispersione

Non lasciamoci ingannare..

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

Elementi di statistica

UNIVERSITA DEGLI STUDI DI PADOVA DIPARTIMENTO DI INGEGNERIA IDRAULICA, MARITTIMA E GEOTECNICA

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca

Statistica descrittiva

STATISTICA DESCRITTIVA BIVARIATA

Dott.ssa Caterina Gurrieri

EQUAZIONI CON VALORE ASSOLUTO DISEQUAZIONI CON VALORE ASSOLUTO

Statistica (Prof. Capitanio) Slide n. 1. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Capitolo 2 Distribuzioni di frequenza

Massimi e minimi vincolati in R 2 - Esercizi svolti

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

Statistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

1) A partire dalla seguente tabella a doppia entrata per le variabili QUALIFICA FUNZIONALE e STIPENDIO PERCEPITO (3 classi): STIPENDIO PERCEPITO

Statistica Applicata all edilizia Lezione 2: Analisi descrittiva dei dati

Statistica. Esercitazione 3 5 maggio 2010 Serie storiche. Connessione e indipendenza statistica

Definizione Dati due insiemi A e B, contenuti nel campo reale R, si definisce funzione reale di variabile reale una legge f : A

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Statistica. L. Freddi. L. Freddi Statistica

1. Richiami di Statistica. Stefano Di Colli

Fondamenti di Internet e Reti

Matematica con il foglio di calcolo

LOGISTICA APPUNTI DI STATISTICA

Pivot è bello. Principali. misure di variabilità. Il contesto è di tipo matematico, in particolare riguarda l uso di dati numerici e delle loro

31/10/2012. Lo studio delle funzioni permette di interpretare la variazione di due grandezze, l una rispetto l altra, quando

Elementi di Statistica

p k q n k = p n (k) = n 12 = 1 = ,1208. q = 1 2 e si ha: p 12 (8) =

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

IL CONCETTO DI FUNZIONE

VARIABILI ALEATORIE CONTINUE

Facciamo qualche precisazione

LA RILEVAZIONE DEI PREZZI AL CONSUMO

Soluzioni Esercizi elementari

Studio di funzione. Tutti i diritti sono riservati. E vietata la riproduzione, anche parziale, senza il consenso dell autore. Funzioni elementari 2

La dissomiglianza tra due distribuzioni normali

Il test di chi-quadro

Metodi statistici per le ricerche di mercato

Elenco dettagliato degli argomenti da preparare per l esame

Esercizi di Matematica Finanziaria

Analisi dei dati. Statistica descrittiva

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA

DOMINIO di FUNZIONI. PREREQUISITI: Grafici delle funzioni elementari. Calcolo di EQUAZIONI e DISEQUAZIONI, intere e fratte.

Misura e Valutazione del A. Rischio

Unità di misura di lunghezza usate in astronomia

OFFERTA DI LAVORO. p * C = M + w * L

I laureati scuole di provenienza, durata degli studi, votazioni ed età

Analisi di dati di frequenza

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Caratteristiche neonatali e materne associate all introduzione precoce di cibi solidi nella coorte Piccolipiù

Quantificare la variabilità dei processi ecologici

UNIVERSITA' CATTOLICA DEL SACRO CUORE. Valutazione della soddisfazione degli studenti a.a Riepilogo delle valutazioni fornite

LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE

ANALISI DEI DATI PER IL MARKETING 2014

Un applicazione della modellistica ARCH-GARCH

Infrastruttura telematica: visione d insieme Mauro Nanni

Syllabus: argomenti di Matematica delle prove di valutazione

Esercitazione di riepilogo 23 Aprile 2013

Statistica Medica. Verranno presi in esame:

Esercitazione # 6. a) Fissato il livello di significatività al 5% si tragga una conclusione circa l opportunità di avviare la campagna comparativa.

Trasformazioni geometriche nel piano cartesiano

Misure della dispersione o della variabilità

Statistica Inferenziale

I punteggi zeta e la distribuzione normale

Inferenza statistica

Transcript:

La statistica descrittiva seconda parte a cura della prof.ssa Anna Rita Valente

INDICI DI POSIZIONE CENTRALE Sono dei valori che descrivono in modo sintetico una serie di dati raccolti. I più semplici ma anche i più significativi sono: MEDIA ARITMETICA SEMPLICE (n valori) x x 1 MODA x 2... n x n È il valore a cui corrisponde la frequenza massima ARITMETICA PONDERATA (n valori, f frequenze) x x 1 f 1 x 2 f 2... x n n f n MEDIANA è la modalità che occupa la posizione centrale nella distribuzione ordinata della variabile Se n è dispari allora è il valore centrale; Se n è pari allora è la media aritmetica dei due valori centrali

ESEMPI N 1 Calcola la media aritmetica dei seguenti dati: 74 87 92 81-83 - 75 69 90 72-83 N 2 Dopo aver costruito la tabella della distribuzione di frequenze assolute dei seguenti dati, calcola la media ponderata. 23 15 18 22 13 19 24 18 20 16 20 21 16 19-18 21 22 24-16 20 17 19 20-16 N 3 Determina la media, la moda e la mediana dei seguenti valori assunti da una variabile statistica x: 15 18 16 17 15 15 19 18 20 15 17 19 20

ҧ CAMPO DI VARIAZIONE INDICI DI VARIABILITA E la differenza tra il valore massimo e quello minimo SCARTO SEMPLICE MEDIO Campo di variazione = x max x min E la media aritmetica dei valori assoluti delle differenze tra ogni singolo valore della sequenza e la media aritmetica M della sequenza sm = x 1 x ҧ = è la media dei dati, n = numero di dati x + x 2 n x ҧ + MISURA DI QUANTO LE MODALITA DI UN CARATTERE SI DISCOSTANO DALLA LORO MEDIA

VARIANZA E la media aritmetica dei quadrati della differenza tra ogni singolo valore della sequenza e la media aritmetica della sequenza: σ 2 = x 1 xҧ 2 + x 2 n xҧ 2 + La varianza è una misura di variabilità di una distribuzione, cioè quanta "diversità" c'è tra le modalità del fenomeno che stiamo studiando. Se si ha una distribuzione di frequenze la formula è: σ 2 = x 1 xҧ 2 f 1 + x 2 f 1 + f 2 +. +f n xҧ 2 f 2 + La varianza è sempre maggiore o uguale a zero, e non può mai essere negativa!

SCARTO QUADRATICO MEDIO (o DEVIAZIONE STANDARD) E la radice quadrata della VARIANZA σ = σ 2 = x 1 xҧ 2 + x 2 xҧ 2 + n E un indice più utilizzato rispetto allo scarto semplice medio sm, perché più sensibile alle piccole variazioni delle distribuzioni: è più preciso nel determinare quanto i valori sono dispersi rispetto al valore centrale. Come per la media, se abbiamo una distribuzione di frequenze la formula è: σ = σ 2 = x 1 xҧ 2 f 1 + x 2 f 1 + f 2 +. +f n xҧ 2 f 2 +

N 1 Uno studente possiede una piccola biblioteca composta da 250 libri; se si suddividono i libri rispetto al numero di pagine, si ottiene la seguente tabella: NUMERO PAGINE FREQUENZA LIBRI 0-50 8 51-100 10 101-150 73 151-200 80 201-250 33 251-300 30 301-350 16 Calcola qual è il numero medio di pagine dei libri della biblioteca e lo scarto quadratico medio.

Il numero medio di pagine dei libri si ottiene come media ponderata considerando come rappresentante di ciascuna delle sette classi di frequenza il suo valore centrale (dato dalla semisomma dei due valori estremi della classe) M = 8 25 + 10 75,5 + 73 125,5 + + 16 325,5 8 + 10 + 73 + 80 + 33 + 30 + 16 = 180,3 Per calcolare lo scarto quadratico medio, occorre calcolare la varianza applicando la formula tenendo in considerazione anche le frequenze assolute: σ = (25 180,3)2 8 + 75,5 180,3 2 10 + 250 = 69,29 Possiamo dunque concludere che i libri della biblioteca hanno un numero di pagine che, in media, si discosta di circa 69 pagine dal valor medio.

TABELLE A DOPPIA ENTRATA La statistica di cui ci siamo occupati finora è quella univariata, perché si è occupata di studiare dati provenienti dalle rilevazioni di un solo carattere su una data popolazione; adesso ci occupiamo di vedere come si estendono le nozioni studiate quando i caratteri da analizzare sono due per esempio X e Y. L obiettivo sarà quello di scoprire e mettere in relazione i dati di X e quelli di Y (ad esempio è possibile studiare il legame che esiste tra il peso e l altezza di un gruppo di persone, )

Su una popolazione formata da 5 amici si sono rilevati due caratteri: l età (X) e la città di nascita (Y). I dati grezzi possono essere organizzati nella seguente tabella: NOME ETA CITTA DI NASCITA ALBERTO 30 MILANO MARIA 35 TORINO GIOVANNI 32 MILANO PAOLA 30 MILANO ALESSANDRO 32 ROMA

Costruiamo una tabella delle frequenze ma questa volta a DOPPIA ENTRATA, che riporti le frequenze con cui si manifestano le varie coppie di modalità osservate. Nella prima colonna riportiamo le modalità di X e nella prima riga le modalità di Y. Riassumendo: X\Y Y1 Y2 Y3. YN TOT X1 F(x1) X2 F(x2) X3 F(x3,y3) F(x3) XN F(xn) TOT f(y1) f(y2) f(y3) F(yn) n FREQUENZA ASSOLUTA DI X E Y (CONGIUNTA) DISTRIBUZIONE MARGINALE DI X DISTRIBUZIONE MARGINALE DI Y NUMERO COMPLESSIVO DI UNITA

RIPRENDIAMO L ESEMPIO PRECEDENTE E COSTRUIAMO LA TABELLA A DOPPIA ENTRATA X\Y MILANO TORINO ROMA TOTALE 30 2 0 0 2 32 1 0 1 2 35 0 1 0 1 TOTALE 3 1 1 5 DISTRIBUZIONE MARGINALE DI X DISTRIBUZIONE MARGINALE DI Y NUMERO COMPLESSIVO DI UNITA SE FISSIAMO L ATTENZIONE SULLA PRIMA RIGA (O COLONNA ) DELLA TABELLA POSSIAMO DIRE CHE CIASCUNA DI ESSE, SINGOLARMENTE PRESA, RAPPRESENTA UNA DISTRIBUZIONE CONDIZIONATA DI Y RISPETTO ALLA MODALITA DI X.

E anche possibile costruire le distribuzioni condizionate relative, ponendo a rapporto le frequenze congiunte con i rispettivi totali di riga o colonna. Esempio, in riferimento all esempio precedente, la distribuzione condizionata di X rispetto a y1 è: X X y1 Distribuzione condizionata relativa 30 2 2/3 32 1 1/3 35 0 0/3 totale 3 1

PROVA TU SONO STATI INTERVISTATI I 20 STUDENTI DI UNA CLASSE E SU CIASCUNO SONO STATI RILEVATI CONGIUNTAMENTE I DUE CARATTERI X: IL SESSO E Y: IL N. DI ORE CHE DEDICANO MEDIAMENTE ALLO STUDIO IN UNA GIORNATA. SI SONO OTTENUTI I DATI NELLA SEGUENTE TABELLA: X M M F M M F M F M F F M F M F M F M M F Y 1 2 2 4 3 1 2 3 3 4 2 3 4 2 1 2 3 3 3 4 1. COSTRUISCI UNA TABELLA A DOPPIA ENTRATA CHE ORGANIZZI I DATI GREZZI E INDIVIDUA LE DISTRIBUZIONI MARGINALI DI X E Y. 2. DETERMINA LA DISTRIBUZIONE DI X, CONDIZIONATA ALLA MODALITA «3 ORE DI STUDIO» E LA CORRISPONDENTE DISTRIBUZIONE CONDIZIONATA RELATIVA. 3. DETERMINA LA DISTRIBUZIONE DI Y, CONDIZIONATA ALLA MODALITA «FEMMINA» E LA CORRISPONDENTE DISTRIBUZIONE CONDIZIONATA RELATIVA.

Fine seconda parte Grazie per l attenzione