MATEMATICA E STATISTICA. Dai dati ai modelli, alle scelte: rappresentazione, interpretazione e previsione



Documenti analoghi
La classe che mostra la distribuzione più elevata è quella 60-90, che corrisponde a un uso elevato dell automobile. f i fr (= f i/n) fr% (=fr*100)

b) Relativamente alla variabile PREZZO, fornire una misura della variabilità della distribuzione attraverso

STATISTICA DESCRITTIVA

frazione 1 n dell ammontare complessivo del carattere A x

Indici di Posizione. Gli indici si posizione sono misure sintetiche ( valori caratteristici ) che descrivono la tendenza centrale di un fenomeno

Stim e puntuali. Vocabolario. Cambiando campione casuale, cambia l istogramma e cambiano gli indici

Dimostrazione della Formula per la determinazione del numero di divisori-test di primalità, di Giorgio Lamberti

Elementi di Statistica descrittiva Parte III

Facoltà di Economia - STATISTICA - Corso di Recupero a.a Prof.ssa G. Balsamo CONCETTI di BASE Carattere X [o A ] i = 1

Design of experiments (DOE) e Analisi statistica

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER ATTRIBUTI

Analisi di dati vettoriali. Direzioni e orientazioni

Caso studio 10. Dipendenza in media. Esempio

CORSO DI STATISTICA I (Prof.ssa S. Terzi)

Daniela Tondini

ESERCIZI SU DISTRIBUZIONI CAMPIONARIE

DI IDROLOGIA TECNICA PARTE II

Lezione 4. La Variabilità. Lezione 4 1

Gli indici sintetici Forma. Gli indici sintetici. Gli indici sintetici. Qualche considerazione. Qualche considerazione. Tendenza centrale Forma

LEZIONI DI STATISTICA MEDICA

Incertezza di misura

Classi di reddito % famiglie Fino a Oltre Totale 100

ammontare del carattere posseduto dalle i unità più povere.

Modelli di Flusso e Applicazioni: Andrea Scozzari. a.a

SIMULAZIONE DI ESAME ESERCIZI. Cattedra di Statistica Medica-Università degli Studi di Bari-Prof.ssa G. Serio 1

STATISTICA DESCRITTIVA - SCHEDA N. 3 VARIABILI QUANTITATIVE Indici di centralità, dispersione e forma

In questo capitolo vedremo solamente un caso di rendita, che useremo poi per generalizzare le rendite e dedurre tutti gli altri casi.

Esercitazione 4 del corso di Statistica (parte 1)

III Esercitazione: Sintesi delle distribuzioni semplici secondo un carattere qualitativo ordinale.

Gli indici sintetici Forma. Un caso studio. Gli indici sintetici. Qualche considerazione. Qualche considerazione. Tendenza centrale Forma

Gli indici sintetici Forma. Un caso studio. Gli indici sintetici. Qualche considerazione. Qualche considerazione. Tendenza centrale Forma

pè via che, lì, la media è sempre eguale risurta che te tocca un pollo all'anno: Me spiego: da li conti che se fanno seconno le statistiche d'adesso

Caso studio 12. Regressione. Esempio

ALCUNI ELEMENTI DI STATISTICA DESCRITTIVA

MEDIA DI Y (ALTEZZA):

ARGOMENTO: MISURA DELLA RESISTENZA ELETTRICA CON IL METODO VOLT-AMPEROMETRICO.

STATISTICA Lezioni ed esercizi

UNI CEI ENV (GUIDA ALL ESPRESSIONE DELL INCERTEZZA DI MISURA)

CORSO DI LAUREA IN ECONOMIA AZIENDALE Metodi Statistici per le decisioni d impresa (Note didattiche) Bruno Chiandotto

Variabilità = Informazione

Università di Cassino. Esercitazioni di Statistica 1 del 26 Febbraio Dott. Mirko Bevilacqua

Modello dinamico nello spazio dei giunti: relazione tra le coppie di attuazione ai giunti ed il moto della struttura

Sommario. Facoltà di Economia francesco mola ( ) ( ) Boxplot (grafico a scatola) Esempio riepilogativo sulla forma di una distribuzione

Attualizzazione. Attualizzazione

COMPLEMENTI DI STATISTICA. L. Greco, S. Naddeo

Due distribuzioni, stessa media ma in quale delle due la media rappresenta, sintetizza meglio la situazione?

Due distribuzioni, stessa media ma in quale delle due la media rappresenta, sintetizza meglio la situazione?

Sommario. Corso di Statistica Economia e Commercio. Distribuzioni (cont Distribuzioni di frequenza. Distribuzioni

Esercitazione 6 del corso di Statistica (parte 1)

dei quali si conoscono solo la media x e la deviazione standard σ e dato un valore reale positivo K, possiamo affermare che:

Il campionamento e l inferenza

Caso studio 2. Le medie. Esercizio. La media aritmetica. Esempio

Ellissi di densità costante. Distribuzione normale multivariata. Ellissoidi di isodensità. Esempio isodensità: X~N 2 (μ,σ) Consideriamo

Statistica descrittiva Campioni vettoriali

Corso TFA - A048 Matematica applicata. Didattica della matematica applicata all economia e alla finanza

Esercitazione 5 del corso di Statistica (parte 1)

Istogrammi e confronto con la distribuzione normale

Facoltà di Farmacia Corso di Matematica con elementi di Statistica Docente: Riccardo Rosso

Organizzazione del corso. Elementi di Informatica. Orario lezioni ed esami. Crediti. Dispense e lucidi. Ricevimento studenti

Compito A1- Soluzioni

Dai dati osservati mediante scelta campionaria si giunge ad affermazioni i che riguardano la popolazione da cui essi sono stati prescelti

I percentili e i quartili

ALCUNI ELEMENTI DI TEORIA DELLA STIMA

CORSO DI LAUREA IN ECONOMIA AZIENDALE Metodi Statistici per le decisioni d impresa (Note didattiche) Bruno Chiandotto

y = α + βx + ε Qui ci soffermeremo su un unica classe di modelli, detti modelli statistici lineari. Si veda la seguente figura:

Il modello di regressione lineare semplice (1) Studio della dipendenza riepilogo

STATISTICA DESCRITTIVA

STATISTICA DESCRITTIVA - SCHEDA N. 4 VARIABILI QUANTITATIVE Trasformazioni lineari Indici di covarianza e correlazione

Autori. Versione 2.0. Giorgio Della Rocca (*) Marco Di Zio (*) Orietta Luzi (*) Giorgia Simeoni (*) (*) ISTAT - Servizio MTS (**) ISTAT - Servizio PSM

( ) ( ) ( ) ( ) Mutua variabilità. n n 1. n n 1. n n 1. n n 1

Leasing: aspetti finanziari e valutazione dei costi

Esercizi su Rappresentazioni di Dati e Statistica

La volatilità storica, le misure di rischio asimmetrico e la tracking error volatility

Indici di asimmetria. Elementi di Statistica descrittiva Parte IV. Simmetria di una distribuzione di frequenze. Primo indice di asimmetria (1/3)

Università di Cassino Esercitazioni di Statistica 1 del 5 Febbraio Dott. Mirko Bevilacqua

Università degli Studi di Napoli Parthenope. STATISTICA per il Turismo. IV Lezione

Regressione e Correlazione

Sommario. Facoltà di Economia francesco mola. Distribuzioni (cont.) Distribuzioni di frequenza. Distribuzioni Distribuzioni di quantità

Voti Diploma Classico Scientifico Tecn. E Comm Altro

SECONDA PROVA INTERMEDIA DI STATISTICA CLEA gennaio 2005 COMPITO C2

COMUNE DI MIRANO PROVINCIA DI VENEZIA REGOLAMENTO

x... Gli indici sintetici La media aritmetica Gli indici sintetici Indici assoluti Indici relativi Indici normalizzati Forma

Lezione 1. I numeri complessi

Sommario. Facoltà di Economia. Generalità sulla variabilità A B C. francesco mola. Lezione n 4. Variabilità e Dispersione. Concetto di variabilità

Elementi di Matematica Finanziaria. Rendite e ammortamenti. Università Parthenope 1

LE MEDIE. Quadratica. Italo Nofroni. Statistica medica. Medie. Le medie vengono classificate in due gruppi

Università degli Studi di Napoli Parthenope. Facoltà di Scienze Motorie a.a. 2011/2012. Statistica. Lezione IV

LA FUNZIONE DI VEROSIMIGLIANZA

METODOLOGIA SPERIMENTALE IN AGRICOLTURA

Matematica elementare art.1 di Raimondo Valeri

Statistica descrittiva per l Estimo

CORSO DI STATISTICA I (Prof.ssa S. Terzi) 1 STUDIO DELLE DISTRIBUZIONI SEMPLICI. Esercitazione n 3

valido se i dati E dato da max(x i )-min(x i )

TEST CHI DI INDIPENDENZA STOCASTICA

Capitolo 6 Gli indici di variabilità

Successioni. Grafico di una successione

Corso TFA - A048 Matematica applicata. Didattica della matematica applicata all economia e alla finanza

Seconda Prova Parziale di STATISTICA Modalità A

LE MEDIE. Quadratica. Italo Nofroni. Statistica medica. Medie. Le medie vengono classificate in

Transcript:

MATEMATICA E STATISTICA Da dat a modell, alle scelte: rappresetazoe, terpretazoe e prevsoe Progetto Lauree Scetfche Laborator d Matematca d Geova

Il materal soo l rsultato d 4 a d lavoro coguto tra docet uverstar e segat delle scuole superor ell'ambto del Progetto Lauree Scetfche, Laborator d Matematca d Geova. MOTIVAZIONI E OBIETTIVI Avvcare gl studet al modo d pesare o determstco e ad affrotare argomet co soluzo o uvoche. Le attvtà soo falzzate a forre cocett e metodologe d base della statstca e della probabltà che permettao d terpretare feome aalzzat. I materal e l lavoro proposto soo stutturat modo da presetare sa aspett e rflesso teorche che attvtà propre della pratca statstca. DESCRIZIONE SINTETICA STATISTICA DESCRITTIVA Rappresetazo stetche, grafche e umerche, d dat uvarat e bvarat sa qualtatv e quattatv. Correlazoe e dpedeza leare; rlesso sulle cause drette e drette delle dpedeze e sulla preseza d fattor cofodet. Ce all'aals multvarata co presetazoe degl aspett salet della cluster aalyss. CALCOLO DELLE PROBABILITÀ Come terpretare e studare feome casual. Smulazoe. La probabltà el caso cotuo. Alcue famgle varabl aleatore descrete e cotue. Teorem lmte. STATISTICA INFERENZIALE Costruzoe d semplc modell statstco-probablstc per descrvere e terpretare dat quado quest rguardao ua parte della popolazoe o del feomeo oggetto d studo. Gl error dovut alla formazoe parzale coteuta el campoe soo valutat term probablstc. Lo studo della statstca ferezale è acorato a u tema d pressate attualtà quale cosum delle famgle e prezz. MATERIALI DI LAVORO Mettamo a dsposzoe d tutt gl segat teressat l lavoro fatto ell arco d quattro a, progettato, dscusso, spermetato elle class e revsoato base a rsultat otteut. Lo faccamo perché l ostro gruppo, pur ell autooma ddattca persoale, s è arrcchto ed ha trovato uov sput d segameto, soprattutto per le coesso che la statstca e la probabltà hao co la realtà quotdaa. I quato docet d matematca abbamo apprezzato e valorzzato l aspetto rgoroso e formale che o è usuale e maual scolastc, partcolare per la statstca. Rteamo che questo aspetto, elle dspese prodotte, sa ache d profcuo aggorameto per l docete. Le schede possoo essere usate per la lezoe dell'segate e vao tegrate da dscusso e attvtà al calcolatore (alcue esplctamete prevste); gl esercz e lo studo dvduale e a grupp cosoldao l'appredmeto. C sembra che le attvtà rsulto pù effcac se affacate da dag e soluzo d problem sgfcatv delle sceze, legat alla realtà quotdaa, ad altre dscple e al modo del lavoro. A ttolo d esempo, tra materal sotto rportat, soo preset ache questoar e schede relatv a

dag svolte elle scuole dove è stato spermetato l percorso ddattco ("Che cosa fao dplomat del Lceo", "I prezz d alcu be d cosumo", "L'emgrazoe" ). Le schede rchedoo medamete cascua -4 ore d lavoro classe e altrettate d lavoro a casa da parte de ragazz; segalamo che alcue rchedoo temp pù lugh. È opportuo oltre dedcare alcue ore pratche laboratoro formatco, per fssare le dee o per realzzare auspcabl relaborazo co u buo umero d dat raccolt (per alcue attvtà soo rportate le tracce d svolgmeto co l'utlzzo de software Ecel e Mtab). L'tero percorso va svolto - d orma - tre class successve. I alcu drzz d studo la statstca descrttva e la probabltà soo tem prevst da programm msteral; talue class l umero d ore desgate per la matematca è sgfcatvo; altre stuazo è vece pù dffcle tegrare tutto l percorso dcato e ostr materal. Abbamo prevsto percò ache percors brev, studat per adattars alle dverse stuazo, maera cosoa al rtmo d appredmeto che talora mpoe lmt agl approfodmet. I percors brev o soo rportat questo fasccolo. INDICE MATERIALI DI LAVORO DI QUESTO FASCICOLO STATISTICA DESCRITTIVA Laboratoro Approfod. Varabl qualtatve lab MINITAB lab EXCEL approf_ Varabl quattatve Rappresetazo grafche e quatl approf_ 3 Varabl quattatve lab_-3_minitab Idc d cetraltà, dspersoe e forma lab_-3_excel approf_3 4 Varabl quattatve - Trasformazo lear Idc d covaraza e correlazoe approf_4 5 Regressoe leare semplce approf_5 6 Cluster aalyss PROBABILITÀ Laboratoro Itroduzoe alla probabltà lab_ Ecel_ Le varabl aleatore Es_sch.- 3 Varabl aleatore cotue e smulazoe 4 Idc d poszoe e d dspersoe 5 Somma, dffereza e prodotto d due v.a. lab _ Ecel_5 6 La varable aleatora bomale lab _ Ecel_6 7 La varable aleatora ormale 8 Teorem lmte STATISTICA INFERENZIALE Campoameto e stma Itervall d cofdeza 3 Come l'istat rleva prezz al cosumo

PARTECIPANTI AL PROGETTO Docet uverstar Mara Pera Rogat - Emauela Sasso Ao Scuole superor Isegat Class e studet Mauro Basso 3 L. Sc. PNI Lceo G. BRUNO (ALBENGA, SV) Emauela Carrera Lusella Navoe 4 L. Sc. PNI 4 L. Lg. Sadra Sacchett L. Sc. PNI Lceo Scetfco A. ISSEL (FINALE LIGURE, SV) Domgo Paola 4 L. Sc. PNI 3 Ncoletta Oregga 3 Ragoer Igea (8) I.T.C.G. RUFFINI (IMPERIA) 5 Ragoer "Mercuro" (7) Slva Porrett,, 3, 4 Igea (40 etracurr.) I.I.S. VITTORIO EMANUELE (GENOVA) Crsta Mazzola Guseppe Ferrera 5 IIS Progr. "Mercuro" (4) Lceo G. BRUNO (ALBENGA, SV) Mauro Basso 4 L. Sc. PNI (9) Lceo Scetfco A. ISSEL (FINALE LIGURE, SV) Domgo Paola L. Sc. (9) 4 L. Sc. (6) Ncoletta Oregga II A IGEA (4) I.T.C.G. RUFFINI (IMPERIA) IV A Mercuro () Slva Porrett V A Mercuro () I.I.S. VITTORIO EMANUELE (GENOVA) Crsta Mazzola IV A Mercuro (8) Guseppe Ferrera IV B Mercuro (8) Lceo Scetfco A. ISSEL (FINALE LIGURE, SV) Domgo Paola III - I PNI (45) I.T.C.G. RUFFINI (IMPERIA) Ncoletta Oregga III A Igea () Slva Porrett IV A Prog Mercuro () III A Prog Mercuro () Aa Mara Zolezo IV B Prog Mercuro (6) Guseppe Ferrera V B Progetto Mercuro (4) 4 I.I.S. VITTORIO EMANUELE (GENOVA) Lceo G. BRUNO (ALBENGA, SV) Adrea Gacobbe V A Progetto Mercuro (8) Crsta Mazzola Mauro Basso III A PNI (4) Ncola Merola IV gaso (9) Lceo Scetfco A. ISSEL (FINALE LIGURE, SV) Domgo Paola IV C (6) - V B (6 parzale) Lceo Scetfco Leoardo da Vc (GENOVA) Lceo Scetfcao Veusseu (IMPERIA) Daela Gallott Leoardo Bosell III B PNI (9) Mara Lusa Maro III C blgue (8) Studet d SMID collaborator per le attvtà al calcolatore Federco Rotolo - Margherta Sato - Valeta Togo

MATEMATICA E STATISTICA Da dat a modell, alle scelte: rappresetazoe, terpretazoe e prevsoe www.dma.uge/pls_statstca

PARTE SCHEDE DI STATISTICA DESCRITTIVA

Matematca e statstca: da dat a modell alle scelte www.dma.uge/pls_statstca Resposabl scetfc M.P. Rogat e E. Sasso (Dpartmeto d Matematca Uverstà d Geova) STATISTICA DESCRITTIVA - SCHEDA N. VARIABILI QUALITATIVE. Le varabl qualtatve Ua caratterstca (o varable) s dce qualtatva se è u attrbuto o msurable. Ad esempo: l geere, l colore degl occh (a lvello macroscopco), l lvello d scolartà, etc. Precsamo che talvolta ua varable msurable può essere cosderata qualtatva quado o s utlzzao le msure ella determazoe del valore. Ad esempo el caso del sesso o d altr attrbut fsc s possoo msurare quattà legate al DNA che forscoo formazo sulla varable, ma quado s usao le modaltà mascho o femma o s fa rfermeto a tal quattà. I rsultat assut (es M e F per l geere) s chamao modaltà o lvell. Spesso s codfcao co valor umerc Ad esempo M e F per l geere, oppure aalfabeta, elemetare, meda 3, superore 4, uverstà 5 per l lvello d scolartà. Metre el secodo caso la codfca umerca corrspode a u orde crescete d lvello d scolartà, le modaltà della varable geere o soo ordabl. Se le modaltà hao u orde trseco, le varabl s dcoo ordal, altrmet s dcoo omal.. La dstrbuzoe d ua varable qualtatva e le sue rappresetazo: le tabelle d cotgeza e dagramm a barre Le rappresetazo usual per le varabl qualtatve soo le tabelle d cotgeza (o semplcemete tabelle) e dagramm a barre (o stogramm). Osservamo che per le varabl omal l'orde delle modaltà elle tabelle e elle rappresetazo grafche è arbtraro. Nelle tabelle d cotgeza ad og valore della varable è assocato l umero delle volte cu tale valore s rscotra elle osservazo oppure la sua frequeza relatva ( /). La tabella co le frequeze relatve vee ache detta tabella della dstrbuzoe della varable. I dagramm a barre soo rappresetazo grafche cu elle ascsse soo rportat valor assut dalla varable e ordata cotegg o le frequeze. ESEMPIO: Cosderamo la suddvsoe de grupp sagug (A; B; AB;0) ua popolazoe caucasca. Cotegg A B AB 0 60 6 7 66 49 40.3 0.7 4.7 44.3 00 Frequeze percetual Numero d persoe co l gruppo A Frequeza percetuale delle utà che hao AB come gruppo Numero d osservazo effettuate Tabella. Rappresetazoe della dstrbuzoe d ua varable qualtatva Statstca descrttva scheda.

Cotegg Percetual 70 50 60 45 40 50 35 40 30 30 5 0 0 5 0 0 A B AB 0 0 5 0 A B AB 0 Fgura. Dagramm a barre per cotegg e la dstrbuzoe d ua varable qualtatva Osservamo che le due rappresetazo grafche soo dverse solo per quato rguarda la scala delle ordate. Per approdre le otazo sulle tabelle d cotgeza per la dstrbuzoe delle varabl ved Appedce. 3. La dstrbuzoe coguta d due varabl qualtatve: le tabelle d cotgeza a due etrate e alcue dagramm a barre I rsultat della rlevazoe d due caratterstche qualtatve X e Y sulla stessa popolazoe d umerostà possoo essere schematzzat co tabelle d cotgeza a due etrate, coè tabelle cu l umero ella poszoe j dca l coteggo j oppure la frequeza f j ( j /) dell osservazoe X e Yj. La tabella co le frequeze relatve vee ache detta tabella della dstrbuzoe coguta d X e Y. ESEMPIO: La tabella seguete mostra dat espress percetuale d 60 laureat Matematca presso l Uverstà d Geova egl a 990-993 e l tempo d attesa della prma occupazoe. E da otare che l questoaro è stato fatto el 994 e qud dat de quattro a o soo omogee tra loro (ad esempo o c possoo essere laureat del 993 che hao trovato lavoro dopo u ao). Percetuale degl tervstat laureat el 99 E che hao trovato lavoro etro 6 mes. Qud l coteggo assoluto sarà 6 (0*60/00) Coloa delle frequeze delle class ANNI (otteuta sommado le rghe) ANNI\TEMPO <6 mes 6- mes > mes Dsoccup. TOTALE 990.5.5 0.0 3.5 8.5 99 5.5.5.0 7.5 7.5 99 0.0 3.5 3.5 0.0 7.0 993 4.0 4.0 0.0 9.0 7.0 TOTALE 4.0.5 5.5 40.0 00 Rga delle frequeze delle class TEMPO DI ATTESA (otteuta sommado le coloe) Percetuale degl tervstat che hao trovato lavoro dopo u ao dalla laurea Tabella. Rappresetazoe della dstrbuzoe coguta d due varabl qualtatve L ultma rga e l ultma coloa soo dette dstrbuzo margal (o total) delle caratterstche qualtatve studate. Per approfodre le otazo sulle tabelle d cotgeza a due ve ved Appedce. Statstca descrttva scheda.

I dagramm a barre permettoo d rappresetare le dstrbuzo margal. Talvolta è evdezata ache la dstrbuzoe coguta ma la vsualzzazoe come s vede ella Fgura è qualche modo asmmetrca. 40 Varable Dsoccup. > mes 6- mes <6 mes 40 ANNI 993 99 99 990 30 30 Cotegg 0 Cotegg 0 0 0 0 ANNI 990 99 99 993 0 <6 mes 6- mes > mes Dsoccup. Fgura. Dagramm a barre per le dstrbuzo margal co evdezate la dstrbuzoe coguta. 4. I profl rga e profl coloa e le loro rappresetazo Uo studo completo d due varabl qualtatve X e Y comprede ache l esame del comportameto d ua varable rspetto all altra. Ua lettura approssmatva della tabella d cotgeza potrebbe codurre a cocluso o guste. Nell esempo de laureat, la percetuale rspetto al totale d ch ha trovato lavoro da 6 a mes dopo la laurea è la stessa per laureat el 990 (.5%) e el 99 (.5%). Ma per cofrotare temp d attesa della prma occupazoe e dvers a bsoga teer coto ache d quate persoe s soo laureate cascu ao e qud è opportuo cofrotare valor co la percetuale de laureat e due a. La frequeza relatva dell osservazoe Yj, cooscedo X è l rapporto fra l la frequeza d f j e la frequeza totale f delle osservazo X. Quest dat s possoo vsualzzare ua uova tabella (tabella de profl rga). Rpredamo l esempo de laureat. La tabella de profl rga espress percetuale dveta: ANNI\TEMPO <6 mes 6- mes > mes Dsoccup. TOTALE 990 67.6 3.5 8.9 00 99 56.4 9. 7.3 7.3 00 99 37.0 3.0 3.0 00 993 0.0 70.4 00 Nel 990 la percetuale d laureat che hao trovato lavoro fra 6- mes è 3.5%, el 99 è 9.% Tabella 3. Rappresetazoe de profl rga ESERCIZO Completa la tabella calcolado quattro valor macat. Se s cosdera la varable X codzoata da Y s costruscoo maera aaloga le tabelle de profl coloa. Nell esempo: Statstca descrttva scheda. 3

ANNI\TEMPO <6 mes 6- mes > mes Dsoccup. 990 9.8 0.0 8.8 99 36.9 0.0 36.4 8.8 99 3.8 8.0 5.0 993 9.5 3.0 0.0 TOTALE 00 00 00 00 Tabella 4. Rappresetazoe de profl coloa Percetuale d laureat el 99 tra quell che hao trovato lavoro da 6 a mes dopo la laurea ESERCIZO. Completa la tabella calcolado tre valor macat 40 30 0 0 0 990 99 99 993 Fgura 3. Dagramma a barre del proflo coloa relatvo a ch ha trovato lavoro meo d 6 mes. I profl rga permettoo d evdezare se la varable Y rsete del codzoameto della varable X. I partcolare, se le rghe della tabella (o corrspodet dagramm a barre) soo sml s può potzzare che le due varabl o s codzoo. Aalogo dscorso vale per profl coloa. Nell esempo de laureat, l cofroto de dagramm a barre delle frequeze del tempo d attesa della prma occupazoe relatv a sgol a (coè la rappresetazoe grafca profl rga, ved Fgura 4) mostra ua dpedeza dal tempo d attesa e l ao d laurea. Rcordamo però che l dage è stata fatta el 994 e qud le ultme due coloe de quattro a o soo omogee fra loro. I geerale, quado s terpretao dat, è sempre opportuo rferrs all ambto el quale soo stat raccolt. Tempo d occupazoe de laureat del 990 Tempo d occupazoe de laureat del 99 70 60 60 50 50 40 percetual 40 30 percetual 30 0 0 0 0 0 <6 mes 6- mes > mes Dsoccup. 0 <6 mes 6- mes > mes Dsoccup. Tempo d occupazoe de laureat del 99 Tempo d occupazoe de laureat del 993 40 70 60 30 50 percetual 0 percetual 40 30 0 0 0 0 <6 mes 6- mes > mes Dsoccup. 0 <6 mes 6- mes > mes Dsoccup. Fgura 4. Dagramm a barre de profl rga. Statstca descrttva scheda. 4

Quest dagramm a barre s possoo ache cofrotare co quello de temp d attesa del totale de laureat tervstat (otteuto dall ultma rga della tabella d cotgeza) Tempo d occupazoe del totale de laureat dal 990 al 993 40 30 percetual 0 0 0 <6 mes 6- mes > mes Dsoccup. Fgura 5. Dagramma a barre del totale coloa. Tale dagramma s può pesare come grafco medo della popolazoe de laureat cosderat, dove la meda è pesata rspetto alla percetuale de laureat e dvers a. Vedamo, ad esempo, come s può calcolare la percetuale d ch ha trovato lavoro etro 6 mes rspetto al totale della popolazoe a partre da profl rga e dal totale per ao. - el 990 soo l 67.6% del 8.5% del totale de laureat, coè l.74 ( 0.676 0.85) - el 99 soo l 56.4% del 7.5% del totale de laureat, coè l 5.55 - e così va ANNI <6 mes TOTALE 990 67.6 8.5 99 56.4 7.5 99 37.0 7.0 993 4.8 7.0 Sommado quest valor s ha la percetuale d ch ha trovato lavoro etro 6 mes rspetto al totale della popolazoe: 0.676 0.85 + 0.564 0.75 + 0.370 0.70 + 0.48 0.70 0.4 Sarebbe stato sbaglato fare ua meda o pesata de valor de profl rga, coè: (0.676 + 0.564 + 0.370 + 0.48)/4 0.4394 Essedo mede pesate de profl, le dstrbuzo margal soo dette ache dstbuzo mede. Per cofrotare meglo profl rga co l totale (o meda) geerale de laureat s possoo cosderare le dffereze de profl dal totale: ANNI\TEMPO <6 mes 6- mes > mes Dsoccup. 990 5.6.0-5.5 -. 99 4.4-3.4.8 -.7 99-5.0 0.5 7.5-3.0 993-7..3-5.5 30.4 Tabella 5. Rappresetazoe delle dffereze de profl rga dalla dstrbuzoe totale (o margale o meda) della varable coloa Osservamo che la somma per rga delle devazo de profl rga dal totale è 0. Ache valor d questa tabella possoo essere rappresetat grafcamete, come s vede ella seguete fgura. Statstca descrttva scheda. 5

<6 m 6- m > m Dsocc. 990 99 30 5 0 0-5 30 5 0-5 99 993 0-30 -30 <6 m 6- m > m Dsocc. Fgura 6. Dagramm a barre delle dffereze de profl rga dalla dstrbuzoe totale (o margale o meda) della varable coloa. 5. L dpedeza Vedamo u altro modo per studare la macaza d legam fra le varabl. Se soo fssate le dstrbuzo margal, come deve essere la tabella d cotgeza della dstrbuzoe coguta se o c soo legam fra gl a d laurea e l tempo d attesa della prma occupazoe? Ad esempo, la frequeza degl studet che s soo laureat el 990 e che hao trovato lavoro etro 6 mes sarà l 8.5% del 4%, ovvero l 7.7%. I geerale, caso d asseza d legam (o d dpedeza), og cella della tabella della dstrbuzoe coguta c dovrebbe essere l prodotto de margal corrspodet. ANNI\TEMPO <6 mes 6- mes > mes Dsoccup. TOTALE 990 7.7.3.0 7.5 8.5 99.5 3.5.5.0 7.5 99.4 3.4.5 0.7 7.0 993.4 3.4.5 0.7 7.0 TOTALE 4.0.5 5.5 40.0 00.0.57.5/00 Tabella 6. Rappresetazoe della dstrbuzoe coguta d due varabl qualtatve el caso d dpedeza Naturalmete ua tabella d questo tpo sarà dffclmete otteble elle rlevazo spermetal, ma - come el caso de profl cu s osserva se c è somglaza co l proflo margale permette d avere u elemeto d cofroto rspetto a dat osservat. DOMANDA: Come s potrebbe msurare la dstaza fra la tabella de dat osservat e la tabella dell dpedeza? Statstca descrttva scheda. 6

S osserv che legame o codzoameto d due varabl o sgfca che ua varable è causa dell altra. Nel caso degl a d laurea e l tempo d attesa della prma occuapazoe, s può dre temp d attesa varao (o o) a secoda degl a d laurea ; ma geerale dat da sol - o forscoo formazo sulla causaltà de feome. Vedamo u altro esempo. ESEMPIO: I ua dage svolta modo accurato su u campoe umeroso d doe egl Stat Ut egl a 30 s è trovato u forte legame fra l avere l cacro a polmo e l portare le calze d seta. Che cosa se e deduce? vsto che o può essere che l cacro a polmo duca le doe a portare le calze d seta allora l portare le calze d seta favorsce l cacro al polmoe Che cosa c è detro? codzo soco-cultural fumo calze d seta cacro al polmoe Da dat s osserva l legame dcato co lea uta seza frecca; evetual causaltà, dcate co lee tratteggate, possoo essere dvduate studado a fodo l problema. Statstca descrttva scheda. 7

ESERCIZI ) A faco soo rportat dat raccolt su 5 soggett per due varabl che hao le modaltà codfcate co 0 e. Costrure due tabelle d cotgeza a due etrate co valor cogut delle due varabl, ua co valor assolut e l altra co quell percetual A B 0 0 0 0 0 0 0 0 0 0 0 ) Nella tabella a faco soo rportat dat (cotegg) rguardat ua secoda dage su temp d attesa della prma occupazoe d laureat Matematca a Geova, smle a quella esamata ella scheda. I questo caso l dage è stata codotta alla fe del 000. I rga gl a d laurea, coloa temp d attesa d prma occupazoe. <6 mes 6- > Dsoccup. mes mes 996 5 4 6 997 8 7 3 998 7 8 3 0 999 7 8 000 0 4 a) Costrure ua tabella co la dstrbuzoe coguta dell ao d laurea e del tempo d attesa e le due dstrbuzo margal. b) Costrure profl rga e opportue rappresetazo grafche. c) Cosderamo l tempo d attesa della prma occupazoe. Utlzzado la dstrbuzoe (margale) del tempo d attesa dell dage 990-994 e quella dell dage 996-000, calcolare la dstrbuzoe totale per gl 8 a seme. d) Aalzzamo legam fra le tabelle delle due dag separate e le corrspodet tabelle co dat d tutt 9 a. Dre se soo ugual o dverse a. la tabella della dstrbuzoe coguta ao/tempo d attesa b. la tabella de profl rga c. la tabella de profl coloa 3) La seguete tabella rporta la dstrbuzoe della popolazoe resdete Itala al Cesmeto del 98 secodo due caratter: l ttolo d studo (Y) e l ramo d attvtà (X): X Y laureat dplomat lceza meda lceza elemetare total Agrcoltura 3 77 33 634 Idustra 0 95 74 373 756 Commerco 63 497 80 489 339 trasport e 9 55 464 476 4 comuc. credto e asscuraz. 76 447 4 70 97 pubblca amms. 784 30 46 03 445 Total 75 359 65 8000 8855 I dat mglaa soo d abtat, fote ISTAT. Nella tabella o soo cosderat resdet prv d ttolo d studo. Statstca descrttva scheda. 8

a) Costrute la tabella d cotgeza della dstrbuzoe coguta (X,Y). b) Costrute le due dstrbuzo d frequeza margal e due dagramm a barre che le rappreseto. Rspodete po alla seguete domada: data la dstrbuzoe delle frequeze cogute ha vsto come sa possble otteere le dstrbuzo margal. È vero che date le due dstrbuzo margal è possble, geerale, rsalre alla dstrbuzoe delle frequeze cogute? Perché? I geerale, cooscedo le dstrbuzo margal, co quate celle vuote possamo acora rcostrure la tabella? c) Costrute le tabelle de profl rga e de profl coloa delle due varabl X e Y. d) Che cosa pesate s possa dre relatvamete al codzoameto d ua delle due varabl rspetto all altra? E relatvamete alla dpedeza causale d Y da X e d X da Y? Gustfcate la vostra rsposta. e) Dscutete su questo esempo la frase: l aals de profl rga e quella de profl coloa porta alle stesse cocluso, camba solo l ottca co cu studare l feomeo. 4) La seguete tabella rporta la dstrbuzoe della popolazoe resdete Itala al Cesmeto del 00 secodo due caratter: l ttolo d studo (Y) e l ramo d attvtà (X). (dat rete sul sto ISTAT). SEZIONI DI ATTIVITÀ ECONOMICA Laurea Dploma uvers. o smle Dploma d scuola sec. sup. Grado d struzoe Lceza d scuola meda Lceza d scuola elemetare Nessu ttolo d studo Totale Agrcoltura 6.300 4.050 5.565 47.9 374.408 6.36.53.678 Idustra 344.850 43.886.406.304 3.94.435 948.994 90.5 7.08.98 Commerco 8.37 3.457.630.4.697.09 463.3 35.9 3.986.538 Trasport e comucazo Credto e asscurazo, servz alle mprese, oleggo 5.39 6.878 436.7 379.64 97.698 7.779 979.09 55.449 3.79.69.80 55.06 39.73 3.88.05.68 Altre attvta'.304.837 79.338.46.84.40.038 335.906 36.4 5.79.85 Totale.407.99 397.40 8.84.656 7.406.98.59.960 36.74 0.993.73 a) Rcavare da quest dat ua la tabella l pù smle possble a quella dell eserczo precedete e scegledo ua aals per rga o per coloa effettuare cofrot su cambamet avveut e 0 a cosderat. Statstca descrttva scheda. 9

5) La seguete tabella rporta la dstrbuzoe de decess per fasce d età (Y) e per sesso (X) della popolazoe talaa ell ao 00 (fote ISTAT): Mort per età e sesso Ao 00 M F TOT 0-4 a 563 774 5-9 a 343 57 95 0-39 a 8379 366 645 40-54 a 630 938 5558 55-69 a 573 3075 87947 70-79 a 8833 6405 5436 80-89 a 797 05664 84936 90 e oltre 6856 6633 9379 TOTALE 7996 8094 560390 a) Costrure la tabella d cotgeza co valor percetual della dstrbuzoe coguta (X,Y). b) Costrure le due dstrbuzo d frequeza margal e due dagramm a barre che le rappreseto. c) Date le due dstrbuzo margal è possble, rsalre alla dstrbuzoe delle frequeze cogute? Come s fa? Statstca descrttva scheda. 0

. Le lste o le tabelle a ua etrata APPENDICE: NOTAZIONI I valor d ua lsta (o tabella a ua etrata ) soo spesso dcat utlzzado la poszoe che occupao. Ad esempo ella seguete tabella cotegg soo dcat co,,, e le frequeze percetual co f, f, f, f. 3 4 3 4 U geerco elemeto è dcato co A B AB 0 60 6 7 66 40.3 0.7 4.7 44.3 o co f. Bsoga precsare qual valor può assumere l dce ; el ostro caso va da a 4 e s scrve:,..., 4. Per ua tabella geerca co I celle (o caselle) s scrve:,..., I. Attezoe alle lettere mauscole e muscole.. Le poszo e gl elemet d ua tabella a due etrate Le celle d ua tabella soo spesso dcate co ua coppa d valor che corrspodoo alla loro poszoe (come el goco della battagla avale, ma co umer sa per le coordate orzzotal che per le coordate vertcal). Il prmo valore s rfersce alla poszoe sulle rghe e l secodo alla poszoe sulle coloe. Ad esempo la cella d poszoe (3, ) è ella terza rga e ella secoda coloa (escluse la coloa e la rga d testazoe), qud è la cella ANNI\TEMPO <6 mes 6- mes > mes Dsoccup. 990.5.5 0.0 3.5 99 5.5.5.0 7.5 99 0.0 3.5 3.5 0.0 993 4.0 4.0 0.0 9.0 I geerale la cella d poszoe (, j) s trova ella geerca rga e ella geerca coloa j, co,..., I e co j,..., J. Nel ostro esempo co,..., 4 e co j,..., 4. La tabella che stamo cosderado cotee le frequeze relatve percetual: dchamo co f 3, l valore 3.5 che corrspode alla percetuale d coloro che s soo laureat el 99 (3 rga) e hao trovato lavoro dopo 6- mes. I geerale l coteuto delle celle d questa tabella è dcato co f j (seza la vrgola) co,..., I e co j,..., J. 3. Le somme f, j oppure pù semplcemete co Per dcare somme d tutt gl elemet d ua lsta s scrve ad esempo: 4 f che s legge somma per che va da a 4 d f e corrspode a f + f + f 3 + f 4 Sotto l sego d somma (o sommatora) s mette la lettera co l dce e, dopo l sego uguale, l valore zale, sopra a s mette l valore fale. 4 4 Qud possamo scrvere: f 00 (oppure ) e. Statstca descrttva scheda.

Le cose s complcao u po quado abbamo due dc come ua tabella a doppa etrata. Cosderamo uovamete la tabella ANNI\TEMPO <6 mes 6- mes > mes Dsoccup. 990.5.5 0.0 3.5 99 5.5.5.0 7.5 99 0.0 3.5 3.5 0.0 993 4.0 4.0 0.0 9.0 Che cosa vuol dre e quato vale: 4 f 3 j? j Vuol dre che sto cosderado la terza rga (prmo dce uguale a 3 fssato) e facco la somma de valor d tutte le coloe d questa rga; qud l rsultato è 7.0. Talvolta questo valore, coè l totale margale, s dca ache co f 3 oppure co f 3+ 4 Che cosa vuol dre e quato vale: f? Acora pù complcato: possamo avere ache due somme ua detro l altra: 4 4 f 4 4 j che s scrve ache fj j j Questo corrspodere a: 4 4 4 4 4 fj + fj + f3j + f 4j j j j j qud complessvamete: f + f + f + f + f + f + f + f + f + f + f + f + f + f + f + f Quato vale l rsultato? ( ) ( ) ( ) ( ) 3 4 3 4 3 3 33 34 4 4 43 44 Statstca descrttva scheda.

Matematca e statstca: da dat a modell alle scelte www.dma.uge/pls_statstca Resposabl scetfc M.P. Rogat e E. Sasso (Dpartmeto d Matematca Uverstà d Geova) LABORATORIO EXCEL XLSTAT 008 SCHEDA VARIABILI QUALITATIVE DESCRIZIONE DEI DATI DA ESAMINARE A u campoe d studet del Mchga è stata posta ua sere d domade per capre qual erao loro obettv per l futuro. I partcolare, soo stat terrogat su quale aspetto tra grado d struzoe ragguta, pratca d uo sport, aspetto fsco e stuazoe ecoomca sao pù fluet per avere ua buoa popolartà. Nel questoaro soo stat oltre rchest geere, lvello scolastco e altre formazo demografche. S vogloo aalzzare dat raccolt che s trovao el dataset Studets Goal. Numero de ragazz tervstat: 478 Nom delle varabl:. Geere: mascho (M) o femma (F). A: età dello studete 3. Dstretto della scuola: rurale (rural), suburbao (suburba), urbao (urba) 4. Obettv: alto grado d struzoe (), essere popolare (), essere u bravo sportvo (3) 5. Istruzoe: raggugere u buo lvello d struzoe è molto mportate(), mportate (), abbastaza mportate (3), poco mportate (4) per la popolartà 6. Sport: pratca dello sport è molto mportate (), mportate (), abbastaza mportate (3), poco mportate (4) per la popolartà 7. Aspetto: essere bell è molto mportate (), mportate (), abbastaza mportate (3), poco mportate (4) per la popolartà 8. Sold: avere molt sold è molto mportate (), mportate (), abbastaza mportate (3), poco mportate (4) per la popolartà ANALISI STATISTICA IN EXCEL Izamo co l aals descrttva delle varabl cosderate sgolarmete. Essedo tutte varabl qualtatve, le rappresetazo usual soo le tabelle d cotgeza o dagramm a barre. Premessa: Il lavoro è basato su u frequete uso delle tabelle pvot. Rcordare che lo strumeto fuzoa su dat codfcat. Prma della creazoe del grafco, è opportuo sostture la codfca co l terme corrspodete. Per ascodere camp pvot clccare su uo d ess co l tasto destro del mouse.. Tabelle d cotgeza (a ua va) - Selezoare tutta la tabella Studets' Goal (clc prma cella Mausc+Ctrl+Fe) - Dat Rapporto Tabella pvot Layout Coloa trascare Geere - Nell area tera trascare geere (coteggo d geere) boy grl Totale complessvo - Copare la Tabella Modfca Icolla specale - Sputare Valor Calcolare percetual 7 5 478 47,49% 5,5% 00,00% Commeto: masch e le femme soo pressoché ugualmete rappresetat. Statstca descrttva Laboratoro scheda.

. Dagramm a barre e dagramm crcolar per sgole varabl Varable A - Accertars che sa selezoata tutta la tabella Studets' Goal - Dat Rapporto Tabella pvot Layout Rga trascare A ell area tera trascare A (coteggo d a) - Creazoe gudata grafco Commeto: gl a pù rappresetat soo 0 e. Varable Obettv - Accertars che sa selezoata tutta la tabella Studets' Goal - Dat Rapporto Tabella pvot Layout Rga trascare Obettv ell area tera trascare Obettv (coteggo d obettv) - Creazoe gudata grafco Commeto: I ragazz preferscoo raggugere u buo grado d struzoe Varable Dstretto - Accertars che sa selezoata tutta la tabella Studets' Goal - Dat Rapporto Tabella pvot Layout Rga trascare Dstretto ell area tera trascare Dstretto (coteggo d dstretto) - Creazoe gudata grafco a torta - Opzo grafco etchette dat Percetuale Commeto: dstrett scolastc soo pressoché ugualmete rappresetat. Dall aals appea svolta, s capsce che, per compredere meglo le opo de ragazz tervstat, è ecessara u aals crocata delle varabl. Ad esempo può essere teressate cooscere se gl obettv soo ugual per Masch e Femme? Oppure se l dstretto scolastco d apparteeza flueza gl obettv de ragazz? Statstca descrttva Laboratoro scheda.

3. Tabelle d cotgeza a due ve 3. Tabella de cotegg Varabl: Obettv e Geere - Accertars che sa selezoata tutta la tabella Studets' Goal - Dat Rapporto Tabella pvot Layout Rga trascare Obettv Coloa trascare Geere ell area tera trascare Geere (coteggo d geere) - Copare la Tabella Modfca Icolla specale - Sputare Valor Calcolare percetual Commet: Raggugere u buo lvello d struzoe è l prmo obettvo per masch e femme. Ua percetuale d femme maggore rspetto a quella de masch prefersce raggugere ua buoa popolartà puttosto che eccellere ello sport. 3. Profl rga Varabl: Obettv e Dstretto - Accertars che sa selezoata tutta la tabella Studets' Goal - Dat Rapporto Tabella pvot Layout Rga trascare Dstretto Coloa trascare Obettv ell area tera trascare Dstretto (coteggo d Dtretto) - Copare la Tabella Modfca Icolla specale - Sputare Valor Calcolare percetual Commeto: l dstretto scolastco d apparteeza e gl obettv sembrao dpedet. Statstca descrttva Laboratoro scheda. 3

4. Rappresetazoe grafca d pù varabl. 4. Dagramm d ua varable suddvs secodo lvell d u altra varable (profl) Varabl: Obettv e Dstretto A faco la rappresetazoe grafca della tabella precedete de profl rga 4. Dagramm a barre d ua varable co evdezata la dstrbuzoe d u altra varable cascua barra (dstrbuzoe coguta) Varabl: Obettv e Dstretto - Accertars che sa selezoata tutta la tabella Studets' Goal - Dat Rapporto Tabella pvot Layout Rga trascare Obettv Coloa trascare Dstretto ell area tera trascare Dstretto (coteggo d Dstretto) - Grafco automatco Nota: per modfcare color clccare sulla zoa che teressa; tasto destro; Formato sere dat Commet: Per ragazz che provegoo da u dstretto scolastco suburbao e urbao è pù mportate raggugere u buo lvello d struzoe. Per ragazz proveet da u dstretto scolastco rurale tre obettv s equvalgoo. 5. Altre tabelle d cotgeza co profl rga e coloa e corrspodet stogramm Varabl: Istruzoe e Geere - Accertars che sa selezoata tutta la tabella Studets' Goal - Dat Rapporto Tabella pvot Layout Rga trascare Istruzoe Coloa trascare Geere ell area tera trascare Geere(coteggo d Geere) Statstca descrttva Laboratoro scheda. 4

- Copare la Tabella Modfca Icolla specale - Sputare Valor Calcolare percetual Aalogamete s ottegoo le tabelle seguet, trascado l campo che teressa, scelto ella festra che appare co Eleco camp tabella pvot: Commet: S ota che o c è dpedeza fra la varable geere e le varabl aspetto, sold e sport. Metre sa masch che femme valutao approssmatvamete allo stesso modo l mportaza d ua buoa struzoe per otteere popolartà. Commeto: come precedeza, s ota che eccellere ello sport sembra essere molto mportate per masch, ma o per le femme. Statstca descrttva Laboratoro scheda. 5

Dagramm crcolar d ua varable suddvs secodo lvell d u altra varable (profl) Dalla seguete tabella pvot: s possoo sceglere, usado l meu a teda, le ragazze o ragazz, otteedo seguet dagramm, uo per masch e uo per le femme: Statstca descrttva Laboratoro scheda. 6

LABORATORIO MINITAB N. VARIABILI QUALITATIVE DESCRIZIONE DEI DATI DA ESAMINARE A u campoe d studet del Mchga soo state poste ua sere d domade per capre qual obettv s pogoo per l futuro. I partcolare, soo terrogat su quale aspetto tra grado d struzoe ragguta, pratca d uo Sport, Aspetto fsco e Stuazoe Ecoomca sao pù fluet per avere ua buoa popolartà. Nel questoaro vegoo oltre rchest geere, lvello scolastco e altre formazo demografche. S vogloo aalzzare dat. Numero de ragazz tervstat: 478 Nom delle varabl:. Geere: mascho (M) o femma (F). A: età dello studete 3. Dstretto della scuola: rurale (rural), suburbao (suburba), urbao (urba) 4. Obettv: alto grado d struzoe (), essere popolare (), essere u bravo sportvo (3) 5. Istruzoe: raggugere u buo lvello d struzoe è molto mportate(), mportate (), abbastaza mportate (3), poco mportate (4) per la popolartà 6. Sport: pratca dello sport è molto mportate (), mportate (), abbastaza mportate (3), poco mportate (4) per la popolartà 7. Aspetto: essere bell è molto mportate (), mportate (), abbastaza mportate (3), poco mportate (4) per la popolartà 8. Sold: avere molt sold è molto mportate (), mportate (), abbastaza mportate (3), poco mportate (4) per la popolartà I dat soo raccolt el dataset: Studets Goal ANALISI STATISTICA IN MINITAB Izamo co l aals descrttva delle varabl cosderate sgolarmete. Essedo tutte varabl qualtatve, le rappresetazo usual soo le tabelle d cotgeza o dagramm a barre.

Tabelle d cotgeza (a ua va) Colums: Geere boy grl All 7 5 478 47,49 5,5 00,00 Cell Cotets: Cout % of Total Commeto: masch e le femme soo ugualmete rappresetat. Dagramm a barre e dagramm crcolar per sgole varabl Stat Table Descrptve Statstcs Selezoare Geere elle Categorcal varables for colums. Nel meu Categorcal Varables, sceglere cout (per cotegg) e Total percet (per le frequeze). 00 50 Chart of a Graph Bar Chart Smple Selezoare A Graph varables. Se s clcca sulle barre del grafco, s leggoo esattamete cotegg. Cout 00 50 Commet: gl a pù rappresetat soo 0 e. 0 7 9 0 a 3 50 Obettv Graph Bar Chart Smple Selezoare Obettv Graph varables. cotegg 00 50 00 Commet: I ragazz preferscoo raggugere u buo grado d struzoe. 50 0 Istruzoe Popolarta` Sports 37,% Dstretto scolastco 3,% Rural Suburba Urba Graph Pe Chart Selezoare Chart couts of uque values e Dstretto Scolastco per Categorcal varables. Selezoare el meu Labels Percet per avere le percetual. Commeto: dstrett scolastc soo ugualmete rappresetat. 3,6%

Dagramm a barre d pù varabl u uco pael 50 00 50 Istruzoe 60 0 80 40 Sport Graph Hystogram Smple Selezoare Graph varables Istruzoe, Sport, Aspetto e Sold e sceglere el meu Multple Graphs l opzoe I separate paels of the same graph. Frequecy 0 00 50 00 50 0 3 Aspetto 3 4 4 0 40 80 0 60 0 3 Sold 3 4 4 Commeto: I ragazz pesao che per la popolartà sa mportate eccellere uo Sport e avere ua bella preseza. Metre Sold o servoo per la popolartà. Dall aals appea svolta, s capsce che, per compredere meglo le opo de ragazz tervstat, è ecessara u aals crocata delle varabl. Ad esempo può essere teressate cooscere se gl obettv soo ugual per Masch e Femme? Oppure se l dstretto scolastco d apparteeza flueza gl obettv de ragazz? Tabelle d cotgeza a due ve - cotegg Rows: Obettv Colums: Geere boy grl All 7 30 47 5,54 5,79 5,67 50 9 4,03 36,5 9,50 3 60 30 90 6,43,95 8,83 All 7 5 478 00,00 00,00 00,00 Cell Cotets: - profl rga Cout % of Colum Rows: Dstretto scolastco Colums: Obettv 3 All Rural 38,6 33,56 8,9 00,00 Suburba 57,6 7,8 4,57 00,00 Urba 57,87 7,53 4,6 00,00 All 5,67 9,50 8,83 00,00 Stat Tables Descrptve statstcs Selezoare come Categorcal varables For rows: Obettv For colums: Geere. Selezoare el meu Categorcal varables l opzoe Couts per avere cotegg e Colums percet per avere la tabella proflo coloa. Commet: Raggugere u buo lvello d struzoe è l prmo obettvo per Masch e Femme. Metre ua percetuale d femme maggore rspetto a masch prefersce raggugere ua buoa popolartà puttosto che eccellere ello Sport. Stat Tables Descrptve Statstcs Selezoare come Categorcal varables For rows: Dstretto scolastco For Colums: Obettv Selezoare el meu Categorcal varables l opzoe Rows percet per avere la tabella proflo rga. Cell Cotets: % of Row Commeto: l dstretto scolastco d apparteeza e gl obettv sembrao dpedet. Passamo ora alla rappresetazoe grafca d pù varabl.

Dagramm a barre d ua varable suddvs secodo lvell d u altra varable (profl) Rural Chart of Obettv Suburba 3 00 75 50 Graph Bar Chart Smple Selezoare Obettv Graph varables e el meu Multple Graphs, sceglere Dstretto scolastco by varables wth groups separate paels 5 Cout 00 Urba 0 75 50 5 0 Pael varable: Dstretto scolastco 3 Obettv Dagramm a barre d ua varable co evdezata la dstrbuzoe d u altra varable cascua barra (dstrbuzoe coguta) 50 00 Obettv vs Dstretto scolastco Dstretto scolastco Urba Suburba Rural Graphs Bar Charts Selezoare Couts of uque values Stack Selezoare come Categorcal varables Obettv e Dstretto scolastco ( questo orde!) Cout 50 00 50 0 Obettv struzoe popolarta` sports Nota: per modfcare color clccare sulla parte d barra da modfcare po Attrbutes Fll patter Selezoare Custom. I Backgroud color sceglere l colore. Commet: Per ragazz che provegoo da u dstretto scolastco suburbao e urbao è pù mportate raggugere u buo lvello d struzoe. Per ragazz proveet da u dstretto scolastco rurale tre obettv s equvalgoo. Tabelle d cotgeza a due ve co profl rga e coloa Rows: Istruzoe Colums: Geere Rows: Sport Colums: Geere boy grl All 4,49 58,5 00,00 49,59 50,4 00,00 3 50,38 49,6 00,00 4 46,88 53,3 00,00 All 47,49 5,5 00,00 boy grl All 76,97 3,03 00,00 38,96 6,04 00,00 3 7,68 7,3 00,00 4 9,5 80,85 00,00 All 47,49 5,5 00,00 Cell Cotets: % of Row Cell Cotets: % of Row

Rows: Aspetto Colums: Geere Rows: Sold Colums: Geere boy grl All 3,78 76, 00,00 58,73 4,7 00,00 3 58,4 4,58 00,00 4 75,76 4,4 00,00 All 47,49 5,5 00,00 boy grl All 50,00 50,00 00,00 4,67 57,33 00,00 3 53,03 46,97 00,00 4 45,57 54,43 00,00 All 47,49 5,5 00,00 Cell Cotets: % of Row Cell Cotets: % of Row Commet: S ota che o c è dpedeza fra la varable geere e le varabl aspetto, sold e sport. Metre sa masch che femme valutao approssmatvamete allo stesso modo l mportaza d ua buoa struzoe per otteere popolartà. 80 60 40 0 Geere grl boy Ad esempo, eccellere ello sport sembra essere molto mportate per masch, ma o per le femme. Cout 00 80 60 40 0 0 Sport molto mport mport abb mport poco mport Dagramm crcolar d ua varable suddvs secodo lvell d u altra varable (profl) Quato l'aspetto e` mportate per la popolarta`? boy grl Category molto mport mportate abbastaza mport poco mport Le femme reputao pù mportate avere u bell aspetto.,0% 9,4% 6,0% 3,6% 6,7% 0,7% 6,4% 56,% Graphs Pe Chart Selezoare Chart couts of uque values e Aspetto come Categorcal varables. Nel meu Multple Graphs selezoare Geere by varables wth groups o same graph el sotto meu by varables e o the same graph el sottomeu multple varables. Nota: per modfcare color procedere come per dagramm a barre

Matematca e statstca: da dat a modell alle scelte www.dma.uge/pls_statstca Resposabl scetfc M.P. Rogat e E. Sasso (Dpartmeto d Matematca Uverstà d Geova) STATISTICA DESCRITTIVA - SCHEDA N. VARIABILI QUANTITATIVE Rappresetazo grafche e quatl Ua varable s dce quattatva se è ua gradezza msurable. Per esempo: l peso, l altezza, l reddto, etc L seme de valor assut dalla varable e le frequeze corrspodet è detto dstrbuzoe: qud se dfferet valor assut dalla varable soo m, dcado co k tal valor e co f k le corrspodet frequeze, allora la dstrbuzoe è l seme delle coppe ( k, f k ) per k da a m. Attezoe alle otazo. Idchamo: - co l umero d osservazo, co m l umero d dfferet valor assut dalla varable; - co l valore della -esma osservazoe e co k l k-esmo valore de dat o rpetut. ESEMPIO. Nella tabella a sstra soo rportat alcu dat osservat su u campoe d 8 studet (og rga corrspode alle dverse rlevazo su u dvduo). Il peso è arrotodato per semplctà a chlogramm. La varable N. SCARPA pur assumedo valor ter, è meglo classfcable come varable qualtatva ordale fatt o corrspode strettamete a ua msura. Sesso Scarpa Peso M 43 65 M 43 6 F 39 50 F 37 50 F 37 47 F 36 47 F 38 56 F 38 57 M 43 73 M 45 85 M 4 68 M 4 68 M 43 85 F 37 56 M 4 73 M 4 65 M 4 73 M 40 70 Tabella. Data set I dat rguardao 8 studet (8) metre dfferet pes soo solo 0 (m0). La prma e terza rga della tabella qu sotto soo la dstrbuzoe della varable peso. Peso ( k ) cotegg ( k ) frequeze (f k ) 47 50 56 57 6 65 68 70 73 85 3 0. 0. 0. 0.06 0.06 0. 0. 0.06 0.6 0. Tabella. Dstrbuzoe del peso Noostate le rappresetazo grafche che trodurremo sao pù effcac se l umero d osservazo è elevato, egl esemp per semplctà tratteremo poche osservazo.. Dagramma d dspersoe Il modo pù semplce d rappresetare grafcamete la dstrbuzoe d X è quello d costrure l dagramma d dspersoe (dotplot). È smle al dagramma a barre per le varabl qualtatve: s ottee rportado u grafco u puto per og valore assuto dalla varable. Sull asse orzzotale soo rappresetat valor d X: corrspodeza a og valore assuto s dsega u umero d put proporzoale al umero delle osservazo. Statstca descrttva scheda.

ESEMPIO (cotua) Il dot- plot per dat precedet è l seguete. Fgura. Dot-plot della varable Peso Se valor delle osservazo dfferet soo ftt e umeros, molt software statstc troducoo approssmazo ella scala de valor d X e ad og puto fao corrspodere pù utà spermetal.. Fuzoe d dstrbuzoe cumulata. U ulterore rappresetazoe d ua varable quattatva X è la fuzoe d dstrbuzoe cumulata F (o d rpartzoe), ovvero F() è la frequeza f d tutte le osservazo mor o ugual a ; coè F() f(x ) fk k, co k Per approdre le otazo sulle somme ved Appedce 3 della Scheda. ESEMPIO (cotua). Per costrure la fuzoe d dstrbuzoe cumulata s aggugoo alla tabella della dstrbuzoe della varable e le frequeze relatve cumulate (otteute sommado le frequeze relatve de dat feror o ugual al valore cosderato). Nel caso della varable PESO. Peso 47 50 56 57 6 65 68 70 73 85 frequeza 0. 0. 0. 0.06 0.06 0. 0. 0.06 0.6 0. freq. cum. 0. 0. 0.33 0.39 0.45 0.56 0.67 0.73 0.89,00 Frequeza delle osservazo mor o ugual a 56 (0.330.+0.+0,) Tabella. Dstrbuzoe e dstrbuzoe cumulata della varable Peso Per trodurre u mor umero d error d approssmazoe può essere pù opportuo costrure la fuzoe d dstrbuzoe cumulata a partre da cotegg cumulat. Peso 47 50 56 57 6 65 68 70 73 85 cotegg 3 cot. cum. 4 6 7 8 0 3 6 8 freq. cum. 0. 0. 0.33 0.39 0.45 0.56 0.67 0.73 0.89,00 Tabella 3. Cotegg, cotegg cumulat e dstrbuzoe cumulata della varable Peso Statstca descrttva scheda.

La fuzoe d dstrbuzoe cumulata avrà l seguete grafco Osservamo che la fuzoe d dstrbuzoe cumulata è defta ache corrspodeza d valor o assut da dat. Ad esempo, ache se essu soggetto ha peso 60 kg, possamo comuque dre che la frequeza relatva de soggett co peso more o uguale a 60 è 0.39. Ioltre la fuzoe vale 0 per tutt valor feror al pù pccolo e per tutt quell superor al pù grade. NB: Questo a faco è l grafco d ua fuzoe. Fgura. Fuzoe d dstrbuzoe cumulata della varable Peso La fuzoe d dstrbuzoe cumulata è ua fuzoe a scal e ha le seguet propretà. F è ua fuzoe crescete o costate;. corrspodeza d og puto d salto la fuzoe assume l valore a sstra. 3. la fuzoe vale 0 per og valore more all osservazoe mma e vale per og valore maggore o uguale all osservazoe massma. Il software Mtab o costrusce esattamete l grafco della fuzoe d dstrbuzoe cumulata, ma le seguet due rappresetazo grafche. Emprcal CDF of Peso Emprcal CDF of Peso 00 00 80 80 Percet 60 40 Percet 60 40 0 0 0 0 50 60 70 Peso 80 90 50 60 70 Peso 80 90 Fgura. Dstrbuzoe cumulata della varable Peso co Mtab Osservamo che la prma rappresetazoe o è l grafco della fuzoe d dstrbuzoe cumulata ( a ua corrspodoo pù y ). La secoda è l grafco d ua fuzoe (trae el mmo assuto dalla varable), otteuta da F terpolado put. Etrambe le rappresetazo sarao utlzzate seguto. Da quato vsto sopra rsulta evdete che la fuzoe d dstrbuzoe cumulata F e la fuzoe delle frequeze soo rcavabl ua dall altra. Statstca descrttva scheda. 3

3. Quartl e quatl. Può essere teressate pors l problema verso del precedete., ovvero voler cooscere l valore per cu tra le osservazo ordate c è ua frequeza assegata d valor mor o ugual a tale valore. ESEMPIO (cotua). Qual è l valore cetrale de pes? ovvero qual è l valore per cu c soo metà persoe co u peso ferore e metà persoe co u peso superore? Oppure qual è l valore del prmo quarto de pes ordat? E dell ultmo quarto? Le domade poste soo realtà u po ambgue. Fgura 3. Dstrbuzoe cumulata del Peso Pù precsamete, s defscoo: Medaa (Q): l mmo valore osservato tale che almeo l 50% (/)de dat è more o ugual a questo. Prmo quartle (Q) l mmo valore osservato tale che almeo l 5% (/4) de dat è more o ugual a questo. Terzo quartle (Q3) l mmo valore osservato tale che almeo l 75% (3/4) de dat è more o ugual a questo. ESEMPIO (cotua). Per rspodere alle domade precedet usado le defzo corrette, utlzzamo l grafco della fuzoe d dstrbuzoe cumulata. Cosderamo l prmo quartle Q (5%). Sull asse delle ordate s dvdua l puto 0.5 e da questo s tracca ua lea orzzotale: questo caso la lea o terseca l grafco della fuzoe d dstrbuzoe cumulata. Il mmo valore osservato la cu fuzoe d dstrbuzoe cumulata supera 0.5 è 56; F(50)0. e F(56)0.33. Fgura. (rpetuta) Possamo determare quartl ache usado la lsta ordata de dat rpetut. Nell esempo della varable PESO s ha:. orde 3 4 5 6 7 8 9 0 3 4 5 6 7 8 valor 47 47 50 50 56 56 57 6 65 65 68 68 70 73 73 73 85 85 Medaa: le due osservazo cetral (oo e decmo dato) soo 65 qud la medaa è 65. Statstca descrttva scheda. 4

Q: l prmo quarto de dat ordat, ha u valore more o uguale a 56. Ifatt 0.584,5 e la quta osservazoe è 56. Q3: l terzo quarto de dat ordat è more o uguale a 73. Ifatt 0.7583,5 e la quattordcesma osservazoe è 73. I geerale, dato α, compreso tra 0 e, s dce α-esmo quatle (ad esempo α0.0) l mmo valore osservato per cu almeo l α-esma parte (l 0%) de dat rsulto mor o ugual a questo: l valore dell α-esmo quatle è: m{ osservato tale che F() α} Se α è espresso forma percetuale, vece che d quatl s parla d percetl. I pratca, per calcolare l valore dell α-esmo quatle, è suffcete sceglere l -esmo dato, dove è l approssmazoe per eccesso del prodotto Nα (N è l umero totale delle osservazo). Ad esempo l 0.-quatle è l quarto dato (80.3,6 4). Attezoe: quatl soo de valor e o delle poszo. NB: Molt software (come Mtab e Ecel ) hao dvers algortm per calcolare quatl. È da osservare che el caso cu l umero delle osservazo sa molto elevato quest tedoo a cocdere. ESEMPIO (cotua). Il software Mtab calcola quatl terpolado valor della fuzoe: come s vede dal grafco a faco per l 0-esmo percetle. I valor fort da Mtab per la varable Peso soo: Varable N Mmum Q Meda Q3 Mamum Peso 8 47.00 54.50 65.00 73.00 85.00 Fgura 4. Dstrbuzoe cumulata del Peso Due dc che forscoo formazo sulla dspersoe dell seme de dat osservat soo: l valore Ma- M, detto ache msura dell tervallo d varazoe o rage; ell esempo: 85-47, coè 38. l valore Q3-Q, detto dstaza terquartle (IQR, dall glese Iter Quartle Rage) e cocde co l ampezza dell tervallo cu s trova almeo l 50% de dat. Nell esempo precedete, usado valor d Mtab, IQR73-54.5, coè 8.5. La medaa forsce formazo sulla cetraltà delle osservazo. Ne coosc altr? 4. Bo-plot Ua rappresetazoe grafca che s basa sulla defzoe de quatl è l bo-plot. Pur foredo mor formazo rspetto alla fuzoe d dstrbuzoe cumulata, permette d descrvere la varable maera stetca ed è molto utle per cofrotare sottogrupp d dat. L dea è quella d dvduare co ua scatola le osservazo cetral e co de baff o code uscet dalla scatola le osservazo pù estreme. Vedamo come s costrusce a partre dal dotplot: s dsega ua scatola tra valor Q e Q3. Co ua lea vertcale s dvdua la medaa (Q). Statstca descrttva scheda. 5

ESEMPIO (cotua). Per l Peso, usado quartl fort da Mtab, s ottee: S dsegao po baff che soo lugh al pù ua volta e mezza la dstaza terquartle e termao corrspodeza del dato pù lotao dalla scatola ferore a tale valore. I valor lmte L e R per baff soo qud: LQ-,5XIQR e RQ3+,5XIQR. I valor che rmagoo al d fuor de lmt R e L, s dvduao co astersch. Nell esempo: L 54.5-.5 8.5 6.75 R 73+.5 8.5 00.75 Qud baff s fermao al valore mmo e a quello massmo. Fgura 5. Costruzoe del bo-plot Nel boplot o vegoo dsegat put rappresetat dat, ma solo la scatola, baff e gl evetual dat estrem. Come gà detto boplot soo molto utl per cofrotare dat d sottogrupp d soggett, ESEMPIO. Soo stat rlevate le pulsazo cardache u muto d u gruppo d studet. Alcu d quest prma della rlevazoe hao effettuato u muto d corsa, altr o. Il boplot a faco rappreseta dat dell tero gruppo d studet. S può osservare che 4 studet hao pulsazo o soo comprese e baff. I dat così rappresetat però o soo omogee; ovvamete le pulsazo varao molto tra ch ha corso e ch o ha corso. 40 30 0 0 00 90 80 70 60 Fgura 6. Bo-plot delle pulsazo cardache 50 Qu sotto soo rappresetat boplot per due grupp. Statstca descrttva scheda. 6

40 30 0 0 00 90 80 70 60 50 S può osservare che le due dstrbuzo assumoo valor su tervall dvers e che cascu quartle delle pulsazo d ch o ha corso è pù basso del corrspodete quartle d ch ha corso. Ioltre le pulsazo d ch o ha corso soo pù cocetrate sa ella parte cetrale che elle code. Ache le smmetre soo dverse, partcolare baff soo pù asmmetrc per ch ha corso. Questo e la maggore dspersoe della dstrbuzoe s possoo spegare pesado che la reazoe alla corsa vara molto da dvduo a dvduo: la dspersoe aumeta e questo avvee soprattutto per valor alt. SI NO Fgura 7. Bo-plot delle pulsazo cardache per grupp 4. Istogramma Ife vedamo ua rappresetazoe grafca o sempre effcace: l stogramma. S suddvde l tervallo cu varao dat class (preferblmete d uguale ampezza) e s assega og osservazoe rlevata alla classe corrspodete. La scelta del umero d class o è dfferete: troppo poche appattscoo l grafco fo a rederlo sgfcate; troppe class troducoo tra le barre oscllazo eccessve, che potrebbero dstruggere l evetuale regolarta dell stogramma. L stogramma s dsega come dagramm a barre per le varabl qualtatve, ma facedo attezoe che rettagol vertcal devoo essere adacet ed avere come vertc put che separao le class. ESEMPIO (cotua). Cosderamo la varable PESO dell esempo precedete. cotegg 5 4 3 peso Cotegg frequeze 40-49,% 50-59 5 7,5% 60-69 5 7,5% 70-79 4,8% 80-89,% 0 40 50 60 70 80 90 Fgura 8. Istogramma della varable Peso La rappresetazoe de dat tramte stogramm è da usare co molta cautela perché la suddvsoe de dat class è geere arbtrara, partcolare se le class soo ampe o se dat soo poch. Solo cas partcolar le class soo stablte dal cotesto che s sta esamado; ad esempo scaglo d reddto,... Statstca descrttva scheda. 7

ESEMPIO (cotua). Rprededo l esempo della varable Peso. Se s suddvde l tervallo de dat osservat 0 class s ottee l stogramma a faco e questa rappresetazoe sembra durre cocluso dfferet dalla precedete. cotegg 4 3 Fgura 9. Istogramma della varable Peso co class d uguale ampezza 0 45 53 6 69 77 85 Nel caso cu s scelgao class co ampezza dfferete s devoo costrure rettagol la cu AREA sa proporzoale alla frequeza. Nel caso cu s scelgao class d uguale ampezza, l fatto che l area sa proporzoale all ampezza segue dal fatto che le altezze delle barre lo soo. 5 4 3 Fgura 0. Istogramma della varable Peso co class d dversa ampezza 0 40 50 60 70 90 ESEMPIO 3. Nella seguete tabella soo rportat dat relatv all'epoca d costruzoe delle abtazo del Comue d Geova (Cesmeto geerale della popolazoe 99). Il umero d abtazo è mglaa. epoca pre 99 9 46 46 6 6 7 7 8 8 87 0ltre 86. abtaz. 36 70 04 30 35 5 dove co s è dcato l fatto che la classe è chusa a sstra, co è, ad esempo 9 46 corrspode all'tervallo [9, 46). Cosderamo, per semplctà della rappresetazoe, che la prma classe z al 850. Come s vede, le class hao ampezza dversa; qud per avere ua rappresetazoe grafca sgfcatva bsoga fare modo, ad esempo, che le 36 mla case costrute dal 850 al 98 (69 a) abbao mor peso rspetto a quello delle 70 mla abtazo costrute dal 99 al 945 (7 a). Per questo l'stogramma vee costruto co le aree d cascua classe proporzoal alle frequeze: le altezze devoo essere qud proporzoal rapporto fra l'ampezza dell'tervallo e le frequeze. Calcolamo qud, per cascua classe, l'ampezza dell'tervallo (base) e la corrspodete altezza. epoca 850 99 9 46 46 6 6 7 7 8 8 87 87 amp. classe 69 7 5 0 5 5. abtaz. 36 70 04 30 35 5 alt. stogr.97`.59 6.93 3.0 3.8.0 Statstca descrttva scheda. 8