Introduzione. Che cosa è la statistica? La statistica è una disciplina che si occupa dell analisi quantitativa dei fenomeni collettivi.

Documenti analoghi
Lezione 4. La Variabilità. Lezione 4 1

Variabilità = Informazione

LA FUNZIONE DI VEROSIMIGLIANZA

MEDIA DI Y (ALTEZZA):

LE MEDIE. Quadratica. Italo Nofroni. Statistica medica. Medie. Le medie vengono classificate in due gruppi

Due distribuzioni, stessa media ma in quale delle due la media rappresenta, sintetizza meglio la situazione?

Facoltà di Economia - STATISTICA - Corso di Recupero a.a Prof.ssa G. Balsamo CONCETTI di BASE Carattere X [o A ] i = 1

Due distribuzioni, stessa media ma in quale delle due la media rappresenta, sintetizza meglio la situazione?

Università di Cassino. Esercitazioni di Statistica 1 del 26 Febbraio Dott. Mirko Bevilacqua

Esercitazione 4 del corso di Statistica (parte 1)

Caso studio 12. Regressione. Esempio

Gli indici sintetici Forma. Un caso studio. Gli indici sintetici. Qualche considerazione. Qualche considerazione. Tendenza centrale Forma

Gli indici sintetici Forma. Gli indici sintetici. Gli indici sintetici. Qualche considerazione. Qualche considerazione. Tendenza centrale Forma

SECONDA PROVA INTERMEDIA DI STATISTICA CLEA gennaio 2005 COMPITO C2

Caso studio 10. Dipendenza in media. Esempio

pè via che, lì, la media è sempre eguale risurta che te tocca un pollo all'anno: Me spiego: da li conti che se fanno seconno le statistiche d'adesso

Esercitazione 6 del corso di Statistica (parte 1)

LE MEDIE. Quadratica. Italo Nofroni. Statistica medica. Medie. Le medie vengono classificate in

CORSO DI STATISTICA I (Prof.ssa S. Terzi)

Quale retta? La retta migliore è quella che più si avvicina all insieme dei 115

I percentili e i quartili

Università di Cassino Esercitazioni di Statistica 1 del 5 Febbraio Dott. Mirko Bevilacqua

Gli indici sintetici Forma. Un caso studio. Gli indici sintetici. Qualche considerazione. Qualche considerazione. Tendenza centrale Forma

Daniela Tondini

DATA MINING PER IL MARKETING (63 ore)

Statistica descrittiva per l Estimo

Analisi dei Dati. La statistica è facile!!! Correlazione

INDICI DI VARIABILITA

Compito A1- Soluzioni

LEZIONI DI STATISTICA MEDICA

Istogrammi e confronto con la distribuzione normale

dei quali si conoscono solo la media x e la deviazione standard σ e dato un valore reale positivo K, possiamo affermare che:

Esercitazione 5 del corso di Statistica (parte 1)

Capitolo 6 Gli indici di variabilità

y = α + βx + ε Qui ci soffermeremo su un unica classe di modelli, detti modelli statistici lineari. Si veda la seguente figura:

Indipendenza in distribuzione

Indici di asimmetria. Elementi di Statistica descrittiva Parte IV. Simmetria di una distribuzione di frequenze. Primo indice di asimmetria (1/3)

Stima puntuale Quando un parametro della popolazione incognito è valutato (stimato) da una sola statistica (parametro) tratto da un campione

Variabili casuali doppie

Classi di reddito % famiglie Fino a Oltre Totale 100

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 9: Covarianza e correlazione

( ) 2 i 1 X. n(n + 1) a) si determini se sono corretti; b) per quelli non corretti, si calcoli la distorsione d;

Dott.ssa Marta Di Nicola

Dai dati osservati mediante scelta campionaria si giunge ad affermazioni i che riguardano la popolazione da cui essi sono stati prescelti

Esercitazione 3 del corso di Statistica (parte 1)

Il termine regressione fu introdotto da Francis Galton ( ), antropologo (promotore dell eugenetica).

SIMULAZIONE DI SISTEMI CASUALI 1 parte. Variabili casuali e Distribuzioni di variabili casuali. Calcolo delle probabilità

Università egli Studi di Bergamo Corso di laurea in Ingegneria Edile STATISTICA Stima di massima verosimiglianza

( ) ( ) ( ) ( ) Mutua variabilità. n n 1. n n 1. n n 1. n n 1

Seconda Prova Parziale di STATISTICA Modalità A

PROVA SCRITTA DI STATISTICA (COD ) 4 Febbraio 2004 MODALITÀ A APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE

LA REGRESSIONE LINEARE SEMPLICE

Soluzione degli esercizi sulla statistica descrittiva e gli intervalli di confidenza

Il campionamento e l inferenza

Voti Diploma Classico Scientifico Tecn. E Comm Altro

12/11/2015 STATISTICA 1. Esercitazione 4. Dott.ssa Vera Gurtovaya

Stim e puntuali. Vocabolario. Cambiando campione casuale, cambia l istogramma e cambiano gli indici

Università degli Studi di Napoli Parthenope. STATISTICA per il Turismo. IV Lezione

Sommario. Facoltà di Economia. Generalità sulla variabilità A B C. francesco mola. Lezione n 4. Variabilità e Dispersione. Concetto di variabilità

Caso studio 2. Le medie. Esercizio. La media aritmetica. Esempio

x... Gli indici sintetici La media aritmetica Gli indici sintetici Indici assoluti Indici relativi Indici normalizzati Forma

Contenuti. Facoltà di Economia. Scatterplot o diagramma a dispersione Analisi grafica della relazione tra due. francesco mola.

La media aritmetica. Le medie. Esempio. Esempio. Media aritmetica Mediana. Medie analitiche Medie di posizione. x 1

Regressione e Correlazione

III Esercitazione: Sintesi delle distribuzioni semplici secondo un carattere qualitativo ordinale.

MISURE DI TENDENZA CENTRALE. Psicometria 1 - Lezione 2 Lucidi presentati a lezione AA 2000/2001 dott. Corrado Caudek

Esercizi su Rappresentazioni di Dati e Statistica

Costruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini e Leonardo Bertini. Lezione 2:

Ellissi di densità costante. Distribuzione normale multivariata. Ellissoidi di isodensità. Esempio isodensità: X~N 2 (μ,σ) Consideriamo

Statistica descrittiva Campioni vettoriali

ELEMENTI DI STATISTICA

valido se i dati E dato da max(x i )-min(x i )

STATISTICA DESCRITTIVA - SCHEDA N. 3 VARIABILI QUANTITATIVE Indici di centralità, dispersione e forma

CORSO DI STATISTICA I (Prof.ssa S. Terzi) 1 STUDIO DELLE DISTRIBUZIONI SEMPLICI. Esercitazione n 3

frazione 1 n dell ammontare complessivo del carattere A x

Elementi di Statistica descrittiva Parte II

ρ XY risponde alla domanda esiste un associazione lineare tra le variabili X e Y?

ANALISI DELLA REGRESSIONE ANALISI BIVARIATA DELLA REGRESSIONE

La media aritmetica. La sua individuazione si basa sulla logica della trasferibilità di un carattere. Se la funzione f( ) corrisponde alla somma:

Università degli Studi di Napoli Parthenope. Facoltà di Scienze Motorie a.a. 2011/2012. Statistica. Lezione IV

Soluzione degli esercizi del capitolo 11

exp("# (al posto di n) var Ca Coefficiente di asimmetria, indipendente dal valore dei parametri. f X DISTRIBUZIONE EV1 o DI GUMBEL.

Funzioni di più variabili Massimi e Minimi una funzione definita in un insieme E. Un punto ( x0, y0)

Statistica descrittiva

Esercizi 12/10/2007. oppure B 0. In modo del tutto analogo AB 0 se e solo se. oppure B 0 B 0. Studio del segno di una disequazione polinomiale.

Unità 11. Studio di più variabili. Interpolazione. Regressione. Correlazione. Notazione matriciale

Matematica elementare art.1 di Raimondo Valeri

Analisi di una distribuzione. Analisi di una distribuzione

casuale tra 1 e 100; il campione sarà formato dalle unità con le 8, 100, 88, 39, 29 potrà essere più selezionato).

x... Gli indici sintetici La media aritmetica Gli indici sintetici Indici assoluti Indici relativi Indici normalizzati Forma

Elementi di Statistica descrittiva Parte III

Sommario. Corso di Statistica Facoltà di Economia. Indici Statistici di posizione o locazione Medie (cont.) Moda Mediana. Lezione n 5.

LE MEDIE. Le Medie. Medie razionali. Medie di posizione

Teoria dei Fenomeni Aleatori AA 2012/13

I Appello di Calcolo delle Probabilità Cognome: Laurea Triennale in Matematica 2011/12 Nome: 1 febbraio

Le misure di variabilità

La classe che mostra la distribuzione più elevata è quella 60-90, che corrisponde a un uso elevato dell automobile. f i fr (= f i/n) fr% (=fr*100)

Var iabili aleatorie continue

CENNI DI STATISTICA DESCRITTIVA BIVARIATA DISTRIBUZIONI MARGINALI RETTA DI REGRESSIONE. Angela Donatiello 1

Transcript:

Itroduzoe L approcco co ua uova dscpla o sempre è ottmale. U modo per redere pù leare l appredmeto d ua qualsas matera, e, acor pù, della statstca, è rspodere a delle domade come le seguet. Che cosa è la statstca? La statstca è ua dscpla che s occupa dell aals quattatva de feome collettv. Che cosa soo feome collettv? Soo feome compost da u gra umero d utà elemetar, ma che sfuggoo all osservazoe dretta. Possoo essere studat rlevado su cascua utà gl aspett msurabl rteut mportat e aalzzado modo opportuo le msure otteute. Il metodo statstco permette d far emergere delle regolartà che o potrebbero essere otate altrmet. L seme degl studet d u corso uverstaro. Qual soo le caratterstche degl studet? U campoe d elettor estratto per stmare la proporzoe d favorevol al capo d govero. L seme de potezal pazet sofferet d pertesoe. Il farmaco A è mglore del farmaco B per regolarzzare la pressoe?

C soo tre cocett legat al feomeo collettvo: l cocetto d utà, l cocetto d carattere e l cocetto d processo d rlevazoe. Che cos è u utà statstca? E l ettà elemetare del feomeo collettvo. Spesso defta come utà d osservazoe. L seme delle utà vee defto popolazoe. Che cos è u carattere? Il carattere rappreseta ua delle caratterstche del feomeo collettvo e le sue possbl mafestazo s chamao modaltà. Che cos è l processo d rlevazoe? E ecessaro trapredere u processo d rlevazoe durate l quale cascua utà vee osservata per vedere come le caratterstche questoe s mafestao. Esso cosste ell assocare a cascua utà del collettvo ua e ua sola modaltà del carattere. La modaltà d u carattere è uo de possbl mod co cu l carattere s può mafestare. Tp d carattere Caratter cotu (quattatv) Le modaltà possoo essere espresse da qualsas umero reale compreso u tervallo. (Altezza, peso.)

Caratter dscret ( quattatv) Le modaltà soo umer atural ( ter ). D solto dervao da u operazoe d coteggo. (Numero d fgl, voto ad u esame ) Caratter qualtatv Le modaltà o soo espresse da umer real. D solto soo degl attrbut.( Sesso, relgoe.) Possoo essere ordal (esempo l ttolo d studo:seza ttolo, lceza elemetare, lceza meda, dploma, laurea ), coè possoo essere ordate; possoo ache essere o ordal (esempo la professoe). Che cos è la frequeza assoluta? La frequeza assoluta è l umero d volte cu vee osservata ua determata modaltà. Le modaltà vegoo deotate co,...,,, le frequeze assolute co,...,, La somma d tutte le frequeze assolute è uguale al umero delle osservazo totale N N Che cos è la frequeza relatva? 3

La frequeza relatva è l rapporto tra la frequeza assoluta e l totale delle osservazo. La somma d tutte le frequeze relatve è uguale a. Vee deotata co, f f. f f,..., Soo stat aalzzate le forme co le qual dat statstc s possoo presetare: forma dstrbutva per utà (eumeratva) e per raggruppameto d modaltà (tabellare). U terzo modo d presetazoe delle rlevazo statstche è la forma grafca. Le formazo statstche vegoo rappresetate medate dseg e schem grafc (d atura dversa) fuzoe della dspobltà de dat e delle faltà dell dage. Il grafco d gra luga pù utlzzato è l stogramma. E u grafco adatto al cofroto d dat quattatv, rappresetat co superfc rettagolar d uguale base e d altezza varable. Vee utlzzato molto spesso quado s hao delle frequeze: u esempo potrebbe essere l umero d televsor possedut co le relatve frequeze. U altro grafco che spesso s ota e lbr d statstca è l dagramma a torta. La torta rappreseta l tero e le fette le dvso (percetual). U esempo (dal lbro del prof. Pccolo) potrebbe essere la suddvsoe de tp d dplom secodar. Molto spesso s effettua la dstzoe tra dagramma a barre e stogramma ache se alcu autor o evdezao tale dverstà. 4

Il dagramma a barre vee utlzzato specalmete per le varabl dscrete (esempo precedete de tv). L stogramma vee utlzzato per le varabl cotue (esempo della durata de bra muscal). Idc d poszoe La statstca descrttva è composta da var dc: d poszoe, d dspersoe o varabltà e d forma. Lo scopo prcpale degl dc d poszoe è quello d forre u valore umerco capace d rappresetare stetcamete tutt dat d u certo seme. Gl dc d poszoe pù utlzzat soo: la meda artmetca, la medaa, quartl e la moda. I questa lezoe esamamo l pù mportate degl dc d poszoe: la meda artmetca. La meda artmetca, o semplcemete meda, s calcola molto semplcemete e s dca co la lettera greca μ: Ovvero:... Esempo umerco: 5

calcolare la meda artmetca delle età de seguet studet: 8 ; ; 3 ; 6 ; 8 ; 5 ; 8 ; 5 ; 9 ; 6 La meda è μ =. Propretà della meda artmetca Le propretà della meda artmetca soo le seguet: È sempre compresa tra u valore mmo e u valore massmo (teraltà d Cauchy); La somma degl scart dalla meda è sempre uguale a zero 0 Se la varable X ha meda μ, allora la varable ax+b, otteuta medate ua combazoe leare, ha meda aμ+b. La meda artmetca è l uco valore che rede mma la somma degl scart al quadrato. La meda artmetca ha u grave dfetto: è fluezata da valor aomal, specalmete se la umerostà del collettvo è basso. La meda artmetca, el caso d dstrbuzoe per frequeze, s calcola: k 6

Altr dc d poszoe L dce d poszoe pù mportate e pù oto è la meda artmetca che è stata aalzzata ella secoda lezoe. Ora esamamo altr due dc d poszoe: la moda e la medaa. La moda (Mo) d ua dstrbuzoe d frequeza è la modaltà cu corrspode la massma frequeza, assoluta o relatva. La moda è l uco dce d poszoe che è valdo ache per le dstrbuzo qualtatve e può essere calcolato seza effettuare alcu tpo d calcolo (fao eccezoe dstrbuzo class). I ua dstrbuzoe può verfcars la preseza d due o pù mode: quest cas s dce che la dstrbuzoe è bmodale o multmodale. La moda preseta alcu dfett grav: l pù grave è che dffclmete la moda è la modaltà rappresetatva della dstrbuzoe. Esempo umerco: cosderamo ua dstrbuzoe d 30 famgle. Og modaltà rappreseta l umero de compoet della famgla stessa. ;;;;;;;;3;3;3;3;4;4;4,5;5;5;6;6;6;7;7;7;7;8;8;8;9;9. La moda è ma certamete o sembra la modaltà pù rappresetatva. I ua dstrbuzoe d frequeza l calcolo della moda è acora pù semplce: basta osservare l valore pù alto ella coloa delle frequeze e la modaltà corrspodete sarà la moda. 7

modaltà frequeze 5 6 6 7 8 8 4 9 0 E evdete che la moda è 7 perché è la modaltà co la frequeza pù alta (8). Medaa U dce d poszoe pù rappresetatvo è scuramete la medaa. La medaa (Me) è la modaltà che dvde due part ( bpartsce ) la dstrbuzoe ordata de dat. Per varabl dscrete X, sgolarmete osservate e ordate, la medaa è Me se se è par è dspar Esempo umerco:,, 3, 5, 6, 8, 5, 9 = 8 8

La medaa è Il rsultato è 5,5. 4 5 dove e 6 4 5 5 Altro esempo:, 5, 6, 8, 8, 9, = 7 La medaa è 4 ovvero 8. Questo valore lasca tre elemet alla sua sstra e tre alla sua destra. ( l 50% della dstrbuzoe a sstra e l 50 % a destra). Se la dstrbuzoe è per frequeza è ecessaro calcolare le frequeze cumulate C. Esempo: modaltà frequeze cumulate 8 8 5 6 54 6 5 79 8 35 4 0 6 40 Il umero totale d osservazo è 40. 40 : = 70 Il 70 valore (per essere precs bsogerebbe dre l valore tra l 70 e l 7 ) cade e prm 79 : qud la medaa è 6, coè la modaltà che corrspode alla frequeza cumulata che abbamo appea trovato. La frequeza cumulata è ua frequeza partcolare: se cosderamo u geerco carattere X, la Freq(X ) s dce frequeza cumulata ad. La frequeza cumulata può essere calcolata solo per caratter co modaltà almeo ordabl. 9

Idc d poszoe poco utlzzat Tra gl dc d poszoe (o cetral) meo utlzzat bsoga rcordare solo quartl. Ess dvdoo quattro part ugual la dstrbuzoe. Q è l prmo quartle : esso lasca l 5% della dstrbuzoe a sstra e l 75% a destra. Q è l secodo quartle che è uguale alla medaa. Q 3 è l terzo quartle : esso lasca l 75% a sstra e l 5% a destra. Dstrbuzo d dat class Fora soo stat svolt esercz co dstrbuzo per utà o d frequeza. Spesso elle dag statstche è ecessaro dstrbure dat per class (cò capta sempre se la varable X è cotua). Le formule che soo state scrtte (e spero mparate!) e che soo state applcate elle page precedet o permettoo d rsolvere esercz co dstrbuzo d dat class. C è la ecesstà, qud, d applcare uove formule, molto sml a quelle precedet, ma che soo valde solo per questo tpo d dstrbuzoe. La meda artmetca s calcola: h c 0

dove c è l valore cetrale d ua classe ( ; + ). Il valore è l lmte ferore della classe; + è l lmte superore. Esempo umerco: Sa data la dstrbuzoe d 50 dvdu classfcat secodo l umero de dsch possedut: Class c [0,5],5 (5,5] 4 0 (5,30] 36,5 (30,60] 7 45 (60,00] 06 80 La meda artmetca sarà (crca) 3 :,5 0 4,5 36 45 7 8006 50 5, Attezoe alle paretes : quelle tode dcao che l valore è escluso dal calcolo, quelle quadre dcao che l valore è compreso. 3 Il terme crca è rfermeto alla o esattezza del calcolo perché soo state prese cosderazoe valor cetral della classe come valor rappresetatv. Il problema è sempre lo stesso: potrebbe o essere u valore realmete osservato.

Ache la moda s calcola modo leggermete dverso. È mportate determare la destà (d ): d La dffereza h, ampezza della classe. Nell eserczo cosderato: 4 36 7 06 d,4 ; d,4 ; d3,4 ; d 4,4 ; d5,65 5 0 5 30 40 Qud la classe co destà maggore è la classe modale 4. Per coveeza la moda è l valore cetrale della classe: Mo = 80 Il calcolo della medaa s può effettuare co u approssmazoe d questo tpo: Me 0,5 F F F dove F - e F soo rspettvamete la frequeza cumulata relatva alla classe precedete a quella medaa e la frequeza cumulata relatva alla classe medaa. 4 È solo ua cocdeza che la destà maggore è assocata alla frequeza maggore.

e + soo lmt, ferore e superore, della classe medaa che s calcola el modo classco (POS[Me] = N/). Questa formula è valda, co opportue modfche 5, ache per l calcolo de quartl. Nell esempo cosderato la medaa è: 0,5 0,88 Me 3 0,576 0,88 60 30 53, 08 Idc d varabltà (o d dspersoe). S è vsto come s possa fare uso de valor med allo scopo d codesare l seme de dat proveet dalle osservazo u uco valore che possa rappresetarl tutt. Tale valore è spesso dcato come cetro della dstrbuzoe. Occorre ora teere presete u cocetto essezale della statstca, e coè che u valore medo, comuque calcolato, o è suffcete a rappresetare l seme delle osservazo effettuate (o l seme de valor assut dalla varable statstca); è ecessaro qud affacare ad esso altr dc che sao grado d forre delle formazo sulla dspersoe, pratca sulla dstaza delle vare osservazo dal valore medo che rappreseta l cetro della dstrbuzoe. 5 Nella formula del I quartle c è 0,5, quella del terzo quartle 0,75. 3

Tato more è la dstaza (o dspersoe) delle osservazo dal cetro, tato maggore sarà la rappresetatvtà e l affdabltà del valore medo. Gl dc d varabltà assumoo valore zero solo se è ulla la varabltà, e tutt valor soo qud ugual fra loro; all aumetare della varabltà tal dc assumerao valor sempre maggor. Rassumedo, possamo affermare che u carattere salete de dat statstc è la varabltà. Per aalzzare ua dstrbuzoe, dopo aver calcolato uo o pù valor med s cerca d evdezare la dspersoe de dat, dspersoe che caratterzza la varabltà del feomeo. Può teressare cooscere sa d quato dat dfferscoo da u valore medo, sa d quato dat dfferscoo fra loro. V soo var dc che msurao la varabltà d u feomeo: l pù mportate è la varaza. La varaza è la meda degl scart al quadrato 6 : La varaza vara da u mmo d zero ( 0 ) se tutte le modaltà cocdoo, ad u massmo che può essere fto. Se la dstrbuzoe è d frequeza, ovvamete la formula è: Per le class la formula è: k 6 Da rcordare che -μ è lo scarto d ua geerca modaltà dalla meda e che la somma degl scart è uguale a zero (ua delle propretà della meda artmetca). 4

Alcue propretà soo: c cx e h c X. 7 c Per gl esercz usamo molto spesso le formule pù veloc 8 : k h c (per dstrbuzo class) Lo scarto quadratco medo σ è la radce quadrata della varaza: k (per frequeze) 7 Le propretà della varaza soo relatve alla dstrbuzoe cosderata: se le modaltà le moltplchamo tutte per ua costate c allora la varaza s modfca, se alle modaltà aggugamo (o sottraamo) u valore costate c allora la varaza o s modfca. 8 Per gugere a queste formule veloc c soo de passagg matematc che verrao svluppat durate la lezoe. Basta rcordare l quadrato d u bomo a b a ab b e che 5

Molto spesso vee utlzzato perché, a dffereza della varaza, vee espresso ella stessa utà d msura della meda artmetca e d tutte le modaltà. U altro dce d varabltà molto oto è l coeffcete d varazoe CV: CV Esso è utle per cofrotare la varabltà relatva d u feomeo crcostaze dverse. U dce d varabltà poco utlzzato è l campo d varazoe o Rage: Rage X MAX MIN Alcue volte vee proposto dagl studos lo scostameto semplce medo che vee calcolato: S Questo è u dce che s utlzza molto poco perché la varaza e lo scarto quadratco medo soo molto pù precs. Notazo partcolar Spesso su lbr d statstca s trovao queste otazo: 6

la meda d ua dstrbuzoe X M X la meda d ua dstrbuzo d valor al quadrato M X la varaza M X MX S legge la meda de quadrat meo la meda al quadrato Idc d varabltà che o soo rspetto ad u cetro Per completare l dscorso sugl dc d varabltà rmae da aalzzare la dffereza semplce meda e l rapporto d cocetrazoe. Quest due dc vegoo calcolat solo u cotesto d mutua varabltà che s ottee soprattutto per caratter trasferbl 9. U metodo molto elemetare per calcolare la mutua varabltà cosste ell esamare tutte le dffereze tra le modaltà a due a due facedoe ua stes tramte u opportua meda. Questo dce è oto come dffereza semplce meda e vee dcato co Δ (delta) : j j 9 Per carattere trasferble s tede l reddto, l cosumo d u bee, gl oggett. Caratter o trasferbl soo l età (purtroppo!), l altezza, l peso 7

Avedo escluso cofrot tra ua utà e se stessa, tutt possbl cofrot soo (-). Il rapporto d cocetrazoe è l altro dce per caratter trasferbl: scuramete pù precso perché è l rapporto tra la dffereza semplce meda e l doppo della meda artmetca: R Esempo umerco: s preda cosderazoe la seguete sere: 9 3 7 La meda artmetca è 5 3 7 9 0 6 8 3 0 4 6 7 6 4 0 9 8 6 0 56 56 4,66 4,66 R 0, 466 4 4 0 Cò vuol dre che c è u 46% (crca) d cocetrazoe. 8

Idc d forma Nell applcazoe degl dc d poszoe e d varabltà soo state rscotrate delle asmmetre d alcue dstrbuzo. Per calcolare l testà d queste asmmetre s utlzzao due dc d forma: asmmetra e curtos. Esstoo almeo se dc d asmmetra, ma l pù utlzzato è scuramete: Me ( 0 ) U altro dce d asmmetra, poco utlzzato, è quello d Fsher: 3 U altro aspetto della forma d ua dstrbuzoe d frequeza rguarda l maggore o more apputmeto. Cò s può calcolare attraverso l dce d curtos d Pearso: 4 Esso vale 3 per dstrbuzo ormal, vale pù d 3 per dstrbuzo pù apputte e meo d 3 per quelle pù patte. Stadardzzazoe de putegg 0 Per alcue dstrbuzo s utlzza la moda al posto della medaa. 9

E molto utle se s vogloo cofrotare modaltà d dstrbuzo dverse, co mede e varaze dverse. La formula è semplce e sarà utlzzata moltssmo seguto. Dstrbuzo multple d frequeza Quado su og utà apparteete ad ua data popolazoe s rlevao pù caratter (qualtatv e/o quattatv) s parla d dstrbuzoe multpla o multvarata Teorcamete su og popolazoe è possble rlevare u certo umero d caratter (o varabl per l lguaggo terazoale ). Per o complcare ulterormete lo studo s cosderao solo due varabl, o etrambe quattatve o etrambe qualtatve o ua quattatva e ua qualtatva. Questa dstrbuzoe s chama dstrbuzoe d frequeza doppa. Vee rappresetata su ua tabella a doppa etrata. X \ Y y y y j y h Totale.. j h. k k k k. Totale...j.h Ct.Prof. Pccolo 0

Le frequeze assolute el rquadro soo coesse alla dstrbuzoe doppa, quelle corrspodet a total d rga rguardao esclusvamete alla varable X metre quelle corrspodet a total d coloa rguardao la varable Y. Valgoo le seguet uguaglaze: k h. j. j. j j k h La frequeza margale. esprme l umero d soggett che possedoo la modaltà (a prescdere da quello che avvee per l altra varable); così la frequeza margale.j esprme l umero d soggett che possedoo la modaltà y j. Se s devoo aalzzare due varabl qualtatve, geere, s utlzza l χ (ch quadrato) che è ua aals delle frequeze. L dce pù utlzzato per le varabl quattatve è vece l coeffcete d correlazoe d Bravas Pearso. Per le varabl mste s utlzza η (eta quadro). La formula del χ è : f teo f f teo oss La frequeza teorca s calcola moltplcado le frequeze margal e dvdedo per l totale. Secodo l programma aaltco questa formula o va studata, però potrebbe essere utle seguto.

χ è sempre postvo (può essere uguale a zero solo se tutte le frequeze soo ugual) e msura la coessoe tra due varabl statstche. Tedeza\ Favorevole Cotraro totale gudz Poltca \ dvorzo dvorzo Cetro 8 0 sstra Cetro - destra 9 0 totale 9 40 Le frequeze osservate soo 8 9. 0 40 Le frequeze teorche soo 0, 5 09 9,5 40 09 9,5 40 0,5 9,5 8 0,5 9 9,5 0,5 9,5 0,5 9,5 0 0,5 40 Se tede a zero c è dpedeza tra le varabl, se tede all fto c è ua alta coessoe tra le due varabl. Il coeffcete d correlazoe d Bravas - Pearso è ua msura stetca che tee coto delle relazo quattatve tra X e Y otteute medate la meda artmetca. y y y Cov Var X, Y X Var Y

Al umeratore c è la Covaraza che è ua msura della cotemporaea varazoe d X e Y rapporto alle rspettve mede. Cov X, Y y y y Ache per la covaraza esste ua formula veloce che può sostture sempre quella d defzoe: y y y Per alcu calcol vee rchesta la codevaza che è l umeratore della covaraza, così come la devaza è l umeratore della varaza. Iterpretazoe del rsultato d ρ Se ρ = 0 allora X e Y soo dpedet; se ρ = allora c è massma dpedeza postva tra X e Y; se ρ = - allora c è massma dpedeza egatva tra X e Y. 3

Alcu esercz d descrttva gà svolt ESERCIZIO - + Cum - 5 9 9 5-9 40 9-3 7 47 3-7 4 5 7-53 totale 53 Calcolare la meda artmetca, la moda, la medaa, l prmo e l terzo quartle. SVOLGIMENTO c 3 7 5 9 La coloa de valor cetral 39 77 5 4 9 53 6.40 4

7.5.75.75 0.5 La coloa delle destà La classe modale è - 5 qud la moda è 3. La poszoe medaa è 53: = 6.5, qud la classe medaa è - 5 La medaa è : 0.5 0 Me 0.547 0 d 5 4. 66 La poszoe del I quartle è 53:4 = 3.5, qud la classe I quartle è - 5. 0.5 0 Q 0.547 0 5. 83 53 La poszoe del III quartle è 3 39. 75, qud la classe III quartle è 4 5-9. 0.75 0.547 Q 3 5 0.7547 0.547 9 5 8. 9 ESERCIZIO Data la seguete dstrbuzoe, calcolare varaza, scarto quadratco medo e coeffcete d varazoe. 6 6 8 3 4 4 3 9 4 5

SVOLGIMENTO 66 834 4394 66 0.43 60 60 36 64 44 96 36 La coloa delle modaltà al quadrato per utlzzare la formula veloce della varaza: 366 643444 963 36 4 60 746 60 0.43 08.78 3.6 08.78 4. 8 Qud: 4.8 3.85 E l coeffcete d varazoe: CV 3.85 0.43 3 ESERCIZIO 0.37 I seguet valor s rferscoo a valor d u ttolo rlevat meslmete:.4.7.3.5 3. 3.8 Se l valore 3.8 fosse erroeamete trascrtto come 38, quale sarebbe l effetto sulle msure d poszoe calcolate co quest dat? SVOLGIMENTO L uco dce che verrebbe a modfcars è la meda artmetca perché è l solo a essere fluezato da valor aomal. Medaa e moda restao varate. 4 ESERCIZIO 6

Data la seguete dstrbuzoe d due varabl X e Y, calcolare la covaraza e l coeffcete d correlazoe leare (e commetare rsultat): y 3 7 5 6 8 7 0 5 4 3 SVOLGIMENTO 3 580 4 7 6 7 5 3 8 y 5. 6 5 5 y y 9 49 5 36 30 64 49 56 00 5 50 96 9 4 Σ = Σ = Σ = 394 68 99 Le coloe de quadrat delle modaltà d X e d Y e de prodott (per calcolare velocemete le varaze d X e d Y e la covaraza): X 394 8 5 78.8 64 4.8 Y XY 68 5 5.6 33.6 3.36. 4 99 (85.6) 39.8 44.8 5 5 La covaraza egatva dca ua relazoe versa tra X e Y. La covaraza msura la drezoe ma o l testà del legame tra due varabl. 7

XY 5 4.8.4 5 33.5 0.868 Questo rsultato c dca che la relazoe (egatva) è par all 87% crca. Qud c è ua forte relazoe (versa) tra le due varabl. 8

CALCOLO DELLE PROBABILITA Nel lguaggo correte s setoo spesso fras del tpo: <<è probable che fra poco pova>>; <<co questo ttolo d studo v soo poche probabltà d trovare lavoro>>; <<è molto probable che el 00 s costruscao stazo etraterrestr>>; <<è probable che l cedo sa d orge dolosa>>. S utlzza frequetemete l terme probabltà quado c s rfersce a stuazo certe, a feome che possoo o o verfcars, ma el lguaggo comue l cocetto d probabltà é per lo pù geerco. Tale cocetto è assocato a quello d eveto aleatoro, tededo dstguere, questo modo, gl evet cert, che s verfcao scuramete, da tutt quegl evet l cu verfcars dpede esclusvamete dal caso, dett apputo evet aleator o casual. Ad esempo, u eveto certo è quello d estrarre ua palla rossa da u'ura che cotee esclusvamete palle rosse. Esstoo ache evet deft mpossbl, perché o s verfcherao ma. Ad esempo, estrarre ua palla rossa da u'ura che cotee solo palle verd è u eveto mpossble. Gl evet aleator soo, essezalmete, evet cert e possbl. Ad esempo, l estrazoe d ua palla rossa da u'ura che cotega palle rosse e bache è u eveto aleatoro; el laco d ua moeta l fatto che s preset la facca cotrassegata dalla testa è u eveto aleatoro, 9

come ache l estrazoe d u asso da u mazzo d carte. Nell ambto degl evet aleator, s possoo dstguere evet che hao maggor possbltà d verfcars rspetto ad altr. Il calcolo delle probabltà cerca d formulare delle valutazo umerche della possbltà d verfcars d tal evet dett aleator o casual. S rleva che, come o esste u'uca defzoe d probabltà così o esste u uco modo d valutare la probabltà d u eveto aleatoro. Defzoe classca : la probabltà d u eveto E è dato dal rapporto tra l umero de cas favorevol dvso l umero de cas possbl (egualmete probabl). Pr( E) m è l umero d cas favorevol e l umero d cas possbl. m Il vataggo d questa defzoe è sez altro l calcolo veloce; però lmt soo umeros. I pù evdet soo la equprobabltà e la umerostà che alcue volte tede all fto. Per questo motvo la defzoe pù utlzzata è quella frequetsta. Pr( E) lm fr( E) Negl a pù recet s è data ua alteratva defzoe d probabltà: quella soggettvsta. 30

La valutazoe umerca della probabltà è coessa alle valutazo persoal d u soggetto crca la verfcabltà d u esto certo. Cocett prmtv I cocett prmtv del calcolo delle probabltà soo prova, eveto e probabltà. Prova : è qualsas espermeto soggetto ad certezza. Eveto : è uo de possbl rsultat della prova. Probabltà : è u umero (compreso tra zero e uo) assocato ad u eveto. Algebra d Boole La formalzzazoe degl evet segue l algebra d Boole. La struttura degl evet, qud, è smle a quella degl sem. Percò: Uoe tra due evet A e B è quell eveto C che s verfca quado s verfca almeo uo tra A e B. Pr( C) Pr( A B) che s legge probabltà d A uto B o probabltà d A o B. Negazoe d u eveto A è quell eveto che s verfca quado o s verfca A e s dca co A (s legge o A oppure A egato ). Spazo campoe Ω è l seme d tutt rsultat d ua prova. Itersezoe d A e B è quell eveto C che s verfca solo se s verfcao cotemporaeamete A e B. 3

Pr( C) Pr( A B) che s legge probabltà d A tersecato co B o probabltà d A e B. Due evet s dcoo compatbl se o possoo verfcars cotemporaeamete ( A B ). 3 Due evet s dcoo compatbl se possoo verfcars ella stessa prova. Due evet s dcoo ecessar se la loro uoe è l eveto certo Ω. Postulat del Calcolo delle probabltà. Pr(E) 0. Pr(Ω) = 3. Pr( A B) Pr( A) Pr( B) se A e B soo compatbl. Alcue relazo fodametal: Pr( A ) Pr( A) Pr( A B) Pr( A) Pr( B) Pr( A B) Probabltà codzoata S defsce probabltà codzoata d B dato A : Pr( B A) Pr( A B) Pr( A) 3 S possoo rappresetare ache co dagramm d Ve 3

Se gl evet soo dpedet, allora : Pr( A B) Pr( A)Pr( B) Varable casuale Ua varable casuale ( v.c.) è ua regola che assoca ad og eveto u uco umero reale. Tramte la v.c. s crea ua corrspodeza tra l seme degl evet Ω e umer real. Spesso ua v.c. (X) o è altro che ua traduzoe umerca mmedata degl evet elemetar. X,, 3,..., k varable casuale p,...,, p, p3 p k k p Varable casuale dscreta Ua varable casuale dscreta è ua corrspodeza tra gl evet ed u seme dscreto ( fto o umerable ) d umer real. Il modo pù semplce per rappresetare grafcamete ua v.c. dscreta è quello d porre sull asse delle ascsse valor della v.c. e sull asse delle ordate le rspettve probabltà. Varable casuale cotua Ua v.c. è cotua se può assumere tutt valor compres u tervallo reale. 33

Le v.c. cotue rappresetao ua maggore complesstà aaltca perché, a dffereza d quelle dscrete, o è possble elecare tutt valor che la v.c. assume. Fuzoe d rpartzoe La fuzoe d rpartzoe costtusce l elemeto ufcate delle teore delle v.c. dscrete e cotue. F( ) Pr( X ) f ( w) dw se X èua v. c. cotua ( ) p se è dscreta Propretà della fuzoe d rpartzoe: È o decrescete; Iferormete tede a zero e superormete tede a ; 4 È cotua da destra. La fuzoe d probabltà vee dcata, vece, co f lm 4 F ) 0 F( ) ( lm 34

Valore medo (atteso) d ua varable casuale Il valore medo d ua v.c. cocettualmete è smle a quello studato ella statstca descrttva. L uca dffereza è che ella descrttva s parla d dstrbuzoe co modaltà e frequeze, el calcolo delle probabltà s parla d v.c. co elemet e probabltà. 5 k p se la v.c. è dscreta f d se la v.c. è cotua Mometo d ua varable casuale (rspetto all orge) I geerale s può parlare d mometo r-smo (erresmo) d ua varable casuale. Il valore medo o è altro che u mometo d orde. k r r p se la v.c. è dscreta r r f d se la v.c. è cotua Momet r-sm rspetto ad u cetro (valore medo) 5 Esercz sul calcolo del valor medo sarao svolt durate la lezoe. 35

probabltà r k r p se la v.c. è dscreta 6 I partcolare per r s ha la varaza della v.c. Eserczo: S cosder ua v.c. dscreta che assume valor 3 4 co probabltà rspettvamete d medo (atteso) e la varaza. 5 5 5 5. Calcolare l valore 5 5 3 5 3 4, 6 5 5 5 5 5 Rappresetazoe grafca d ua v.c. uforme dscreta (prob. VAR( X ),6,6 3,6 4,6, 04 costate) 5 V.C. uforme (dado) 0,8 0,6 0,4 0, 0, 0,08 0,06 0,04 0,0 0 3 4 5 6 valor 6 Naturalmete el caso d v.c. cotua l calcolo della varaza è medate l tegrale. 36

X Var X I realtà s potrebbe calcolare ache l dce d asmmetra Asym(X) e l dce d curtos Kurt(X) ma calcol soo molto compless. Basta rcordare che l prmo è l mometo d orde tre della v.c. rspetto al cetro e l secodo è l mometo d orde 4 rspetto al cetro. I valor calcolat soo: Asym X 0 Kurt X, 8 Varable casuale Normale. (Gaussaa) L uca v.c. cotua che s aalzza el corso è la Normale. La v.c. Normale rappreseta l modello d dstrbuzoe pù mportate del Calcolo delle Probabltà. Essa approssma la dstrbuzoe emprca d moltssm feome real. La v.c. Normale ha la seguete fuzoe d probabltà (o destà) Co Ha le seguet propretà: f ( ) e Assume tutt valor real. È caratterzzata da due parametr, μ e σ, che cocdoo co la meda e la varaza d X, coè 37

E ( X ) Var ( X ) : brevemete s scrve X ~ N, ( s legge che la dstrbuzoe X è dstrbuta come ua ormale co meda μ e varaza σ. La fuzoe d destà ha forma campaulare, smmetrca rspetto al valor medo. L area sottesa alla campaa rappreseta la probabltà d X. L area totale è. 7 μ rappreseta ache la moda d X e la medaa d X, ovvero la dstrbuzoe è umodale: percò P ( X ) P( X ) 0,5. varazo del valore medo rappresetao traslazo (movmet orzzotal). varazo della varaza rappresetao varazo ella forma (alzameto o appattmeto). μ - σ μ μ + σ 7 f d equvale a dre che la somma d tutte le probabltà è uguale a. 38

Per calcolare la probabltà (matematcamete è u area) che X s verfch u dato tervallo s dovrebbe svolgere u tegrale. La tavola (elle ultme page del lbro) permette d trovare l valore dell area (e qud della probabltà) seza svolgere alcu tegrale. È ecessaro, però, stadardzzare valor da calcolare prma d utlzzare la Tavola. Z X Qud s ha u altra varable casuale, la Normale Stadardzzata 8 : P Z ~ N 0, E ( Z) 0 Var ( Z) Z 0 PZ 0 0, 5 8 Durate la lezoe verrà spegato come s legge la tavola co var esemp. Oguo avrà a dsposzoe la tavola. 39

Esempo d lettura delle tavole: s cosder ua meda par a 5 e ua varaza par a 9. s calcol la probabltà che X sa more d 7 prma d tutto è ecessaro stadardzzare 7 : 7 5 z 0,66 3 Sulle tavole : P ( Z 0,66) 0,74537 Og volta che s deve calcolare Z corrspodete sulla tavola. 9 Se vece s deve calcolare Z dffereza PZ P basta predere l valore P allora è ecessaro fare la Se la stadardzzazoe c dà u valore egatvo allora: Z PZ PZ PZ P Se vece bsoga calcolare la probabltà d Z compreso tra α e β: P Z PZ PZ Propretà rproduttva. Tra le propretà della v.c. Normale c è ache la propretà rproduttva : 9 Sulle tavole s hao solo le aree a sstra del valore cosderato (fuzoe d rpartzoe). 40

a X ~ N( a, a ) Appedce Matematca Dal valore stadardzzato al valore ormale Z Moltplcado per etramb membr: Z S ottee: Z Aggugedo ad etramb membr: Z S ottee: Z La formula versa della stadardzzazoe. Noto l valore stadardzzato Z (e parametr della Normale) s può rsalre al valore della dstrbuzoe o stadardzzata. Eserczo: Data ua v.c. Normale X ~ N(0, 36), trovare quel valore k tale che Pr( X > k) = 0,0. Svolgmeto: la Tavola permette d calcolare solo valor stadardzzat: qud s può calcolare z k, che è l valore stadardzzato d k, medate la Pr( Z > z k ) che è par a 0,0. Sulla Tavola s trova Pr( Z < z k )= 0,90 dove z k =,9 Per trovare k s applca la formula: 4

Z Qud = 6 *,9 + 0 = 7,74 Il valore k che s cercava è propro 7,74 Pr( X > 7,74 ) = 0,0 Teorema Lmte Cetrale Il teorema del Lmte Cetrale assersce che la somma d ua successoe d v.c. dpedet ed detcamete dstrbute, e co varaza fta, coverge dstrbuzoe alla v.c. Normale. Questo teorema è stato terpretato da var studos. Oguo d ess lo utlzzava per scop dvers (per la fsca, per la chmca ). La formula s può otteere attraverso semplc passagg d stadardzzazoe. Rcordado che le v.c. soo dpedet e detcamete dstrbute, s ha che è fta s ha che Var ( ). ; rcordado che la varaza La somma delle v.c. vee dcata co S e l valore medo e la varaza soo: S S Var Stadardzzado s ha: 4

Z S Var S S S X INFERENZA La terza parte del programma prevede lo studo dell fereza statstca. Nella statstca descrttva s affrota u problema dretto, coè d deduzoe, perché s passa dalla popolazoe alla raccolta d formazo su d essa. Nell fereza statstca s affrota l problema verso, coè d duzoe probablstca perché da dat osservat medate scelta campoara s guge ad affermazo che rguardao la popolazoe da cu ess soo stat prescelt. Nell fereza spesso s parla d popolazoe, d campoe, d umerostà del campoe. La popolazoe è l seme d tutt gl oggett (Uverso). Il campoe è ua parte della popolazoe che lo studoso deve sceglere attetamete base all obettvo che s è prefssato. È mportate ache la umerostà del campoe, dcata co. X X ~ S X X meda campoara varaza campoara 43

S varaza campoara corretta 0 Stma e stmatore. X X, X,..., è uo stmatore,..., X è ua stma, Lo stmatore è ua v.c. metre la stma è u umero reale. Le propretà dello stmatore sarao elecate e commetate u altro mometo. t è l valore reale della stma T è la v.c. stmatore. Esercz statstca ferezale (verfca delle potes) Propretà d uo stmatore Le propretà fodametal d uo stmatore soo quattro: la suffceza, la cossteza, la o dstorsoe e l effceza. Uo stmatore è suffcete se cotee o stetzza tutte le formazo 0 Nelle lezo successve s caprà l cocetto d corretta. Per l mometo è ecessaro sapere solo queste due semplc defzo. La parte teorca può essere studata ache u secodo mometo. 44

rlevat coteute u campoe a f della stma d u parametro. Uo stmatore vee defto cosstete se al crescere della umerostà campoara aumeta ache la probabltà che l valore della stma sa uguale al valore del parametro della popolazoe. Per u molto grade è quas certo che la stma cocda co l parametro. Uo stmatore s dce effcete se la sua varaza, a partà d altre codzo, rsulta more della varaza otteble co altr dvers stmator. Uo stmatore s dce o dstorto se l suo valore atteso cocde co l parametro. Questa ultma propretà è tra le pù mportat perché dca che lo stmatore possede ua dstrbuzoe che ha l parametro θ come barcetro; d altra parte l valor medo d ua v.c. è tato pù rappresetatvo quato pù la varaza è pccola. Percò la varaza può essere ua dcazoe della botà d uo stmatore solo per stmator o dstort. A tal proposto s defsce l errore quadratco medo (Mea Square Error) MSE d uo stmatore per l parametro θ l seguete valore medo: MSE T T 45

Questo valore, attraverso calcol matematc 3, s può scrvere ache: MSE T Var T b T Qud l MSE d uo stmatore è uguale alla varaza dello stmatore pù la dstorsoe (b) al quadrato. Il MSE d uo stmatore o dstorto cocde co la varaza dello stmatore. Uo stmatore s dce cosstete meda quadratca per θ se : lm MSE T lm T 0 Qud uo stmatore è cosstete meda quadratca se l suo MSE tede a zero al crescere della umerostà campoara 4. Uo stmatore è cosstete probabltà per θ se, per og ε > 0 fssato, s ha : lm PrT 3 Basta rcordare l quadrato d u bomo. 4 È la stessa defzoe data el foglo I : soo stat utlzzat solo term pù tecc. 46

La cossteza meda quadratca d T mplca la cossteza probabltà. Uo stmatore T per l parametro θ s dce astotcamete Normale se : T T lm Pr Var T t t Il Lemma d Neyma e Pearso 5 è u rsultato teorco mportate per la costruzoe della Regoe Crtca (RC) e utlzza la fuzoe d verosomglaza. Questo Lemma dvdua ua RC e o la RC. La RC vee determata modo che l rscho d commettere l errore del tpo, rteuto pù grave, sa par ad u lvello α prefssato. 5 Questo Lemma vee utlzzato pratcamete egl esercz sulla Verfca delle Ipotes 47

Struttura probablstca del test H 0 è vera H 0 è falsa E G G E S rfuta H 0 No s rfuta H 0 S rfuta H 0 No s rfuta H 0 G : s decde d o rfutare H 0 sulla base del campoe osservato ed effettvamete H 0 è vera : decsoe gusta; G : s decde d rfutare H 0 sulla base del campoe osservato ed effettvamete H 0 è falsa : decsoe gusta; E : s decde d rfutare H 0 sulla base del campoe osservato metre H 0 è vera: decsoe errata; (errore d tpo ) E : s decde d o rfutare H 0 sulla base del campoe osservato metre H 0 è falsa : decsoe errata. ( errore d tpo ) Pr E lvello d sgfcatvtà del test, ampezza della RC Pr E probabltà dell errore d tpo Pr G regoe d accettazoe del test Pr G la probabltà d rfutare correttamete H 0 o semplcemete poteza del test. Test sul valore medo (ota la varaza della popolazoe ) 48

test z meda del campoe cosderato meda della popolazoe varaza della popolazoe umerostà del campoe lvello d sgfcatvtà ( geere è 5%, % o 0%) z è l quatle (valore sulle tavole) el caso d u test udrezoale z è l quatle (valore sulle tavole) el caso d u test bdrezoale Test z bdrezoale RC RC - z + z 49

Se l valore del test (molto spesso chamato valore crtco) è ferore a - z o superore a cotraro o s rfuta H 0. z allora s rfuta H 0, caso Test z udrezoale (destra) RC + z Se l valore del test è superore a o s rfuta. z allora s rfuta H 0, altrmet Test sul valore medo (se o è ota la varaza della popolazoe ) test t s 50

dove s è la varaza 6 del campoe. Per la determazoe de quatl s cosulta la Tavola della t d Studet cosderado grad d lbertà g che soo par a -. Questo eserczo è smle a quello precedete: l uca dffereza cosste el determare quatl su tavole dverse. 7 Test sulla dffereza tra valor med (co le varaze ote) test z, m y m y m H H 0 : y y 0 cotro H : 0 test bdrezoale 0 : y 0 cotro H : y 0 (destra) H 0 : y y test udrezoale 0 cotro H : 0 test udrezoale(sstra) Ache per questo tpo d test è ecessaro determare, medate l uso delle tavole, l quatle: z per l tpo udrezoale e per l tpo bdrezoale. z 6 Varaza corretta. 7 I realtà s può utlzzare u uca tavola: la tavola della t d Studet. I corrspodeza della rga co grad d lbertà c soo quatl della varable z. 5

Nella bdrezoale : s rfuta H 0 se z, è maggore d m z o more d - z. Nella udrezoale a destra : s rfuta H 0 se z, è maggore d m z. Nella udrezoale a sstra: s rfuta H 0 se z, è more d - m z. Test sulla dffereza tra valor med (co varaze o ote) 8 test t, m y S m m S y m m m La tavola da utlzzare per determare l quatle è quella della t d Studet. I grad d lbertà g soo par a +m-. Se le umerostà campoare soo elevate la statstca test t può essere approssmata al test z e quatl vegoo rcercat sulla Tavola z 8 Le varaze della popolazoe o soo ote ma le suppoamo ugual tra loro. 5

test z, m S y m S y m Test sulla dpedeza (test o parametrco) H 0 : X e Y soo dpedet cotro H : X e Y o soo dpedet sulla base d ua tabella a doppa etrata otteuta dall osservazoe della varable doppa (X,Y) sulle utà statstche, occorre calcolare le frequeze assolute teorche assumedo l dpedeza... j ˆ j frequeze assolute teorche 9 k h j ˆ j (ch quadrato) ˆ j j Per determare la RC è ecessaro utlzzare le tavole del χ (g). I grad d lbertà g soo par (k-)(h-) dove k è l umero d rghe della tabella e h è l umero delle coloe della tabella. S rfuta H 0 se l valore calcolato sul campoe è maggore del valore crtco (quatle) determato sulla Tavola del χ. 9 Gà studate ella parte descrttva. 53

Modello d regressoe leare Uo de prcpal obettv dell aals statstca è lo studo dell assocazoe tra dverse varabl. La correlazoe msura la drezoe e la forza del legame leare tra due varabl quattatve. Ua retta d regressoe 30 rassume la relazoe tra due varabl ua drezoe specfca: quado ua delle varabl (esplcatva o dpedete) auta a spegare o prevedere l altra ( la varable rsposta o dpedete). Le potes classche della regressoe leare: ) Y 0 ) 0 3) Var ( ) 4) Cov, 0 per j, j,..., 5) la varable X è ota seza errore ed è osservata almeo per due valor dstt. La retta che s utlzza per gl esercz è la seguete: yˆ ˆ ˆ 0 30 La regressoe leare è u metodo d adattameto dat a ua retta. Se la retta ha u adameto ascedete, sgfca che ua varable esplcatva, come ad esempo l umero d addett alle vedte, ha u effetto postvo sulla varable dpedete, ad esempo le etrate. Se l'adameto è dscedete, allora l'effetto è egatvo. Pù accetuata è la pedeza della retta, maggore è l'effetto. 54

dove ˆ s y s è l coeffcete agolare della retta (coeffcete d regressoe) e ˆ y ˆ è l tercetta (l puto cu la retta tagla l asse 0 delle ordate) Le dffereze tra valor osservat e valor stmat soo dett resdu eˆ y yˆ ˆ e 0 Correlazoe Postva 55

Correlazoe Negatva Idffereza Nessua Relazoe tra X e Y Propretà della retta d regressoe: la retta è uca; la retta passa per l puto d coordate, y; 56

la retta è tale che le meda delle osservate è uguale alla meda delle stmate. Idce d determazoe R Msura la botà d accostameto (goodess of ft ) de put alla retta d regressoe. R r y R dev( reg) dev( tot ) y y 0 R Dev( y) devaza totale yˆ y Dev( yˆ) devaza della regressoe Dev( eˆ) ( y yˆ ) devaza resdua (o de resdu) Teorema d Gauss Markov Sotto le potes classche del modello d regressoe leare semplce, gl stmator LS per parametr soo lear, o dstort ed pù effcet ella classe degl stmator lear e o dstort. 57

ESERCIZI SVOLTI U ura cotee 70 palle d cu 6 ere, 4 galle e 0 rosse. Calcolare la probabltà che estraedo a caso ua palla dall ura questa sa: a) sa galla o era o rossa; b) sa verde; c) sa galla o rossa; d) o sa galla; e) sa era o rossa. SVOLGIMENTO 3 S defscao seguet evet: N: estrazoe d ua palla era; R: estrazoe d ua palla rossa; G: estrazoe d ua palla galla; V: estrazoe d ua palla verde; a) Pr( G N R) Pr( ) ; b) Pr( V ) Pr( ) 0; 4 0 44 c) Pr( G R ) Pr(G ) Pr( R ) ; 70 70 70 4 46 d) Pr( G ) Pr(G ) ; 70 70 46 e) Pr ( R N ) Pr( R ) Pr( N ) ; 70 s ot che la domada e) è equvalete alla domada d), per cu due evet ( G ) e ( R N ) per questa prova cocdoo. Calcolare l valore medo e la varaza della v.c. che assume valor 0,,, 4, rspettvamete co probabltà,, 4, 6. 3 Questo eserczo è stato scarcato dal sto teret del Prof. Pccolo. Per maggor formazo www.dpstat.ua.t 58

SVOLGIMENTO X X X 3 4 4 0 4 4 6 4 3 3 0 4 3 4 3 9 Var ( X ) 4 4 4 6 386 7 9 4 9 4 34 44 44 03 44 Il peso medo d u determato campoe d tartuf è d 5 gramm e la devazoe stadard (scarto quadratco medo) è d 5 gramm. Qual è la probabltà d trovare tartuf dal peso ferore d 30 gramm? Qual è la probabltà d trovare tartuf che pesao tra 60 e 70 gramm? SVOLGIMENTO La varable casuale s dstrbusce ormalmete ~ 5,5 30 5 Pr( X 30) Pr( Z ) Pr( Z.4) Pr( Z.4) 5 59

-.4 z Pr( Z.4) 0.99 0.0808 Pr( 60 X 60 5 70 5 70) Pr( Z ) Pr(0.6 Z.6) 5 5 Pr 0.6.6 z Z.6 PrZ 0.6 0.896 0.757 0. 705 La probabltà d colpre u bersaglo la prmo, al secodo ed al terzo colpo, è rspettvamete par a: 0.3, 0.6 e 0.8. S determ la probabltà d colpre l bersaglo uo ed uo solo de tre tetatv. SVOLGIMENTO Se colpre l bersaglo s defsce successo, allora s defscao seguet evet: S : successo al prmo tetatvo; S : successo al secodo tetatvo; S 3 : successo al terzo tetatvo; La probabltà rchesta (ossa colpre l bersaglo uo ed uo solo de tre tetatv) è ( S S S ) ( S S S ) ( S S S ) Pr( S S S ) Pr( S S S ) Pr( S S S ) Pr 3 3 3 3 3 3 perché gl evet paretes toda soo tra loro compatbl. 60

Assumedo che colp sao dpedet, s ha oltre che: Pr( S S S3 ) Pr( S )Pr( S )Pr( S3 ), e smlmete per le altre due probabltà. Qud, la probabltà cercata rsulta: ( 0. 3 0. 40. ) ( 0. 70. 60. ) ( 0. 70. 40. 8) 0. 33 Da u campoe casuale d 4 opera del turo d goro s rcava che l tempo medo per compere ua certa operazoe è 54 mut co devazoe stadard d 6 mut metre per 8 opera del turo d otte rsulta che l tempo medo per effettuare la stessa operazoe è d 57 mut co devazoe stadard d 8 mut. S potzza la omoschedastctà (le varaze, o ote, delle due popolazo le suppoamo ugual). Al lvello d sgfcatvtà del 5% co u test blaterale, s verfch se esstoo dffereze statstcamete sgfcatve tra gl opera de due tur. SVOLGIMENTO H 0 : y cotro H : y 54 y 57 sˆ 6 sˆ 8 4 m 8 0.05 y Le varaze della popolazoe o soo ote. Le umerostà de campo soo pccole. Qud s può utlzzare l test T,m. test t, m S y m S m y m m m test t 4,8 54 57 4 6 8 8 48 4 8 4 8 t.689 e grad d lbertà soo 4+8-=30 Il valore sulle tavole è: 6

t 30;0.05.04 Il test o è sgfcatvo; o s respge H 0. 3 ESERCIZIO 3 Calcolare grad d lbertà per ua verfca sull dpedeza d ua tabella 4 3. Calcolare t 8;0.05 e 8;0.0 t e commetare rsultat otteut. Calcolare t 0;0.05 e t 0;0.05 e commetare rsultat otteut. Calcolare l valore d 0;0.05 e d 5;0.05 SVOLGIMENTO I grad d lbertà d ua tabella 4 3 soo dat da g t 8;0.05 =.734 t 8;0.0 =.554 4 3 3 6 3 Questo eserczo è formato da var put che o soo collegat tra loro. Potrebbero essere delle domade flash sa per gl alu del Prof. Pccolo e sa d quell della Prof. D Ela. 6

A partà d umerostà del campoe (e qud de grad d lbertà) s ha maggor possbltà d rfutare l potes ulla co u lvello d sgfcatvtà pù alto (e questo è ovvo). t 0;0.05 =.85 t 0;0.05 =.747 A partà d lvello d sgfcatvtà s ha maggor possbltà d rfutare l potes ulla co ua umerostà pù alta. 0;0.05 = 8.3070 5;0.05 = 4.9958 A partà d lvello d sgfcatvtà s ha maggor possbltà d rfutare l potes ulla co ua tabella pù rdotta. 63

FORMULARIO DESCRITTIVA meda artmetca (per utà) k meda artmetca (per frequeze) h c meda artmetca (per class) Me se se è par è dspar medaa (per utà) 0,5 F Me medaa (per class) F F d destà (serve per determare la moda ua dstrbuzoe class) varaza (per utà) k formula veloce Varaza (per utà) varaza (per frequeze) 64

k frequeze) h c formula veloce Varaza (per formula veloce Varaza (per class) scarto quadratco medo CV coeffcete d varazoe j j dffereza semplce meda R rapporto d cocetrazoe X, Y y y y Cov covaraza y y y formula veloce covaraza X, Y X Var Y y Cov y coeffcete d correlazoe Var k h j y leare Bravas-Pearso j ˆ j ch quadrato (dce d assocazoe tra due ˆ j varabl) 65

FORMULARIO CALCOLO DELLE PROBABILITA Pr(E) 0 Pr(Ω) = Pr( A B) Pr( A) Pr( B) se gl evet soo compatbl Pr( A B) Pr( A) Pr( B) Pr( A B) se gl evet soo compatbl Pr( A ) Pr( A) Pr( A B) Pr( B A) probabltà codzoata Pr( A) Pr( A B) Pr( A)Pr( B) solo se gl evet soo dpedet (è la codzoe dell dpedeza) 33 k p valore medo d ua varable casuale VAR X EX EX EX X Varaza d ua varable casuale Z formula per stadardzzare 33 La formula è utlzzata per gl esercz co le palle (terme molto utlzzato da Cro) o sml. 66

Z S Var S S S X Teorema del Lmte Cetrale 67

Pr E FORMULARIO STATISTICA INFERENZIALE lvello d sgfcatvtà del test, ampezza della RC Pr E probabltà dell errore d tpo Pr G regoe d accettazoe del test G Pr la probabltà d rfutare correttamete H 0 o semplcemete poteza del test. (deotato ache co γ) Test sul valore medo (ota la varaza della popolazoe ) test z Test sul valore medo (se o è ota la varaza della popolazoe ) test t s 68

Test sulla dffereza tra valor med (co le varaze ote) test z, m y m y m Test sulla dffereza tra valor med (co varaze o ote) test t, m y S m m S y m m m Grad d lbertà t d Studet (u campoe) g Grad d lbertà t d Studet (due campo) Grad d lbertà g m (test sull dpedeza) g k h k è l umero d rghe metre h è l umero d coloe. 69

FORMULARIO REGRESSIONE Y 0 Retta d regressoe (co errore) ˆ s y s coeffcete d regressoe ˆ y ˆ tercetta eˆ 0 ˆ y y resduo ˆ e 0 somma de resdu è par a zero R r y dce d determazoe dev( reg) R 0 R dev( tot ) y y Dev( y) devaza totale Dev ( yˆ) yˆ y devaza della regressoe Dev( eˆ) ( y yˆ ) devaza resdua (o de resdu) 70