L ABC DELLA STATISTICA

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "L ABC DELLA STATISTICA"

Transcript

1 L ABC DELLA STATISTICA 1) Perché si chiama così. La statistica si chiama statistica perché fu così battezzata nel XVII (diciassettesimo) secolo (quello che va dal al ) col significato di scienza dello stato. Era, infatti, l attività volta a raccogliere e ordinare informazioni utili all amministrazione pubblica: entità e composizione della popolazione, movimenti migratori, mutamenti anagrafici, tavole di natalità e mortalità, dati sui commerci, le importazioni e le esportazioni, sui raccolti, sulla distribuzione della ricchezza, sull istruzione e la sanità. 2) Cosa è e a cosa serve la statistica. Questo paragrafo ( 2) ), con questo carattere, l ho copia-incollato dal sito dell ISTAT. Se vuoi approfondire ti basta cliccare sul link qui a fianco. La statistica è un metodo di studio di caratteri variabili rilevabili su collettività, avente lo scopo di sintetizzare le informazioni disponibili e di estendere induttivamente i risultati a casi più generali. La statistica, quindi, tratta caratteri, cioè aspetti della realtà osservabili (lo stato di una spiaggia, la professione di una persona che lavori) e variabili nel senso che possono assumere espressioni differenti (balneabile, inquinata; calzolaio, scrittore, deputato, regista); essi devono poter essere rilevati sui soggetti che li esprimono (cioè le unità statistiche); questi ultimi devono appartenere a una collettività (un unico dato rilevato su un singolo individuo è privo di interesse per la statistica). Gli scopi della statistica sono di duplice natura: sintetizzare e generalizzare. Sintetizzare significa predisporre i dati raccolti in una forma (tabelle, grafici, sintesi numeriche) che consenta di comprendere meglio i fenomeni rispetto ai quali è stata eseguita la rilevazione. La sintesi viene incontro all esigenza di semplificare, che a sua volta deriva dalla limitata capacità della mente umana di gestire informazioni articolate o complesse o multidimensionali. I metodi orientati a soddisfare questa finalità appartengono alla statistica descrittiva. Il secondo scopo, generalizzare, è quello di estendere il risultato dell analisi effettuata sui dati di un gruppo limitato di unità statistiche (campione) all intera collettività di appartenenza (universo, o popolazione). L estensione avviene secondo metodi di induzione che rappresentano il contenuto della statistica inferenziale (o induttiva). Ogni giorno utilizziamo la statistica, in molti casi senza accorgercene. In attesa alla fermata di un autobus osserviamo le automobili che passano; contiamo quelle di fabbricazione italiana e straniera, quelle con un solo passeggero e quelle con più passeggeri. Usiamo mentalmente i metodi della statistica descrittiva. Le automobili di fabbricazione straniera sono prevalenti. Riusciamo a calcolare approssimativamente quanti passeggeri viaggiano mediamente su ciascuna vettura (dividendo il totale approssimato dei passeggeri per il totale, anch'esso approssimato, delle autovetture). Notiamo l intensificarsi del traffico mano a mano che passano i minuti. Facciamo inferenze, seppure non sorrette dal rigore dei metodi: le fabbriche straniere stanno invadendo il mercato italiano; il mezzo di trasporto privato è dispendioso; prevedibilmente, arriveremo in ritardo a scuola o al posto di lavoro. Quotidianamente siamo bersagliati da dati statistici. Spesso, le informazioni sono riferite nel contesto di una notizia descritta dal quotidiano che leggiamo o fornita in un telegiornale; qualche volta i dati sono offerti sotto forma di tabelle o grafici; altre volte si tratta di percentuali o di medie. Per questo è necessario attrezzarsi in forma adeguata per valutarli criticamente. Questi strumenti minimi di analisi dovrebbero far parte del bagaglio culturale di ogni cittadino. 3) Qualche definizione. Il primo passo dell attività statistica è la raccolta di dati. Questa prima fase deve essere ben organizzata per risparmiare fatica nelle operazioni successive e permettere, attraverso una corretta impostazione del lavoro di analisi, di giungere a informazioni corrette e quindi utili sul fenomeno di cui si sono rilevati i dati. Si dice unità statistica la minima unità della quale si raccolgono i dati. Si dice popolazione l insieme delle unità statistiche oggetto di studio. 1 Si dicono caratteri le proprietà che sono oggetto di rilevazione.

2 Così, in una indagine statistica sulla statura degli studenti delle scuole reggiane, ognuno di voi è una unità statistica, l insieme degli iscritti alle scuole di Reggio forma la popolazione e la statura è il carattere rilevato. I caratteri possono essere qualitativi o quantitativi. I caratteri qualitativi vengono indicati mediante espressioni verbali. Sono caratteri qualitativi lo stato civile (celibe o nubile, coniugato/a, ecc.), il sesso (maschio o femmina), il colore degli occhi (chiari, castani, neri; ma anche, grigi, azzurri, verdi, castani, neri). I caratteri quantitativi sono esprimibili numericamente e si dividono in discreti e continui. I caratteri (quantitativi) discreti, come il numero degli alunni di una classe o di reti segnate in una partita di calcio, quasi sempre sono quelli che possono essere numerati (nel senso di contati) e che quindi possono assumere solo determinati valori, quasi sempre numeri interi. I caratteri (quantitativi) continui, quali i pesi, le stature e più in generale le grandezze che possono essere misurate e non contate, possono assumere qualsiasi valore in un dato intervallo (anche se usualmente si impiegano numeri decimali finiti). 2 4) Statistica induttiva e statistica descrittiva. Sorge una discussione fra Miriana e Annalisa. Miriana afferma che i reggiani vanno al cinema assai raramente, in media non più di 3 volte all anno. Annalisa sostiene invece che, con l apertura dell Emiro e dei Petali, il cinema è tornato di moda, e i reggiani ci vanno, in media, almeno dieci volte l anno. Miriana e Annalisa, per risolvere l appassionante questione, decidono di dedicare qualche tempo a un indagine statistica. Avendo così tanto da studiare tutti giorni, le nostre hanno poco tempo, e allora evidentemente non possono intervistare tutti i reggiani: si limiteranno quindi a un campione opportunamente scelto. Ma a questo punto devono subito porsi due interrogativi: a) quale deve essere l ampiezza del campione affinché la stima sia attendibile e si possa essere ragionevolmente certi di aver individuato, con un accettabile margine di errore, il dato cercato? Basterà intervistare trenta persone, o ne occorreranno cento, oppure mille? b) come si può essere sicuri che il campione non sia distorto, ma sia rappresentativo dell intera popolazione? È evidente che sarebbe scorretto condurre l indagine all uscita di un cinema (M. e A. intuiscono che la probabilità di incontrare lì persone a cui piace andarci e quindi che presumibilmente ci vanno molte volte l anno è maggiore di quella di imbattersi in soggetti a cui il cinema fa schifo e quindi non ci vanno mai ), o fra gli ospiti di una casa di riposo (la cui frequentazione delle sale cinematografiche è prevedibilmente tutt altro che assidua); è meno ovvio, invece, se è preferibile intervistare le persone per strada oppure per telefono o nei parcheggi dei supermercati piuttosto che in quelli dell ospedale. La situazione proposta è un tipico problema di statistica induttiva (o inferenziale) : la rilevazione dei dati, anziché sull intera popolazione, è eseguita su una parte di essa, detta campione, e dall esame di quest ultimo si desumono informazioni (quanto attendibili?) sulla prima (come ho ricopiato dall ISTAT nel paragrafo 2), la statistica induttiva svolge cioè la funzione di generalizzare). Si tratta di questioni piuttosto complesse, la cui soluzione richiede la conoscenza di alcuni elementi della teoria della probabilità. Di statistica induttiva, poiché vi ho promesso che per svolgere l argomento statistica userò solo la matematica più elementare, non ci occuperemo.

3 Qui, infatti, mi limito ad alcuni elementi di statistica descrittiva, il cui compito è organizzare in modo facilmente dominabile (nel senso di utilizzabile) i dati raccolti sulla popolazione in esame. Gli strumenti della statistica descrittiva permettono di descrivere un fenomeno in modo efficace e immediato, cioè di sintetizzarlo (anche questo è già stato scritto nel paragrafo 2)), sollevando dalla fatica di leggere e interpretare troppi dati. Più precisamente, ci concentreremo su alcuni parametri con i quali si riassumono i dati rilevati, e quindi parleremo dei due strumenti più utilizzati dalla statistica (descrittiva): le medie e gli indici di dispersione. Più avanti, al paragrafo ), tratteremo l importante aspetto delle rappresentazioni grafiche dei dati. 5) Le medie. Il concetto di media è del tutto familiare, in quanto l uomo è per natura incline a riassumere dati discordanti per poter concentrare l attenzione sull intensità media di un carattere e poter più facilmente confrontare dati omogenei relativi a popolazioni diverse (ricordo che uso il termine popolazione nel suo significato tecnico visto più sopra). Molte nostre valutazioni e decisioni sono assunte, talvolta inconsciamente, facendo riferimento a valori medi. Così diciamo che il clima di Napoli è più caldo di quello di Torino, che gli italiani del Nord hanno un reddito maggiore di quelli del Sud, che i maschi sono più alti delle femmine, e così via. Dicendo questo, però, non vogliamo sostenere che a Napoli fa sempre più caldo che a Torino o che tutti gli abitanti del nord guadagnano di più di quelli del Sud o che non ci siano femmine più alte di qualche maschio. Le nostre affermazioni sotto intendono il concetto di media che viene colto da tutti anche se non è esplicitato. Da una sequenza di dati si possono ottenere varie medie, che assumono nomi diversi. Qualsiasi sia il tipo di media scelto, essa è un valore opportunamente scelto e compreso fra il minimo e il massimo dei dati. In tutti i casi, la media è un numero che ne sintetizza molti, e consente di averne una visione unitaria, ovviamente nascondendo la molteplicità dei dati da cui è ottenuta. Così, il reddito medio pro capite (= a testa) degli italiani è un valore unico, utile per fare confronti con altre nazioni o con periodi passati, ma non evidenzia che i redditi sono molto diversi e che ci sono persone al di sotto della soglia della povertà, mentre altre hanno redditi altissimi; oppure: la statura media ci consente di dire che gli svedesi sono, in media, più alti degli italiani, ma non evidenzia che molti italiani sono più alti di parecchi svedesi ecc.. Prenderemo in esame le seguenti medie: a) moda, b) mediana, c) media aritmetica semplice, d) media aritmetica ponderata e (forse) di media armonica. Non ci occuperemo invece, a meno che non me lo chiediate, di media quadratica e media geometrica, poiché vengono usate per fenomeni abbastanza particolari. 5a) Moda Si dice moda il carattere o il valore cui corrisponde la massima frequenza. Esempio 1a. La sequenza di numeri 5, 6, 8, 8, 8, 12, 12, 14 ha moda 8. La sequenza di numeri 5, 6, 8, 8, 8, 12, 14, 14, 14 ha due mode: 8 e 14. Nella sequenza di numeri: 1, 2, 3, 4, 5, 6 si potrebbe anche dire, a stretto rigore, che vi sono sei mode; ma è più ragionevole concludere che in questo caso la moda non esiste. 3

4 Esempio 2a. Si rileva il numero delle stanze di ciascuno dei 16 appartamenti di un condominio: Numero delle stanze Frequenze numero appartamenti del condominio La moda è 4 (stanze per appartamento) perché è quella la tipologia di appartamento più frequente. Esempio 3a. Il direttore di una catena di negozi di scarpe vuole provare a includere, fra gli articoli da vendere, anche un certo modello di una nuova marca. Decide di acquistare, almeno all inizio, un solo paio per ognuno dei suoi tanti punti vendita in modo da ridurre al minimo l investimento iniziale e, mettendolo nelle vetrine dei suoi tanti negozi, poter valutare correttamente l apprezzamento del pubblico. Volendo minimizzare il costo di questa sua prima fornitura decide quindi acquistare un unica misura. Per individuare quale misura è più opportuno scegliere, chiede la misura del piede a venti abituali clienti, ottenendo i seguenti dati: 36, 42, 41, 44, 34, 39, 38, 39, 37, 34, 40, 39, 35, 37, 39, 36, 39, 42, 45, 37. La moda è 39, e la scelta cadrà, evidentemente, su questa misura perché ad essa corrisponde la massima frequenza (pari a 5) del campione. In questo modo, a parità di investimento nell acquisto, la catena di negozi massimizzerà il ricavo di vendita. (E chiaro che il campione di soli 20 clienti è troppo piccolo per essere affidabile, ma mi scocciava scriverne di più). 5b) Mediana La mediana è il valore che occupa il posto di mezzo, quando i dati sono disposti in ordine crescente. In altre parole, i dati che la seguono sono tanti quanti quelli che la precedono. Esempio 1b. I voti di Pierino, intelligente ma discontinuo e scansafatiche, sono, in ordine crescente: 4, 5, 5, 6, 7, 8, 9. Il voto che occupa il posto di mezzo è 6, nel senso che ce ne sono tre più bassi e tre più alti. Notate che la mediana, come la moda ma a differenza della media aritmetica (vedi 4c più avanti), può essere usata anche quando i dati non hanno carattere numerico: è sufficiente che possano essere disposti in ordine crescente. Ad esempio, sostituendo i voti con dei giudizi: gravemente insufficiente, insufficiente, insufficiente, sufficiente, discreto, buono, ottimo. La mediana è sufficiente, mentre la media non si può calcolare. Esempio 2b. Consideriamo le seguenti sequenze di numeri e giudizi: (a): 7, 15, 18, 18, 19, 23 (b): mediocre, discreto, discreto, ottimo. (c): 9, 15, 16, 18, 19, 30 (d): mediocre, discreto, buono, ottimo. Quando i dati sono in numero pari esistono non uno, ma due valori centrali (18 e 18 in (a), discreto e discreto in (b), e 16 e 18 in (c) e discreto e buono in (d)) 4

5 Se i valori centrali coincidono, è naturale assumerli come mediana, per cui in (a) la mediana è 18 e in (b) è discreto. Se invece non coincidono, ma sono numeri, allora si assume come mediana la loro media aritmetica: in (c) la mediana è, quindi, (16 +18) / 2 = 17. Se, infine, i due dati centrali non coincidono e non hanno carattere numerico, come in (d), non si può parlare di mediana. Esempio 3b. La seguente tabella mostra la distribuzione delle età dei capi famiglia degli Stati Uniti nell anno (di grazia, perché sono nato io) 1956: Età del capo famiglia Numero in milioni Numero progressivo fino a 25 2,22 2, ,05 6, ,08 11, ,45 21, ,47 31, ,63 37, ,16 42,06 75 o più 1,66 43, ,72 (milioni di capofamiglia) Il totale delle frequenze è, in milioni, 43,72 e la sua metà è 21,86 (43,72 /2 = 21,86). Poiché la somma delle frequenze delle prime quattro classi è 21,8 (2,22 + 4,05 + 5, ,45 = 21,8) e quindi (seppure di poco) inferiore a tale valore, l età mediana si colloca all inizio della quinta classe. Possiamo concludere che l età mediana dei capi famiglia è (di pochissimo superiore a) 45 anni, nel senso che quelli più giovani rispetto a tale età sono tanti quanti quelli più vecchi. Moda e mediana hanno un vasto campo di applicazione, ma può succedere che, cambiando alcuni dei dati anche in modo vistoso, restino del tutto invariate. Ciò in qualche caso toglie efficacia a tali medie e sembra andare contro il senso comune. Consideriamo, ad esempio, i voti di Sara: Voti del primo quadrimestre: 1, 5, 5, 5, 6, 6, 6 La mediana è 5 e vi sono due mode: 5 e 6. Voti del secondo quadrimestre: 4, 5, 5, 5, 6, 8, 10 La mediana è 5 e l unica moda è 5. Il netto miglioramento dei voti di Sara nel secondo quadrimestre rispetto a quelli del primo non viene recepito da queste due medie (la moda e la mediana). Infatti: la sostituzione dell 1 iniziale con il 4 e di due 6 con un 8 e un 10 non ha portato alcun beneficio alla mediana e, paradossalmente, l 8 e il 10 hanno sortito l effetto di far sparire, delle due mode, quella favorevole (6) dando così l idea che Sara nel secondo quadrimestre sia peggiorata. Ecco allora che più spesso si utilizzano le altre medie, (m. aritmetica semplice, m. aritmetica ponderata e le altre che non facciamo) che tengono conto di tutti i dati, indipendentemente dal loro ordine. Variando, anche di poco, anche uno solo dei dati, queste altre variano con continuità e senza salti. Queste medie, però, si possono usare solamente per dati numerici e non con quelli qualitativi. 5

6 5c) Media aritmetica semplice Dati n valori X1, X2,..., Xn, si dice media aritmetica semplice (o semplicemente media aritmetica o media) il valore che si ottiene dividendo la loro somma per il loro numero n. indicando con Ma la media aritmetica, in formula si ha: X1+ X Xn Ma = n Esempio 1c. La media aritmetica Ma dei numeri 3, 7, 8, 9, 11 e 16 è: Ma = ( ) / 6 = 54 / 6 = 9 Esempio 2c. In un cantiere lo stipendio mensile dei quattro apprendisti è 800, dei venti operai è 1.200, del capocantiere La media aritmetica degli stipendi è in euro: Ma = (4 x x x 2.400) / 25 = / 25 = La media aritmetica è di gran lunga la più nota e usata delle medie. Il suo uso acritico e indiscriminato deve però essere evitato: non è vero che, se io ho due polli e tu nessuno, è come se avessimo un pollo a testa (come si sente dire, per denigrare la statistica, da chi non conosce la statistica ma solo il più rozzo dei suoi strumenti, la media aritmetica); così come non è vero che per due amiche sia indifferente andare in vacanza con due ragazzi alti 180 cm, oppure con uno alto 120 cm e l altro alto 240 cm. È invece indifferente se su un ascensore, di portata massima 240 Kg, salgono tre persone il cui peso è 50 Kg, 70 Kg e 120 Kg rispettivamente, o tre persone tutte del peso di 80 Kg. In generale, ogni qualvolta ha senso sommare i dati, l uso della media aritmetica è appropriato. In tal caso essa esprime quale sarebbe l intensità costante del carattere in esame, se fosse ripartita in parti uguali. 6 5d) Media aritmetica ponderata Spesso, anziché la media aritmetica semplice, si usa la media ponderata: assegnati agli n valori X1, X2,..., Xn i pesi p1, p2,..., pn proporzionali all importanza che vogliamo loro attribuire, la media aritmetica ponderata (o semplicemente media ponderata ) è: X1 x p1 + X 2 x p X n x pn p1 + p pn Esempio 1d. In una verifica di contabilità ci sono tre esercizi, i primi due brevi, facili e su una parte trascurabile del programma; il terzo impegnativo e su una parte importante del programma. L insegnante, ritenendo corretto assegnare nella valutazione complessiva della prova più importanza al terzo esercizio rispetto agli altri due, dà peso 1 a ognuno dei primi due esercizi e peso 3 al terzo esercizio (in altre parole: il terzo esercizio è considerato tre volte più importante di ognuno degli altri due). I voti che hai preso sono: 1 esercizio: 9; 2 esercizio: 10; 3 esercizio: 2. La media aritmetica è un bel ( ) / 3 = 7; (9 x x x 3) / ( ) = 25 / 5 = 5 purtroppo il voto nella verifica sarà solo 5, infatti: La media ponderata dei voti (5) esprime meglio di quella aritmetica (7) la reale preparazione dello studente (ammesso che le considerazioni dell insegnante circa l importanza degli argomenti siano ragionevoli. Le mie lo sono sempre.).

7 (30 Esempio 2d. Supponiamo che in Italia l intera spesa per alimentazione si concentri su tre cibi: pane, carne e verdura. Supponiamo poi che nel corso del 2013 il prezzo della carne sia aumentato dell 1%, quello della frutta e verdura del 3% e quello del pane del 32%. Supponiamo infine che gli italiani destinino alla carne il 50% della spesa per alimenti, alla frutta e verdura il 40% e al pane il rimanente 10%. Genere alimentare Incremento prezzo nel corso del 2013 % spesa sul totale spesa alimentare Pane + 32% 10% Carne + 1% 50% Verdura + 3% 40% Media aritmetica incrementi (1% + 3% + 32%) / 3 = 36 / 3 12,0% Media ponderata incrementi (1% x 0,5 + 3% x 0,4 + 32% x 0,1) / (0,5 + 0,4 + 0,1) 4,9% La media ponderata dell aumento dei prezzi (4,9%) esprime meglio di quella aritmetica (12%) il reale maggior costo che le famiglie devono sopportare ora, rispetto all anno precedente, per l alimentazione. 7 5e) Media armonica Anticipo subito che la media armonica può apparire, leggendo la sua definizione, molto astratta, scarsamente utile e lontana dalla realtà. Questa media, invece, ha importanti applicazioni pratiche, soprattutto in campo economico. Ma vediamo la definizione:.dati n valori X1, X2,..., Xn, si dice media armonica l inverso della media aritmetica dei loro inversi; indicando con MA la media armonica, in formula si ha: 1 n MA = da cui: MA = X 1 X 2 X n X 1 X 2 X n n Esempio 1e. Percorro 21 Km alla velocità di 30 Km/h e altri 21 Km alla velocità di 70 Km/h. Qual è la velocità media? La risposta corretta non si ottiene facendo la media aritmetica delle due velocità: Media aritmetica delle velocità:. + 70) / 2 = 50 Km/h. e nemmeno facendo la media ponderata con le due distanze percorse a velocità diverse: [(30 x 21) + (70 x 21)] / ( ) = 50 km/h (la ponderata coincide con la semplice perché i pesi sono uguali). 2 La media corretta è quella armonica: = 42 km/h Infatti: dette s 1 e s 2 le lunghezze (uguali) dei due tratti e v 1 e v 2 le due velocità, il tempo t 1 impiegato nel primo tratto è t 1 = s 1 / v 1 = 21/ 30 = 0,7 ore; il tempo t 2 impiegato nel secondo tratto è t 2 = s 2 / v 2 = 21/ 70 = 0,3 ore. Il tempo complessivo è quindi (0,7 + 0,3) pari a un ora. La media corretta è quindi 42 km/h, cioè proprio la media armonica delle due velocità. Ecco ora un applicazione della media armonica in economia (frenate l entusiasmo):

8 Un metodo efficace per effettuare buoni investimenti a lunga scadenza è destinare a intervalli costanti la stessa somma all acquisto dello stesso bene. In questo modo se ne acquista un elevata quantità quando i prezzi sono bassi e una quantità modesta quando i prezzi sono alti, ottenendo un prezzo medio di acquisto più basso di quanto avverrebbe acquistando ogni volta una quantità costante di quel bene. Esempio 2e. Un risparmiatore investe, in ciascuno di tre acquisti successivi, per comperare monete d oro la cui quotazione è una volta di 80, la seconda 60 e la terza volta di 40. Qual è il prezzo medio di acquisto? Il profano direbbe ( ) / 3 = 60, e sbaglierebbe. Infatti: Il risparmiatore acquista la prima volta / 80 = 30 monete, la seconda volta / 60 = 40 monete e la terza volta / 40 = 60 monete. Complessivamente spende (2.400 x 3 =) per procurarsi ( =)130 monete, ognuna delle quali gli è quindi costata mediamente / 130 = 55,38. Tale prezzo, come si verifica facilmente, è proprio la media armonica dei due prezzi d acquisto. 3 La media corretta è quella armonica: = 55, ) Gli indici di dispersione. Le medie riassumono in un unico valore il fenomeno studiato, ma non forniscono alcuna informazione sulla sua variabilità. Esempio 1a. Si scopre che Marte è abitato da una specie intelligente simile alla nostra. Misurate le altezze di sette marziani adulti, si trova che moda, mediana e media aritmetica coincidono e valgono 170 cm. Una possibile sequenza di dati che soddisfa tali condizioni è questa: (a) 169, 169, 170, 170, 170, 171, 171 La variabilità è piccolissima e pare che l altezza dei marziani sia quasi costante. Anche per quest altra sequenza, però, moda, mediana e media aritmetica sono tutte pari a 170: (b) 161, 163, 170, 170, 173, 175, 178 La variabilità riscontrata è maggiore ed è simile a quella della statura umana. Ma anche per questa terza serie di marziani moda, mediana e media aritmetica sono di 170: (c) 80, 100, 120, 170, 170, 250, 300 La variabilità ora è notevole: su Marte ci sono nani e giganti. Risulta quindi evidente che, ai fini di una descrizione sintetica ma significativa, è necessario definire dei parametri che indichino la dispersione dei dati o anche (è l altra faccia di una stessa medaglia) la loro maggiore o minore concentrazione attorno a un valore medio. 8

9 5a) Campo di variazione Il campo di variazione, è la differenza fra il minimo e il massimo dei valori osservati. Il campo di variazione è la più immediata e semplice misura della variabilità. Nell esempio 1a. dei marziani, il campo di variazione è 2 cm per la serie di dati (a), 17 cm per (b), 220 cm per (c) e risulta notevolmente significativo (= dà una idea valida della variabilità dell altezza dei marziani). Purtroppo, però, il campo di variazione è, nella maggior parte dei casi, un misuratore troppo rozzo della variabilità per essere utile. Ciò perché tiene conto soltanto dei due valori estremi e non è influenzato in alcun modo da quelli intermedi. Esempio 2a. Prendiamo tre classi, (a) (b) e (c), tutte con 20 alunni e stessa media complessiva di voti in pagella dei loro alunni (la media, e anche la mediana, nelle tre classi è sempre 6): nella classe (a) ci sono un 2, un 10 e ben diciotto 6, ( x 18) / 20 = 6 di media aritmetica; nella classe (b) ci sono sei 2, sei 10 e otto 6, (2 x x x 8) / 20 = 6 di media aritmetica; nella classe (c) ci sono nove 2, nove 10 e solo due 6 (2 x x x 2) / 20 = 6 di media aritmetica. Che la variabilità del profitto scolastico sia decisamente diversa nelle tre classi è evidente: la classe (a) è formata da alunni il cui profitto è decisamente omogeneo (sono tutti sufficienti tranne un caso disastroso e un campione), mentre nelle altre due l andamento scolastico è nettamente più differenziato. Il campo di variazione (pari per tutte a 8), però, non denuncia minimamente questa diversità fra le tre classi. Si deve quindi ricorrere a indici di dispersione meno rozzi. 5b) Lo scarto semplice medio. Chiamiamo scarto la differenza fra il valore che assume il carattere di ogni unità statistica e il valore della media (una media qualsiasi: moda, mediana, media aritmetica ecc.); in parole più semplici: scarto = valore del dato media dei dati. Essendo la media un valore compreso fra il minimo e il massimo dei dati, alcuni scarti saranno positivi e altri negativi e più o meno si compenseranno gli uni con gli altri. Anzi, nel caso della media aritmetica gli scarti si compensano perfettamente, vale a dire che la somma degli scarti è, nella media aritmetica, sempre uguale a zero. La dimostrazione è riquadrata qui sotto, ma non è essenziale capirla. Però provateci, che è abbastanza semplice vi fa bene. Se non ci saltate fuori, fa niente. Infatti, se assegniamo n valori X1, X2,..., Xn e indichiamo con M la loro media aritmetica, il valore dei vari scarti sarà: X1 M, X2 M,..., Xn M. La somma degli scarti diventa quindi: S sc. = (X1 M) + (X2 M) (Xn M) che, raccogliendo M, posso scrivere anche così: S sc. = (X1 + X Xn) n M e quindi, sostituendo a M il suo (X 1+ X X n) significato, diventa: S sc. = (X1 + X Xn) n Semplificando per n il n sottraendo, rimane: S sc. = (X1 + X Xn) (X1 + X Xn) e quindi S sc. = 0 (c.d.d). La somma degli scarti calcolati da qualsiasi altra media sarà diversa da zero, ma comunque piccola e poco significativa. Sommare gli scarti così come sono, quindi, serve a nulla, poiché porta sempre allo stesso risultato, qualunque siano i valori di cui vogliamo sapere la variabilità. 9

10 È allora naturale considerare non gli scarti, ma i loro valori assoluti. Si dice valore assoluto di un numero il numero stesso, se è positivo o nullo; considerato è negativo. Lo si indica racchiudendolo fra due barre verticali:. Ad esempio, +7 = +7; 3 = +3; 9 = +9. il suo opposto, se il numero Lo scarto semplice medio da una media M è la media aritmetica dei valori assoluti degli scarti da M. Calcoliamo, per le sequenze di dati dell esempio 1, lo scarto semplice medio dal valore 170. Per (a) lo scarto semplice medio è pari a: Scarto semplice medio in (a) = ( ) / 7 = 4/7 = 0,57 cm, che significa: mediamente la statura di ogni marziano si differenzia da quella media di poco più di mezzo centimetro. Per (b) lo scarto semplice medio è pari a: Scarto semplice medio in (b) = ( ) /7 = 32 / 7 = 4,57 cm, che significa: mediamente la statura di ogni marziano si differenzia da quella media di 4,57 centimetri. Per (c), infine, lo scarto semplice medio vale: Scarto semplice medio in (c) = ( ) / 7 = 420 / 7 = 60 cm, che significa: mediamente la statura di ogni marziano si differenzia da quella media di ben 60 cm. Se provate a calcolare lo scarto semplice medio (rispetto alla media di 6) nell esempio 2 delle tre classi (non evidenzio tutti i passaggi per risparmiare tempo, ma credo sia ugualmente comprensibile) troviamo: scarto semplice medio nella classe (a), dove ci sono diciotto 6, un 2 e un 10: ( x 0) / 20 = 0,4 (mediamente gli alunni si scostano dal profitto medio della classe per 4 decimi di voto: la classe è omogenea) nella classe (b), dove ci sono sei 2, sei 10 e otto 6: [( 2 6 ) x 6 + ( 10 6 ) x 6 + ( 6 6 ) x 8] / 20 = 2,4 (in media il profitto degli studenti differisce per 2,4 voti da quello medio della classe: vi è molta variabilità) nella classe (c) ci sono nove 2, nove 10 e solo due 6: [( 2 6 ) x 9 + ( 10 6 ) x 9 + ( 6 6 ) x 2] / 20 = 3,6 (in media ogni alunno ha 3,6 voti in più o in meno della media della classe, il cui profitto risulta quindi estremamente vario.) 10

11 5c) Lo scarto quadratico medio (o deviazione standard). Questo paragrafo (tre pagine) è piuttosto difficile. Mancando il tempo per spiegarlo adeguatamente in classe, non preoccuparti se qualcosa non ti risulta comprensibile o anche se ci capisci nulla: non lo inserirò nel programma svolto. Tu, però, prova ugualmente a capirlo: male non ti fa. Un altro indice di dispersione è lo scarto quadratico medio, che si indica con s ed è cosi definito: s = [ (X1 M) 2 + (X 2 M) (X n M) 2 ] / n Calcoliamo, per ciascuna sequenza di dati dei marziani, lo scarto quadratico medio dal valore 170. Per (a): s = [( ) 2 + ( ) 2 + ( ) 2 + ( ) 2 + ( ) 2 + ( ) 2 + ( ) 2 ] / 7 = ( ) / 7 = 4/7 = 0,57 = 0,75 (scarto quadratico medio) Per (b): s = [( ) 2 + ( ) 2 + ( ) 2 + ( ) 2 + ( ) 2 + ( ) 2 + ( ) 2 ] / 7 = ( ) / 7 = 245/7 = 35 = 5,9 (scarto quadratico medio) Per (c): s = [(80 170) 2 + ( ) 2 + ( ) 2 + ( ) 2 + ( ) 2 + ( ) 2 + ( ) 2 ] / 7 = ( ) / 7 = /7 = = 74,5 (scarto quadr. medio) Caso scarto semplice medio scarto quadratico medio (a) 0,57 0,75 (b) 4,57 5,9 (c) 60,0 74,5 Dal raffronto qui di fianco si vede che lo scarto quadratico medio, o deviazione standard, è un indice più sensibile dello scarto semplice medio. Lo scarto semplice medio e lo scarto quadratico medio sono indici di dispersione significativi in quanto tengono conto di tutti i dati (e non solo dei due estremi, il minore e il maggiore, come fa il campo di variazione). Il secondo, nonostante sia matematicamente più complicato, è il più usato in statistica la per ragione che tento di spiegare nelle prossime due pagine. Perché lo scarto quadratico medio si usa più spesso del semplice. Supponiamo di aver rilevato, attraverso interviste a un campione rappresentativo, il numero di persone suddivise per classi di età che l altra sera hanno seguito la trasmissione Ballarò. I dati sono: 11 classi di da 0 da 10 da 20 da 30 da 40 da 50 da 60 da 70 da 80 età (anni) a 10 a 20 a 30 a 40 a 50 a 60 a 70 a 80 a 90 frequenza Per dare l idea del fenomeno con più efficacia e immediatezza è opportuno ricorrere a un grafico che evidenzi la distribuzione delle frequenze. Il grafico risultante è quello qui di fianco: Non avendo a disposizione le singole età, per calcolare la media aritmetica dell età degli spettatori ipotizziamo che gli appartenenti a una fascia di età abbiano tutti l età centrale della fascia. da 90 a 100

12 Tanto per fare un po di esercizio, calcoliamo la media aritmetica dell età degli spettatori: (il primo prodotto che appare 5x0 significa che vi sono zero spettatori della 1^ fascia di età di valore centrale 5; poi 8 con età media 15 anni ecc. ) (5x0+15x8+25x20+35x53+45x62+55x30+65x32+75x13+85x5+95x2) / ( ) = 47 anni. E realistico pensare che se l indagine avesse riguardato, invece di Ballarò, Dragon Ball o i Pokemon, allora la distribuzione delle frequenze sarebbe stata molto spostata a sinistra, verso le fasce d età più basse, e la media delle età magari risultava di 12 invece che 47. In entrambi i casi, comunque, le frequenze risultano avere una distribuzione particolare, non prevedibile con esattezza senza una indagine statistica. Ora, è importante sapere che per molti fenomeni, al contrario del caso precedente, accade che le frequenze di un dato carattere abbiano una distribuzione prevedibile, la cosiddetta distribuzione normale, ossia si distribuiscano in modo simmetrico e decrescente rispetto al valore della loro media, valore al quale spetta la massima frequenza. L andamento delle frequenze è, in questi casi, rappresentato quindi da una curva a campana, detta curva di Gauss. (Il tedesco Carl Friedrich Gauss fu un genio straordinario che, nella prima metà dell 800, diede un impulso formidabile alla matematica, alla statistica, alla geometria e fu anche un fisico e un astronomo di rilievo). 12 I fenomeni reali in cui questo si verifica sono molti: stature, pesi, i valori delle analisi del sangue, i valori ottenuti con misurazioni ripetute di una stessa grandezza ecc.. Nelle distribuzioni normali il valore massimo è dato, come ho già detto, dalla media aritmetica (ma anche dalla moda e dalla mediana, in quanto tutte e tre queste medie hanno lo stesso valore). Imparato questo, si può cominciare a capire perché la deviazione standard (e cioè lo scarto quadratico medio) è un dato importante: infatti, la forma più o meno slanciata della campana dipende dal suo valore (dal valore dello scarto quadratico medio). Nelle figure qui sopra sono rappresentate due distribuzioni normali che hanno stesso valore medio M e diversa ampiezza dovuta a differenti scarti quadratici medi: in quella a sinistra lo scarto quadratico medio s è maggiore e la curva è quindi meno ripida (le frequenze decrescono più dolcemente da entrambe le parti di M), in quella a destra s è minore e la curva è più ripida (le frequenze sono più addensate intorno al valore medio e decrescono più rapidamente quando ci si allontana da entrambe le parti di M). Si può dimostrare che, quando un carattere ha distribuzione normale, allora certamente: 1) 68,27% dei dati è compreso fra M s e M + s, 2) il 95,45% dei dati è compreso fra M 2s e M + 2s, 3) il 99,73% dei dati è compreso fra M 3s e M + 3s. Come già ho scritto, le curve a campana (Gauss-like) possono descrivere molti fenomeni. Supponiamo di considerare l'altezza degli italiani maschi. Analizziamo un campione rappresentativo di soggetti. Otterremo una curva a campana, centrata attorno a una media, ipotizziamo di 174 cm. Se la "deviazione standard" fosse 10 cm, circa il 95% (e precisamente il 95,45%) dei soggetti analizzati sarebbe compreso fra 154 cm e 194 cm. (174 2 x 10 e x 10). Ancora, se tra 1000 persone adulte si osserva un peso medio di 83 Kg con uno scarto quadratico medio di 10 Kg, si può affermare che circa 683 persone (il 68,27% di mille) hanno un peso compreso fra 73 e 93 Kg, circa 954 (il 95,45% di mille) persone hanno un peso compreso tra 63 Kg e 103 Kg e circa 997 (il 99,73% di mille) hanno un peso compreso fra 53 e 113 Kg. Oppure ancora: se le lampadine prodotte da una ditta hanno una durata media di 900 ore con uno scarto quadratico medio di 30 ore, si può affermare che il 68,27% delle lampadine avrà una durata compresa fra 870 ore e 930 ore, e la quasi totalità delle lampadine (il 99,73%) avrà una durata compresa fra 810 e 990 ore.

13 7) La rappresentazione grafica dei dati. Quest ultimo paragrafo è frutto di un copia incolla quasi completo. L ho preso da una dispensa tratta dal sito dell Istat, più precisamente da questo indirizzo: Chi volesse approfondire, fare esercizi o divertirsi altrimenti, si colleghi pure. Di mio, qui, c è solo l inserimento dei grafici a linee (che l Istat si è scordata di trattare nella sua dispensa), e questo ammonimento: qualunque sia il grafico scelto, è obbligatorio citare sempre la fonte dei dati! I principali tipi di grafici Esiste una grande varietà di rappresentazioni grafiche. I grafici più semplici e nello stesso tempo più efficaci e comunemente utilizzati sono: 1) i grafici a settori circolari (grafici a torta); 2) i grafici a barre; 3) gli istogrammi; 4) i grafici a linee (diagrammi cartesiani); 5) i grafici a punti. 1) I grafici a settori circolari (grafici a torta) I grafici a torta sono efficaci quando si vuole evidenziare il peso delle varie parti rispetto al totale. L ampiezza dei singoli settori (l ampiezza delle fette di torta) è proporzionale alla frequenza della modalità con cui si presenta il fenomeno indagato. Supponiamo di voler rappresentare la seguente distribuzione: Tabella 14 - Raccolta di rifiuti urbani differenziata per tipo di rifiuto. Italia - Anno 2001 (in tonnellate e composizioni percentuali) Il grafico a settori circolari calcolato sui valori percentuali che ne deriva è il seguente: Ogni settore del grafico rappresenta (in frequenza assoluta o, nell'esempio proposto, percentuale) il peso assunto da ciascuna modalità. 2) I grafici a barre Sono molto utilizzati per rappresentare la frequenza con cui si presentano le modalità di un carattere qualitativo (come sesso, religione praticata). Per esempio, abbiamo rilevato il carattere Sesso di 118 bambini di una scuola elementare. Sono risultati 75 bambini e 43 bambine. Possiamo visualizzare i risultati ottenuti in questo modo: L'asse verticale è graduato e serve per indicare la frequenza (assoluta, come nell esempio, o relativa) con cui le modalità si presentano. L'asse orizzontale serve soltanto come base di appoggio dell'elemento grafico (le 13

14 due barre). Se le modalità fossero numerose, potrebbe essere più efficace rappresentare il grafico ruotandolo sul foglio, ponendo cioè le barre orizzontalmente anziché verticalmente. Ad esempio, la seguente distribuzione degli studenti che frequentano lo stesso insegnamento in 20 università: si può rappresentare sul grafico che segue (nella pagina successiva): È anche possibile rappresentare contemporaneamente sullo stesso grafico due o più caratteri in diverse situazioni (di luogo o di tempo), come i dati presenti nella tabella 13 - Raccolta di rifiuti urbani per regione - Anno 2001 (in tonnellate) 14

15 Dal grafico è evidente la netta prevalenza in Italia della raccolta non differenziata dei rifiuti, nonché la variabilità geografica. Inoltre, soltanto per motivi di scala, non sono leggibili nel grafico i valori della modalità Rifiuti ingombranti per il Centro e per il Mezzogiorno. Il dato è invece presente in tabella (Tabella 13), alla quale bisogna quindi sempre riferirsi se si è interessati a un informazione numerica precisa. 3) Gli istogrammi Si usano per rappresentare graficamente dati quantitativi suddivisi in classi. Ogni frequenza è rappresentata dall'area di un rettangolo, la cui base è uguale all'ampiezza della classe e l'altezza è pari alla densità di frequenza, cioè al rapporto tra la frequenza della classe e l'ampiezza della classe stessa. Classi di uguale ampiezza Nota che l'ampiezza di ogni classe di età in questa tabella è uguale a 5. Infatti, l'età è una variabile quantitativa continua e la classe corrisponde all'intervallo continuo [20,25) che ha ampiezza 5. Il simbolo "[" sta a significare che l'età 20 è compresa in quella classe, mentre il simbolo ")" sta a significare che l'età 25 non è compresa. Nel grafico che segue rappresentiamo gli intervalli continui. 15

16 Classi di ampiezza diversa In questo secondo caso, si deve tenere conto del fatto che le classi hanno ampiezza diversa. La differenza fra la frequenza 26 nella classe e la frequenza 20 nella classe è molto meno marcata in base alle densità di frequenza di quanto lo sarebbe se si confrontassero le frequenze senza tener conto della diversa ampiezza delle classi. Anche se grafici a barre e istogrammi appaiono simili, sono concettualmente diversi: 4) I grafici a linee (diagrammi cartesiani) In genere, i grafici a linee si utilizzano per rappresentare fenomeni che si evolvono (= che cambiano) con continuità nel tempo. L asse delle ascisse (= l asse orizzontale) rappresenta il tempo, mentre sull asse delle ordinate (= l asse verticale) vengono indicate le modalità del carattere, cioè la sua intensità. I punti del piano cartesiano (= dell area del diagramma) che rappresentano le coppie di dati disponibili (data e relativa intensità) vengono uniti fra loro in modo da fermare una linea spezzata. Fonte: Istat 16

17 5) I grafici a punti Si usano per rappresentare il valore assunto da due variabili su una stessa unità statistica (per esempio il peso e l'altezza di una persona, oppure l'età e il suo reddito mensile). Attraverso questa rappresentazione è possibile verificare visivamente se le due variabili sono connesse, cioè se il comportamento di una è legato al comportamento dell'altra. Il grafico si costruisce su un piano individuato da due assi perpendicolari fra loro, graduati e orientati. Su ciascun asse è riportata l'unità di misura di una delle due variabili considerate. Le unità statistiche sono poi riportate sul piano nel modo seguente: ogni unità è rappresentata da un punto; i punti sono individuati attraverso le rispettive coordinate. Per esempio abbiamo rilevato su 10 atleti il peso (in Kg) e l'altezza (in cm). Allora, indicando con X il peso e con Y l'altezza, avremo: o a fini didattici Sul grafico ciascun atleta è rappresentato da un simbolo e dal nome. La posizione di ognuno sul piano è individuata dal punto di incrocio di due rette perpendicolari ai due assi che passano per i punti che indicano il peso e l'altezza dell'atleta. Così per esempio il punto che rappresenta Ettore si trova all'intersezione di due rette perpendicolari agli assi. La prima, sull'asse X, individua il livello relativo al peso di Ettore (Kg 69) e la seconda sull'asse Y, il livello corrispondente alla sua altezza (cm 179). Se non ci interessa il riferimento dei dati ai singoli atleti possiamo fare a meno di differenziare i simboli corrispondenti. Osservazione La disposizione dei punti sul piano permette di identificare con immediatezza eventuali relazioni esistenti fra le due variabili. Se ad esempio osserviamo la seguente situazione: 17

18 G. 1 - Atleti per peso e altezza: relazione lineare positiva tra le due variabili o a fini didattici si individua visivamente l'esistenza di una relazione lineare positiva tra le due variabili; lineare in quanto i punti tendono a disporsi lungo una retta. Positiva perché quando i valori di una variabile crescono anche quelli dell'altra variabile crescono e viceversa (al diminuire dei valori di una anche i valori dell'altra diminuiscono). Se invece i punti si dispongono sul piano in questo modo: a G. 2 - per prestazioni effettuate nei 400 metri piani e nel salto in alto: relazione lineare iva tra le due variabili o a fini didattici rileviamo l'esistenza di una relazione lineare negativa tra le due variabili; lineare in quanto come nel grafico precedente i punti tendono a disporsi lungo una retta; negativa perché all'aumentare dei valori assunti da una variabile, i valori assunti dall'altra tendono a diminuire. 18

Fonte: Esempio a fini didattici

Fonte: Esempio a fini didattici I principali tipi di grafici Esiste una grande varietà di rappresentazioni grafiche. I grafici più semplici e nello stesso tempo più efficaci e comunemente utilizzati sono: i grafici a barre i grafici

Dettagli

I principali tipi di grafici

I principali tipi di grafici I principali tipi di grafici Esiste una grande varietà di rappresentazioni grafiche. I grafici più semplici e nello stesso tempo più efficaci e comunemente utilizzati sono: I GRAFICI A BARRE I GRAFICI

Dettagli

I principali tipi di grafici

I principali tipi di grafici Home / Come utilizzare i dati statistici / Come presentare i dati: le rappresentazioni grafiche / I principali... Capitolo 4 24/24 Capitolo 4 13/24 I dati dell'istat per le vostre ricerche: un accesso

Dettagli

1) Le medie. 1a) Moda Si dice moda il carattere o il valore cui corrisponde la massima frequenza.

1) Le medie. 1a) Moda Si dice moda il carattere o il valore cui corrisponde la massima frequenza. In queste pagine ci occupiamo della parte più semplice della statistica, cioè di statistica descrittiva, il cui compito è organizzare in modo facilmente dominabile (nel senso di utilizzabile) i dati raccolti.

Dettagli

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni

Dettagli

STATISTICA. La Statistica è la scienza che studia i fenomeni collettivi utilizzando metodi matematici.

STATISTICA. La Statistica è la scienza che studia i fenomeni collettivi utilizzando metodi matematici. STATISTICA La Statistica è la scienza che studia i fenomeni collettivi utilizzando metodi matematici. Essa si occupa della tecnica per raccogliere ed elaborare Dati (studenti, abitanti, oggetti, ecc.)

Dettagli

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Statistica. Matematica con Elementi di Statistica a.a. 2015/16 Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati

Dettagli

Tipi di variabili. Indici di tendenza centrale e di dispersione

Tipi di variabili. Indici di tendenza centrale e di dispersione Tipi di variabili. Indici di tendenza centrale e di dispersione L. Boni Variabile casuale In teoria della probabilità, una variabile casuale (o variabile aleatoria o variabile stocastica o random variable)

Dettagli

Statistica. Campione

Statistica. Campione 1 STATISTICA DESCRITTIVA Temi considerati 1) 2) Distribuzioni statistiche 3) Rappresentazioni grafiche 4) Misure di tendenza centrale 5) Medie ferme o basali 6) Medie lasche o di posizione 7) Dispersione

Dettagli

Statistica Descrittiva Soluzioni 3. Medie potenziate

Statistica Descrittiva Soluzioni 3. Medie potenziate ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

Cosa studia la Statistica?

Cosa studia la Statistica? Cosa studia la Statistica? La statistica si interessa del rilevamento, dell elaborazione e dello studio dei dati. Il termine statistica ricorda proprio l origine di questa scienza nata come strumento per

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 Dott.ssa Antonella Costanzo a.costanzo@unicas.it TIPI DI MEDIA: GEOMETRICA, QUADRATICA, ARMONICA Esercizio 1. Uno scommettitore puntando una somma iniziale

Dettagli

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2 Sperimentazioni di Fisica I mod. A Statistica - Lezione 2 A. Garfagnini M. Mazzocco C. Sada Dipartimento di Fisica G. Galilei, Università di Padova AA 2014/2015 Elementi di Statistica Lezione 2: 1. Istogrammi

Dettagli

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici) Statistica La statistica può essere vista come la scienza che organizza ed analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva:

Dettagli

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione [1/2] Gli indici di variabilità consentono di riassumere le principali caratteristiche di una distribuzione (assieme alle medie) Le

Dettagli

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA. Lezione 4 DISTRIBUZIONE DI FREQUENZA 1 DISTRIBUZIONE DI PROBABILITA Una variabile i cui differenti valori seguono una distribuzione di probabilità si chiama variabile aleatoria. Es:il numero di figli maschi

Dettagli

Lezione n. 1 _Complementi di matematica

Lezione n. 1 _Complementi di matematica Lezione n. 1 _Complementi di matematica INTRODUZIONE ALLA STATISTICA La statistica è una disciplina che si occupa di fenomeni collettivi ( cioè fenomeni in cui sono coinvolti più individui o elementi )

Dettagli

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,

Dettagli

tabelle grafici misure di

tabelle grafici misure di Statistica Descrittiva descrivere e riassumere un insieme di dati in maniera ordinata tabelle grafici misure di posizione dispersione associazione Misure di posizione Forniscono indicazioni sull ordine

Dettagli

Sistemi di rappresentazione

Sistemi di rappresentazione Sistemi di rappresentazione Uno dei problemi che i geografi devono affrontare è la scelta e l utilizzo di un linguaggio specifico e al tempo stesso facilmente comprensibile. Nel passato essi si basavano

Dettagli

Questionario 1. Sono assegnati i seguenti dati

Questionario 1. Sono assegnati i seguenti dati Questionario 1. Sono assegnati i seguenti dati 30 30 10 30 50 30 60 60 30 20 20 20 30 20 30 30 20 10 10 40 20 30 10 10 10 30 40 30 20 20 40 40 40 dire se i dati illustrati sono unità statistiche valori

Dettagli

Teoria e tecniche dei test. Concetti di base

Teoria e tecniche dei test. Concetti di base Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi

Dettagli

1 4 Esempio 2. Si determini la distribuzione di probabilità della variabile casuale X = punteggio ottenuto lanciando un dado. Si ha immediatamente:

1 4 Esempio 2. Si determini la distribuzione di probabilità della variabile casuale X = punteggio ottenuto lanciando un dado. Si ha immediatamente: CAPITOLO TERZO VARIABILI CASUALI. Le variabili casuali e la loro distribuzione di probabilità In molte situazioni, dato uno spazio di probabilità S, si è interessati non tanto agli eventi elementari (o

Dettagli

Capitolo 3 Sintesi e descrizione dei dati quantitativi

Capitolo 3 Sintesi e descrizione dei dati quantitativi Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 3 Sintesi e descrizione dei dati quantitativi Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e tecnologie Alimentari" Unità

Dettagli

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative TRACCIA DI STUDIO Un indice di tendenza centrale non è sufficiente a descrivere completamente un fenomeno. Gli indici di dispersione assolvono il compito di rappresentare la capacità di un fenomeno a manifestarsi

Dettagli

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Fondamenti di Informatica Ester Zumpano Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Lezione 5 Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di

Dettagli

Statistica Sociale e Criminale

Statistica Sociale e Criminale Statistica Sociale e Criminale (12 CFU) A.A. 215/216 CdL Sociologia e Criminologia Simone Di Zio Dove siamo MODULO 2. La Statistica descrittiva 2.1 La rilevazione del dato statistico 2.2 La rappresentazione

Dettagli

L INDAGINE STATISTICA

L INDAGINE STATISTICA SCHEDA DI LAVORO: L INDAGINE STATISTICA ALUNNO:...CLASSE... L INDAGINE STATISTICA RACCOLTA DEI DATI RAPPRESENTAZIONE DEI DATI (GRAFICI) I VALORI DI SINTESI MEDIA MODA MEDIANA GRAFICI ISTOGRAMMA AEROGRAMMA

Dettagli

Una statistica è una quantità numerica il cui valore è determinato dai dati.

Una statistica è una quantità numerica il cui valore è determinato dai dati. STATISTICHE CAMPIONARIE Quando i dati sono molti e illeggibili nella forma grezza, si rende necessario introdurre quantità numeriche che possano essere usate per sintetizzarli. Queste misure riassuntive

Dettagli

Le rappresentazioni grafiche

Le rappresentazioni grafiche Le rappresentazioni grafiche Descrivono diversi aspetti dell informazione contenuta nei dati e si basano sulla rappresentazione di corrispondenze tra dati numerici e enti geometrici elementari (punti,

Dettagli

La sintesi delle distribuzioni

La sintesi delle distribuzioni Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Outline 1 Introduzione 2 3 4 Outline 1 Introduzione 2 3 4 Introduzione Analisi descrittiva monovariata: segue la raccolta dei dati e il calcolo

Dettagli

Esercitazioni di Statistica: ES.1.1

Esercitazioni di Statistica: ES.1.1 Esercitazioni di Statistica: ES.1.1 Le componenti fondamentali dell analisi statistica Unità statistica Oggetto dell osservazione di ogni fenomeno individuale che costituisce il fenomeno collettivo Carattere

Dettagli

SCHEDA DIDATTICA N 7

SCHEDA DIDATTICA N 7 FACOLTA DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA CIVILE CORSO DI IDROLOGIA PROF. PASQUALE VERSACE SCHEDA DIDATTICA N 7 LA DISTRIBUZIONE NORMALE A.A. 01-13 La distribuzione NORMALE Uno dei più importanti

Dettagli

x i. Δ x i

x i. Δ x i ITCS "R. LUXEMBURG" BO- AS 011-01 5CL MATEMATICA- COGOME: OME: VERIFICA UD 1.A : STATISTICA DESCRITTIVA (ORE ) DATA: 1] Data la serie del numero di componenti dei nuclei familiari rilevati in un gruppo

Dettagli

CORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità

CORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità CORSO DI LAUREA IN INFERMIERISTICA LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità Lezioni di Statistica VARIABILITA Si definisce variabilità la proprietà di alcuni fenomeni di assumere

Dettagli

Fonte:

Fonte: Fonte: http://www3.istat.it/servizi/studenti/valoredati/ prima sintesi dopo aver raccolto i dati punto di partenza per rappresentazione, lettura, interpretazione, elaborazione. caratteristiche: deve presentare

Dettagli

LA STATISTICA

LA STATISTICA http://www.biostatistica.unich.it LA STATISTICA E l insieme dei metodi che consentono di raccogliere, ordinare, riassumere, presentare ed analizzare dati e informazioni, trarne valide conclusioni e prendere

Dettagli

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Indicatori di Posizione e di Variabilità Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Indici Sintetici Consentono il passaggio da una pluralità

Dettagli

Statistica Un Esempio

Statistica Un Esempio Statistica Un Esempio Un indagine sul peso, su un campione di n = 100 studenti, ha prodotto il seguente risultato. I pesi p sono espressi in Kg e sono stati raggruppati in cinque classi di peso. classe

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Indici di posizione variabilità e forma per caratteri qualitativi Il seguente data set riporta la rilevazione

Dettagli

SCOPO DELL ANALISI DI CORRELAZIONE

SCOPO DELL ANALISI DI CORRELAZIONE CORRELAZIONE 1 SCOPO DELL ANALISI DI CORRELAZIONE STUDIARE LA RELAZIONE TRA DUE VARIABILI X E Y 2 diagrammi di dispersione un diagramma di dispersione (o grafico di dispersione) èuna rappresentazione grafica

Dettagli

Compiti tematici dai capitoli 2,3,4

Compiti tematici dai capitoli 2,3,4 Compiti tematici dai capitoli 2,3,4 a cura di Giovanni M. Marchetti 2016 ver. 0.8 1. In un indagine recente, i rispondenti sono stati classificati rispetto al sesso, lo stato civile e l area geografica

Dettagli

Rappresentazioni grafiche

Rappresentazioni grafiche Rappresentazioni grafiche Su una popolazione di n = 20 unità sono stati rilevati i seguenti fenomeni: stato civile (X) livello di scolarità (Y ) numero di figli a carico (Z) reddito in migliaia di (W )

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

Statistica. (Dr. Elvira Di Nardo)

Statistica. (Dr. Elvira Di Nardo) Statistica (Dr. Elvira Di Nardo) 80 ore = 10 crediti Orario: lun, mar,mer 9.30-11.30 Sede: AULA MAGNA (ex Fac. SMFN) Ricevimento: mer. 11.30-13.30 Esame: prova scritta (+ eventuale prova orale) Materiale

Dettagli

Lezione 2. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 2. A. Iodice. Distribuzioni unitarie

Lezione 2. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 2. A. Iodice. Distribuzioni unitarie Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 39 Outline 1 2 3 4 5 6 7 8 () Statistica 2 / 39 La distribuzione unitaria semplice di un carattere

Dettagli

STATISTICA 1 ESERCITAZIONE 6

STATISTICA 1 ESERCITAZIONE 6 STATISTICA 1 ESERCITAZIONE 6 Dott. Giuseppe Pandolfo 5 Novembre 013 CONCENTRAZIONE Osservando l ammontare di un carattere quantitativo trasferibile su un collettivo statistico può essere interessante sapere

Dettagli

Elementi di matematica - dott. I. GRASSI

Elementi di matematica - dott. I. GRASSI Gli assi cartesiani e la retta. Il concetto di derivata. È ormai d uso comune nei libri, in televisione, nei quotidiani descrivere fenomeni di varia natura per mezzo di rappresentazioni grafiche. Tali

Dettagli

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio Corso di Laurea: Diritto per le Imprese e le istituzioni a.a. 2016-17 Statistica Statistica Descrittiva 3 Esercizi: 5, 6 Docente: Alessandra Durio 1 Contenuti I quantili nel caso dei dati raccolti in classi

Dettagli

Statistica - Esercitazione 1 Dott. Danilo Alunni Fegatelli

Statistica - Esercitazione 1 Dott. Danilo Alunni Fegatelli Esercizio 1: Statistica - Esercitazione 1 Dott. Danilo Alunni Fegatelli danilo.alunnifegatelli@uniroma1.it (a) Religione (b) Reddito familiare (c) Salario in Euro (d) Classe di reddito (I, II, ecc.) (e)

Dettagli

Livello di misura Scala Nominale Scala Ordinale Scala di Rapporti. Scala Nominale

Livello di misura Scala Nominale Scala Ordinale Scala di Rapporti. Scala Nominale Esercitazione Supponiamo che il collettivo che si vuole studiare sia composto da un gruppo di turisti. La seguente tabella raccoglie l osservazione di alcuni caratteri di interesse. Costo Soggetto Titolo

Dettagli

Statistica a.a Autovalutazione 1

Statistica a.a Autovalutazione 1 Statistica a.a. 016-17 Autovalutazione 1 CORSO: Diritto per le Imprese e le Istituzioni ATTENZIONE: alle domande aperte è stato dato un possibile esempio di risposta, altre parole possono essere usate

Dettagli

La distribuzione delle frequenze. T 10 (s)

La distribuzione delle frequenze. T 10 (s) 1 La distribuzione delle frequenze Si vuole misurare il periodo di oscillazione di un pendolo costituito da una sferetta metallica agganciata a un filo (fig. 1). A Figura 1 B Ricordiamo che il periodo

Dettagli

Istituzioni di Statistica e Statistica Economica

Istituzioni di Statistica e Statistica Economica Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 1 A. I dati riportati nella seguente tabella si riferiscono

Dettagli

Indici di Dispersione

Indici di Dispersione Indici di Dispersione Si cercano indici di dispersione che: utilizzino tutti i dati {x 1, x 2,..., x n } siano basati sulla nozione di scarto (distanza) dei dati rispetto a un centro d i = x i C ad esempio,

Dettagli

3) In una distribuzione di frequenza si può ottenere più di una moda Vero Falso

3) In una distribuzione di frequenza si può ottenere più di una moda Vero Falso CLM C Verifica in itinere statistica medica 13-01-2014 1) Indicate a quale categoria (Qualitativa, qualitativa ordinabile, quantitativa discreta, quantitativa continua) appartengono le seguenti variabili:

Dettagli

GEOMETRIA ANALITICA. Il Piano cartesiano

GEOMETRIA ANALITICA. Il Piano cartesiano GEOMETRIA ANALITICA La geometria analitica consente di studiare e rappresentare per via algebrica informazioni di tipo geometrico. Lo studio favorisce una più immediata visualizzazione di informazioni,

Dettagli

LE MISURE DI TENDENZA CENTRALE. Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva

LE MISURE DI TENDENZA CENTRALE. Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva LE MISURE DI TENDENZA CENTRALE Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva Individuare un indice che rappresenti significativamente un insieme di dati statistici

Dettagli

DISTRIBUZIONE NORMALE (1)

DISTRIBUZIONE NORMALE (1) DISTRIBUZIONE NORMALE (1) Nella popolazione generale molte variabili presentano una distribuzione a forma di campana, bene caratterizzata da un punto di vista matematico, chiamata distribuzione normale

Dettagli

Esercizi di statistica descrittiva. Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena / 30

Esercizi di statistica descrittiva. Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena / 30 Esercizi di statistica descrittiva Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena 2015-2016 1 / 30 Esercizio 1 Nel rilevare l altezza di un gruppo di reclute,

Dettagli

STATISTICHE DESCRITTIVE Parte II

STATISTICHE DESCRITTIVE Parte II STATISTICHE DESCRITTIVE Parte II INDICI DI DISPERSIONE Introduzione agli Indici di Dispersione Gamma Differenza Interquartilica Varianza Deviazione Standard Coefficiente di Variazione introduzione Una

Dettagli

Università degli Studi di Verona

Università degli Studi di Verona Università degli Studi di Verona CdL in Economia e Commercio a.a. 2010/2011 STATISTICA Esercitazioni: Annamaria Guolo Rappresentazioni grafiche e distribuzioni di frequenza: SOLUZIONI Esercizio 2 a) I

Dettagli

Elementi di statistica

Elementi di statistica Scuola media G. Ungaretti Elementi di statistica Prof. Enrico Castello Ti insegnerò a conoscere i criteri organizzatori di una tabella di dati distinguere frequenze assolute e frequenze percentuali determinare

Dettagli

Corso di Statistica. Medie,Moda. Prof.ssa T. Laureti a.a Corso di Statistica a.a DEIM, Univ.TUSCIA - Prof.

Corso di Statistica. Medie,Moda. Prof.ssa T. Laureti a.a Corso di Statistica a.a DEIM, Univ.TUSCIA - Prof. Corso di Statistica Indici di posizione: Medie,Moda Mediana, Quartili, Percentili Prof.ssa T. Laureti a.a. 203-204 Indicatori sintetici Gli aspetti più importanti di una distribuzione di frequenza riguardano:.

Dettagli

01 - Elementi di Teoria degli Insiemi

01 - Elementi di Teoria degli Insiemi Università degli Studi di Palermo Scuola Politecnica Dipartimento di Scienze Economiche, Aziendali e Statistiche Appunti del corso di Matematica 01 - Elementi di Teoria degli Insiemi Anno Accademico 2015/2016

Dettagli

Elementi di Statistica

Elementi di Statistica Università degli Studi di Palermo Dipartimento di Ingegneria Informatica Informatica ed Elementi di Statistica 3 c.f.u. Anno Accademico 2010/2011 Docente: ing. Salvatore Sorce Elementi di Statistica Statistica

Dettagli

2. Variabilità mediante il confronto di valori caratteristici della

2. Variabilità mediante il confronto di valori caratteristici della 2. Variabilità mediante il confronto di valori caratteristici della distribuzione Un approccio alternativo, e spesso utile, alla misura della variabilità è quello basato sul confronto di valori caratteristici

Dettagli

La statistica descrittiva per le variabili quantitative

La statistica descrittiva per le variabili quantitative La statistica descrittiva per le variabili quantitative E la sintesi dei dati Gli indici di posizione/tendenza centrale OBIETTIVO Individuare un indice che rappresenti significativamente un insieme di

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Indici di posizione e di variabilità Prof. Livia De Giovanni lstatistica@dis.uniroma1.it Esercizio 1 Data la seguente distribuzione unitaria del carattere X: X : 4 2 4 2 6 4

Dettagli

http://www.biostatistica.unich.it 1 STATISTICA DESCRITTIVA Le misure di tendenza centrale 2 OBIETTIVO Individuare un indice che rappresenti significativamente un insieme di dati statistici. 3 Esempio Nella

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

UNITÀ DIDATTICA 5 LA RETTA

UNITÀ DIDATTICA 5 LA RETTA UNITÀ DIDATTICA 5 LA RETTA 5.1 - La retta Equazione generica della retta Dalle considerazioni emerse nel precedente capitolo abbiamo compreso come una funzione possa essere rappresentata da un insieme

Dettagli

MISURE DI SINTESI 54

MISURE DI SINTESI 54 MISURE DI SINTESI 54 MISURE DESCRITTIVE DI SINTESI 1. MISURE DI TENDENZA CENTRALE 2. MISURE DI VARIABILITÀ 30 0 µ Le due distribuzioni hanno uguale tendenza centrale, ma diversa variabilità. 30 0 Le due

Dettagli

SCHEDA DI APPROFONDIMENTO

SCHEDA DI APPROFONDIMENTO SCHEDA DI APPROFONDIMENTO L'elaborazione dei dati continui Per quanto riguarda l'analisi di un'indagine statistica costituita da dati continui, l'elaborazione dei dati, proprio percheâ i valori appartengono

Dettagli

LABORATORIO DI CIRCUITI ELETTRICI Nozioni generali e guida agli esperimenti. Rappresentazione grafica dei risultati sperimentali

LABORATORIO DI CIRCUITI ELETTRICI Nozioni generali e guida agli esperimenti. Rappresentazione grafica dei risultati sperimentali LABORATORIO DI CIRCUITI ELETTRICI Nozioni generali e guida agli esperimenti Rappresentazione grafica dei risultati sperimentali Uno strumento molto utile per comunicare e leggere risultati sperimentali

Dettagli

Corso di Statistica (canale P-Z) A.A. 2009/10 Prof.ssa P. Vicard LA VARIABILITÀ

Corso di Statistica (canale P-Z) A.A. 2009/10 Prof.ssa P. Vicard LA VARIABILITÀ Corso di Statistica (canale P-Z) A.A. 009/0 Prof.ssa P. Vicard LA VARIABILITÀ Mediante i valori medi abbiamo cercato di sintetizzare una distribuzione statistica mediante un solo valore tipico. Questo

Dettagli

Università di Cassino Corso di Statistica 1 Esercitazione del 15/10/2007 Dott. Alfonso Piscitelli. Esercizio 1

Università di Cassino Corso di Statistica 1 Esercitazione del 15/10/2007 Dott. Alfonso Piscitelli. Esercizio 1 Università di Cassino Corso di Statistica 1 Esercitazione del 15/10/2007 Dott. Alfonso Piscitelli Esercizio 1 Il seguente data set riporta la rilevazione di alcuni caratteri su un collettivo di 20 soggetti.

Dettagli

STATISTICA 1 ESERCITAZIONE 2

STATISTICA 1 ESERCITAZIONE 2 Frequenze STATISTICA 1 ESERCITAZIONE 2 Dott. Giuseppe Pandolfo 7 Ottobre 2013 RAPPRESENTAZIONE GRAFICA DEI DATI Le rappresentazioni grafiche dei dati consentono di cogliere la struttura e gli aspetti caratterizzanti

Dettagli

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi ISTITUZIONI DI STATISTICA A A 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

Scale di Misurazione Lezione 2

Scale di Misurazione Lezione 2 Last updated April 26, 2016 Scale di Misurazione Lezione 2 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura II anno, II semestre Tipi di Variabili 1 Scale di Misurazione 1. Variabile

Dettagli

2. I numeri reali e le funzioni di variabile reale

2. I numeri reali e le funzioni di variabile reale . I numeri reali e le funzioni di variabile reale Introduzione Il metodo comunemente usato in Matematica consiste nel precisare senza ambiguità i presupposti, da non cambiare durante l elaborazione dei

Dettagli

UNIVERSITÀ DEGLI STUDI DI ROMA LA SAPIENZA

UNIVERSITÀ DEGLI STUDI DI ROMA LA SAPIENZA UNIVERSITÀ DEGLI STUDI DI ROMA LA SAPIENZA - 9.Statistica - CTF Matematica - Seconda Parte Codice Compito: - Numero d Ordine D. 1 Un veicolo marcia per 50 km alla velocita v, e per altri 50 km alla velocita

Dettagli

Tabella per l'analisi dei risultati

Tabella per l'analisi dei risultati Vai a... UniCh Test IV_Statistica_Eliminatorie Quiz IV_Statistica_Eliminatorie Aggiorna Quiz Gruppi visibili Tutti i partecipanti Info Anteprima Modifica Risultati Riepilogo Rivalutazione Valutazione manuale

Dettagli

Parlami un po di te. https://goo.gl/forms/j3scuxwrmcd2toxi3

Parlami un po di te. https://goo.gl/forms/j3scuxwrmcd2toxi3 Parlami un po di te. https://goo.gl/forms/j3scuxwrmcd2toxi3 STATISTICA DISCIPLINA CHE STUDIA I FENOMENI COLLETTIVI, CIOE FENOMENI RIGUARDANTI UNA GRANDE MOLTITUDINE DI PERSONE O COSE UN INDAGINE STATISTICA

Dettagli

La regressione lineare. Rappresentazione analitica delle distribuzioni

La regressione lineare. Rappresentazione analitica delle distribuzioni La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta

Dettagli

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 4: Rappresentazioni grafiche

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 4: Rappresentazioni grafiche Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 4: Rappresentazioni grafiche 1 Una rappresentazione grafica Per una rappresentazione sintetica della

Dettagli

Indici di variabilità relativa

Indici di variabilità relativa Fonti e strumenti statistici per la comunicazione Prof.ssa Isabella Mingo A.A. 2014-2015 Indici di variabilità relativa Consentono di effettuare confronti sulla variabilità di fenomeni che presentano unità

Dettagli

La Statistica: introduzione e approfondimenti

La Statistica: introduzione e approfondimenti La Statistica: introduzione e approfondimenti Definizione di statistica Che cosa è la statistica? La statistica è una disciplina scientifica che trae i suoi risultati dalla raccolta, dall elaborazione

Dettagli

Lezione 4: Indici di posizione Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Lezione 4: Indici di posizione Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria Lezione 4: Indici di posizione Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Indice di posizione Obiettivo di una misura di posizione è quello di

Dettagli

ALCUNI STRUMENTI DELLA GEOGRAFIA. La scala Le carte geografiche Gli atlanti

ALCUNI STRUMENTI DELLA GEOGRAFIA. La scala Le carte geografiche Gli atlanti ALCUNI STRUMENTI DELLA GEOGRAFIA La scala Le carte geografiche Gli atlanti La scala A che cosa fa pensare subito la parola scala in geografia? Alle CARTE GEOGRAFICHE perché sono rappresentazioni convenzionali

Dettagli

1.4 Geometria analitica

1.4 Geometria analitica 1.4 Geometria analitica IL PIANO CARTESIANO Per definire un riferimento cartesiano nel piano euclideo prendiamo: Un punto detto origine i Due rette orientate passanti per. ii Due punti e per definire le

Dettagli

Con riferimento ai dati riportati nella seguente tabella, indicare la tipologia dei caratteri rilevati.

Con riferimento ai dati riportati nella seguente tabella, indicare la tipologia dei caratteri rilevati. Corso di Laurea INTERFACOLTÀ - Esercitazione di Statistica n 1 ESERCIZIO 1: Con riferimento ai dati riportati nella seguente tabella, indicare la tipologia dei caratteri rilevati. ESERCIZIO 1 Soluzione:

Dettagli

Disequazioni di secondo grado

Disequazioni di secondo grado Disequazioni di secondo grado. Disequazioni Definizione: una disequazione è una relazione di disuguaglianza tra due espressioni. Detti p() e g() due polinomi definiti in un insieme A, una disequazione

Dettagli

Statistica descrittiva II

Statistica descrittiva II Probabilità e Statistica Esercitazioni a.a. 009/010 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Statistica descrittiva II Ines Campa Probabilità e Statistica - Esercitazioni

Dettagli

Nozioni di statistica

Nozioni di statistica Nozioni di statistica Distribuzione di Frequenza Una distribuzione di frequenza è un insieme di dati raccolti in un campione (Es. occorrenze di errori in seconda elementare). Una distribuzione può essere

Dettagli

Variabilità o Dispersione Definizione Attitudine di un fenomeno ad assumere diverse modalità

Variabilità o Dispersione Definizione Attitudine di un fenomeno ad assumere diverse modalità Punti deboli della media aritmetica Robustezza: sensibilità ai valori estremi Non rappresentava nei confronti di distribuzioni asimmetriche. La media aritmetica è un valore rappresentativo nei confronti

Dettagli

Condizione di allineamento di tre punti

Condizione di allineamento di tre punti LA RETTA L equazione lineare in x e y L equazione: 0 con,,, e non contemporaneamente nulli, si dice equazione lineare nelle due variabili e. Ogni coppia ; tale che: 0 si dice soluzione dell equazione.

Dettagli

Test d Ipotesi Introduzione

Test d Ipotesi Introduzione Test d Ipotesi Introduzione Uno degli scopi più importanti di un analisi statistica è quello di utilizzare i dati provenienti da un campione per fare inferenza sulla popolazione da cui è stato estratto

Dettagli

ESPONENZIALI. n volte

ESPONENZIALI. n volte Corso di laurea: BIOLOGIA Tutor: Floris Marta; Max Artizzu PRECORSI DI MATEMATICA ESPONENZIALI IL CONCETTO DI POTENZA E LA SUA GENERALIZZAZIONE L elevamento a potenza è un operazione aritmetica che associa

Dettagli

LEZIONI DI STATISTICA MEDICA

LEZIONI DI STATISTICA MEDICA LEZIONI DI STATISTICA MEDICA A.A. 2010/2011 Lezione n.3 - Indici di posizione 1 Per i caratteri qualitativi, la tabella e le rappresentazioni grafiche esauriscono quasi completamente gli aspetti descrittivi.

Dettagli