ELEMENTI DI STATISTICA DESCRITTIVA

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "ELEMENTI DI STATISTICA DESCRITTIVA"

Transcript

1 Metodi Statistici e Probabilistici per l Ingegneria ELEMENTI DI STATISTICA DESCRITTIVA Corso di Laurea in Ingegneria Civile Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain livio.corain@unipd.it Home page: ELEMENTI DI STATISTICA DESCRITTIVA 1 SOMMARIO Statistica descrittiva vs. Statistica inferenziale Gli aspetti della statistica descrittiva descrizione e forma della distribuzione posizione o tendenza centrale variabilità o dispersione Gli strumenti della statistica descrittiva tabelle e grafici indici di sintesi Statistica descrittiva per serie temporali Statistica descrittiva per i dati multivariati ELEMENTI DI STATISTICA DESCRITTIVA 2

2 STATISTICA DESCRITTIVA vs STATISTICA INFERENZIALE La statistica descrittiva è un insieme di tecniche usate per descrivere le caratteristiche di base dei dati raccolti in un esperimento/studio. Esse forniscono una sintesi semplice del campione e delle misure raccolte. Insieme alla semplice analisi grafica, costituisco la base iniziale di partenza di qualsivoglia analisi quantitativa dei dati. Mentre con le statistiche descrittive si sta semplicemente descrivendo ciò che si osserva o ciò che i dati evidenziano nei loro tratti essenziali, con la statistica inferenziale, si tenterà di raggiungere conclusioni che si estendono oltre i dati raccolti nel loro immediato e che possono essere valide e riferibili ad un contesto più ampio rispetto a quello dei dati di quel singolo esperimento/studio. ELEMENTI DI STATISTICA DESCRITTIVA LA STATISTICA DESCRITTIVA: DEFINIZIONE Con il termine statistica descrittiva si intende un insieme di tecniche e strumenti finalizzati ad assolvere uno dei principali compiti assegnati della Statistica: descrivere, rappresentare e sintetizzare in maniera opportuna un insieme o campione di dati relativamente ad un problema (popolazione) di interesse. Per popolazione si intende la totalità dei casi, ovvero delle unità sulle quali e possibile rilevare una variabile di interesse, ad esempio i provini ottenuti da una miscela cemento/calcestruzzo su cui si esegue una prova di compressione allo scopo di misurare il carico di rottura. Per estensione, con popolazione si intende anche il prodotto/processo/fenomeno oggetto di indagine. Per campione si intende invece un insieme finito di n unità che si può ritenere rappresentativo dell intera popolazione (che per definizione ha invece numerosità infinita). ELEMENTI DI STATISTICA DESCRITTIVA 4

3 STATISTICA DESCRITTIVA vs STATISTICA INFERENZIALE Mentre la statistica descrittiva si occupa di rappresentare l informazione contenuta in un dato insieme o campione di dati, la statistica inferenziale utilizza tale informazione per fare delle affermazioni più generali riguardanti i parametri (solitamente µ e σ) della popolazione, da cui il campione è stato estratto. Le affermazioni della statistica inferenziale sono di due tipi: STIMA: si vuole indicare un valore plausibile per il parametro della popolazione, sotto una delle 2 forme: 1. un valore ben definito (STIMA PUNTUALE) 2. un intervallo in cui molto verosimilmente il parametro sia incluso (STIMA INTERVALLARE) VERIFICA DI IPOTESI: indicare quale tra due specifiche ipotesi sul parametro (nulla o alternativa) sia da accettare ELEMENTI DI STATISTICA DESCRITTIVA 5 STATISTICA DESCRITTIVA vs STATISTICA INFERENZIALE Si noti la netta distinzione concettuale tra parametri (solitamente µ e σ) della popolazione: si tratta di quantità non osservabili (ma stimabili); stime dei parametri (media e deviazione standard campionaria): si tratta di valori plausibili per un parametro della popolazione e che possiamo calcolare attraverso i dati campionari. Assunto un modello di probabilità rappresentativo della popolazione, attraverso le stime dei parametri possiamo inoltre: stimare il profilo della distribuzione della popolazione; costruire degli intervalli di confidenza per i parametri. Si noti che l assunzione che un data distribuzione di probabilità sia rappresentativa della popolazione non assicura affatto che tale distribuzione rappresenti il vero modello della popolazione. ELEMENTI DI STATISTICA DESCRITTIVA 6

4 LA STATISTICA DESCRITTIVA: ASPETTI E STRUMENTI Per descrivere e sintetizzare l informazione campionaria di un fenomeno numerico di interesse, la statistica descrittiva si focalizza su 3 principali aspetti: 1. la descrizione e la forma della distribuzione 2. la posizione o tendenza centrale 3. la variabilità o dispersione Gli strumenti messi a disposizione dalla statistica descrittiva possono essere sia di tipo grafico sia numerico. In questo ultimo caso si tratta di opportuni indici di sintesi, che in unico valore esprimono una specifica caratteristica della distribuzione dei dati: la tendenza centrale, la variabilità e la forma della distribuzione. ELEMENTI DI STATISTICA DESCRITTIVA 7 LA STATISTICA DESCRITTIVA: DETTAGLIO STRUMENTI Grafici: Dotplot (tabella ed) istogramma di frequenza frequenza assoluta, frequenza relativa frequenza, frequenza cumulata boxplot probability plot Indici di sintesi: indici di posizione o tendenza centrale media, mediana, moda indici di variabilità o dispersione varianza, deviazione standard (scarto quadr. medio) range, range interquartile indice di asimmetria ELEMENTI DI STATISTICA DESCRITTIVA 8

5 UN ESEMPIO: SPESSORE DI UNA LASTRA In uno studio sugli spessori di una lastra nervata in fibrocemento si sono effettuate delle misurazioni (mm), in corrispondenza a 30 posizioni della lastra. ELEMENTI DI STATISTICA DESCRITTIVA 9 UNA PRIMA RAPPRESENTAZIONE GRAFICA Una prima sintetica rappresentazione grafica dei dati è fornita dal dotplot, dove ogni distinto valore osservato corrisponde ad un pallino: Dotplot dello della lastra (mm) Osserviamo che la maggior parte dei dati tende a addensarsi attorno ad un valore centrale (6 mm) (mm) Possiamo inoltre notare che i dati cadono in un range (intervallo) di 0.8 mm, calcolato come differenza tra il valore massimo (6.4) e minimo (5.6) osservato. ELEMENTI DI STATISTICA DESCRITTIVA 10

6 LA TABELLA E L ISTOGRAMMA DI FREQUENZA Per approfondire la descrizione della distribuzione dei dati, partendo dal valore minimo 5.6, dividiamo l intervallo di osservazione dei dati (di ampiezza 0.8 mm) in 8 intervalli di uguale ampiezza pari a 0.1 mm: [5.6, 5.7[, [5.7, 5.8[,..., [6.3, 6.4[. Se contiamo il numero di unità che cadano all interno di ciascun intervallo, otteniamo la tabella ed il corrispondente istogramma di frequenza (assoluta o relativa). Conteggio Frequenza Assoluta Relativa % % % % % % % % TOTALE % Freqequenza relativa percentuale Istogramma della frequenza relativa dello ELEMENTI DI STATISTICA DESCRITTIVA 11 LA TABELLA E L ISTOGRAMMA DI FREQUENZA Con il termine frequenza assoluta si intende il numero/conteggio di unità che cadano in una determinata classe (intervallo). La frequenza assoluta somma ad n. Con il termine frequenza relativa si intende la frazione (o la percentuale) di unità (rispetto al numero totale di unità) cadano in una determinata classe (intervallo). La frequenza relativa somma ad 1 (o 100%). Per frequenza cumulata si intende invece il numero di unità che sono inferiori ad una data soglia (appartengono all intervallo [, soglia[). La frequenza cumulata può essere sia assoluta sia relativa. ELEMENTI DI STATISTICA DESCRITTIVA 12

7 LA FREQUENZA CUMULATA Se sommiamo via via le frequenze in maniera cumulata rispetto agli intervalli, si ottiene la cosiddetta frequenza cumulata, che ci dice quante osservazioni cadono fino ad una certa soglia. Per costruzione, il valore della frequenza cumulata rispetto all ultima soglia sarà il numero totale di osservazioni o il valore 100% rispettivamente per la frequenza cumulata assoluta o relativa. Conteggio Frequ. comulata Assoluta Relativa < % < % < % < % < % < % < % < % Istogramma della frequenza relativa cumulata dello Freqequenza relativa percentuale cumulata ELEMENTI DI STATISTICA DESCRITTIVA 13 LA DEFINIZIONE DEGLI INTERVALLI Nella definizione degli intervalli è utile seguire alcune semplici regole empiriche: porre il limite inferiore della prima classe leggermente al di sotto del valore minimo osservato, preferibilmente individuando un valore di riferimento che faciliti l interpretazione dei dati scegliere un numero di intervalli da un minimo di 4-5 ad un massimo di 14-15; in base al numero di intervalli calcolare la corrispondente ampiezza in alternativa, scegliere una ampiezza opportuna dell intervallo, preferibilmente in modo che il numero di classi sia coerente con il punto precedente ELEMENTI DI STATISTICA DESCRITTIVA 14

8 LA FREQUENZA NEL CASO DI VARIABILI QUALITATIVE In un analisi statistica siamo talvolta interessati a esaminare il comportamento simultaneo di due variabili qualitative: per esempio ci possiamo chiedere se esiste un legame fra il livello delle acque ed un particolare bacino idrico, sulla base ad es. delle osservazioni mensili negli ultimi 10 anni. La tabella di contingenza è una tabella a doppia entrata in cui le osservazioni relative a due variabili categoriali vengono rappresentate/sintetizzate simultaneamente. LIVELLO DELLE ACQUE BACINO IDRICO DEL BACINO A B C Totale Basso Medio Alto Totale ELEMENTI DI STATISTICA DESCRITTIVA LA FREQUENZA NEL CASO DI VARIABILI QUALITATIVE Al fine di analizzare la possibile associazione esistente fra le due variabili qualitative, è opportuno convertire le frequenze congiunte assolute in frequenze relative (o percentuali). Questa operazione può essere realizzata riferendosi (condizionandosi) alternativamente al: 1. totale complessivo (rappresentato nel nostro caso dalle 360 osservazioni mensili) 2. totale di riga (rispetto al numero totale di mesi per altezza del livello delle acque) 3. totale per colonna (rispetto al numero totale di mesi di osservazione per ciascun bacino) Il risultato e l informazione che se ne ottiene dipende dallo specifico totale che viene scelto a riferimento. ELEMENTI DI STATISTICA DESCRITTIVA

9 LA FREQUENZA NEL CASO DI VARIABILI QUALITATIVE Ad esempio, per analizzare lo stato di salute del livello idrico rispetto a ciascuna area, è opportuno riferirsi alla tabella di frequenza condizionata al totale di colonna. LIVELLO DELLE ACQUE BACINO IDRICO DEL BACINO A B C Totale Basso 33.3% 15.8% 20.8% 23.3% Medio 8.3% 9.2% 16.7% 11.4% Alto 58.3% 75.0% 62.5% 65.3% Totale 100.0% 100.0% 100.0% 100.0% Frequenza nel livello delle acque per bacino idrico 80.0% Frequenza 70.0% 60.0% 50.0% 40.0% 30.0% Livello delle acque Basso Medio Alto 20.0% 10.0% 0.0% A B C Bacino ELEMENTI DI STATISTICA DESCRITTIVA MEDIANA E QUARTILI: DEFINIZIONE Oltre ai valori massimo e minimo, altri indici statistici di posizione possono fornirci informazioni importanti di sintesi sulla distribuzione dei dati. Se ordiniamo i dati, dal più piccolo al più grande: Posizione ordinata Dato ordinato Indice MIN Q1 MEDIANA (Q2) Q3 MAX la media dei due valori nella posizione centrale ((30+1)/2=15.5, cioè 15 e 16 ) definisce la MEDIANA il valore più vicino alla posizione ¼ ((30+1)/4=7.75 quindi l 8 dato della serie ordinata) definisce Q1 (primo QUARTILE) il valore più vicino alla posizione ¾ ( (30+1)*3/4=23.25 quindi il 23 dato) definisce Q3 (terzo QUARTILE) ELEMENTI DI STATISTICA DESCRITTIVA 18

10 IL BOXPLOT La rappresentazione grafica dei 5 numeri di sintesi: MIN, Q1, MEDIANA, Q3 e MAX, restituisce il cosiddetto BOXPLOT. Per costruzione, all interno della scatola è contenuto il 50% dei dati osservati. MIN ELEMENTI DI STATISTICA DESCRITTIVA Boxplot dello 6.0 La posizione, dimensione e forma della scatola (cioè la distanza tra i due quartili e la mediana) ed il modo in cui si allungano i tratti laterali ( baffi ) danno un indicazione rispettivamente: della tendenza centrale, della variabilità ( intensità della dispersione) e della simmetria della distribuzione. Si noti che il boxplot può essere visto come una rappresentazione stilizzata della distribuzione dei dati. Q1 Q3 MEDIANA MAX MEDIANA E QUARTILI: REGOLA DEFINIZIONE POSIZIONI Sia n il numero di osservazioni del campione di dati. In base al fatto che n sia pari o dispari e che sia divisibile per 4, la mediana ed i quartili vengono così definiti: MEDIANA: se n è dispari, la mediana è il valore della serie ordinata nella posizione (n+1)/2, mentre se n è pari, la mediana è la media aritmetica dei due valori della serie ordinata nelle posizioni n/2 e n/2+1 Q1 e Q3: se n+1 è divisibile per 4, Q1 e Q3 sono i valori della serie ordinata nelle posizioni (n+1)/4 e (n+1)*3/4, mentre se n+1 non è divisibile per 4, se (n+1)/4 e (n+1)*3/4 cadano esattamente tra 2 posizioni (es e 94.5) allora Q1 e Q3 sono definiti dalla media aritmetica dei due valori adiacenti della serie ordinata (es e 94-95), altrimenti sono definiti come i valore che sta nella posizione corrispondente al valore (n+1)/4 e (n+1)*3/4 una volta arrotondato all intero più vicino ELEMENTI DI STATISTICA DESCRITTIVA 20

11 IL BOXPLOT MODIFICATO Se nella costruzione del boxplot, MIN e MAX sono sostituiti o MIN*=max{MIN,Q1-1.5*(Q3-Q1)} o MAX*= min{max,q3+1.5*(q3-q1)} otteniamo il cosiddetto boxplot modificato. In questo caso, se sono presenti alcuni valori che oltrepassano le soglie MIN* e MAX*, essi sono indicati con un asterisco, ad indicare che si potrebbe considerare come dati anomali (outlier) nel campione di dati. 5.6 MIN Boxplot dello MAX* 6.2 outlier ELEMENTI DI STATISTICA DESCRITTIVA 21 IL BOXPLOT PER IL CONFRONTO TRA SERIE DI DATI Boxplot (e dotplot) sono particolarmente efficaci nella confronto tra due o più serie di dati, per la comparazione tra tendenza centrale, variabilità e forma della distribuzione. Ad es., per confrontare i Ad es., per analizzare la valori di indice di rimbalzo di tensione di rottura di barre prove sclerometriche per d acciaio di 3 differenti accertare la stima speditiva diametri (12,14,16) via prova della resistenza meccanica di trazione. di due colonne (A/B). Boxplot dell'indice di rimbalzo per Colonna Boxplot della Rottura per Indice di rimbalzo Rottura A Colonna B ELEMENTI DI STATISTICA DESCRITTIVA 22

12 LA FREQUENZA PER IL CONFRONTO TRA SERIE DI DATI Anche la frequenza può essere utilizzata a scopi comparativi, per evidenziare differenze ad analogie in diverse serie di dati. Una curva più a destra o sotto/a destra rispetto ad un altra, rispettivamente per la frequenza o frequenza cumulata, indica che la corrispondente serie di dati è distribuita su valori tendenzialmente più elevati. Frequenza della Rottura Frequenza cumulata della Rottura Frequenza Percentuale Frequenza Cumulata Percentuale Rottura Rottura ELEMENTI DI STATISTICA DESCRITTIVA 23 IL PROBABILITY PLOT Un probability plot è un grafico a due dimensioni in cui le osservazioni sono riportate sull asse verticale e a ciascuna di esse viene fatto corrispondere sull asse orizzontale il relativo quantile di una distribuzione di probabilità (normale, log-normale,ecc.). Se i punti del grafico si trovano approssimativamente su una linea retta immaginaria inclinata positivamente, allora possiamo affermare che i dati osservati si distribuiscono approssimativamente secondo una determinata legge di distribuzione di probabilità. ELEMENTI DI STATISTICA DESCRITTIVA 24

13 IL PROBABILITY PLOT Probability Plot of Normal - 95% CI Percent Mean StDev N 30 AD P-Value Probability Plot of Indice di rimbalzo Normal - 95% CI Probability Plot of Rottura Normal - 95% CI Percent Colonna A B Mean StDev N AD P Percent Mean StDev N AD P Indice di rimbalzo Rottura ELEMENTI DI STATISTICA DESCRITTIVA 25 INDICI STATISTICI DI POSIZIONE O TENDENZA CENTRALE La posizione o tendenza centrale di una serie di dati può essere utilmente rappresentata da un unico valore di sintesi come la mediana. Si noti che la mediana non è influenzata dalla presenza di dati anomali e per questo è detta essere un indicatore robusto. Una alternativa è data dalla media campionaria dei valori n osservati ovvero xi x1+ x x n i= 1 x = = n n La media campionaria è una sorta di baricentro dei dati e, a differenza della mediana, tende ad essere trascinata verso i dati anomali. Un ulteriore alternativa (poco usata) è la moda, definita come il valore più frequente in una serie di dati. ELEMENTI DI STATISTICA DESCRITTIVA 26

14 INDICI STATISTICI DI VARIABILITÀ O DISPERSIONE La variabilità o dispersione dei dati indica il grado di oscillazione o variazione dei valori rispetto alla loro tendenza centrale, misurata ad esempio con la media campionaria. L indice statistico s 2, definito come n 2 ( xi x) 2 i= 1 s = n 1 è detto varianza campionaria. Dato che s 2 è definito nel quadrato della unità di misura di X, per facilità di interpretazione si preferisce usare la 2 deviazione standard o scarto quadratico medio s= s. Per comparare la variabilità di X e Y, se misurati su unità di misura diverse si utilizza il coefficiente di variazione: CV = s / x ELEMENTI DI STATISTICA DESCRITTIVA 27 INDICI STATISTICI DI VARIABILITÀ O DISPERSIONE Se in luogo della media campionaria, consideriamo come indice di posizione la mediana, la variabilità dei dati può essere misura dal Range Interquartile definito come IQR = Q3-Q1 si noti che, per costruzione, tale indice di dispersione è sempre 0, risultando tanto più grande quanto più i dati sono variabili rispetto alla mediana. Una ulteriore alternativa è fornita dal Range, ovvero Range= MAX MIN Tale indice tuttavia è di scarso rilievo data la sua evidente dipendenza dalla presenza di eventuali dati anomali. ELEMENTI DI STATISTICA DESCRITTIVA 28

15 INDICI STATISTICI DI SIMMETRIA Confrontando i due indici di tendenza centrale media campionaria e mediana è possibile trarre delle indicazioni in merito alla simmetria della distribuzione dei dati: media < mediana: asimmetria negativa o distribuzione obliqua a sinistra media = mediana: simmetria media > mediana: asimmetria positiva o distribuzione obliqua a destra Una indicazione più precisa è data dall indice di asimmetria (skewness), che in base al valore assunto, positivo o negativo, ci indica l intensità ed il tipo dell eventuale asimmetria. ELEMENTI DI STATISTICA DESCRITTIVA 29 INDICI STATISTICI DI SINTESI Summary dello Anderson-Darling Normality Test A-Squared 0.56 P-Value Mean StDev Variance Sk ewness Kurtosis N Minimum st Quartile Median rd Quartile Maximum % Confidence Interval for Mean Mean 95% Confidence Intervals 95% Confidence Interval for Median % Confidence Interval for StDev Median ELEMENTI DI STATISTICA DESCRITTIVA 30

16 INDICI STATISTICI DI SINTESI Summary for Indice di rimbalzo Colonna = A Anderson-Darling Normality Test A-Squared 0.17 P-Value Mean StDev Variance Sk ewness Kurtosis N 10 Minimum st Quartile Median rd Quartile Maximum % Confidence Interval for Mean Mean Median 28 95% Confidence Intervals % Confidence Interval for Median % Confidence Interval for StDev Summary for Indice di rimbalzo Colonna = B Anderson-Darling Normality Test A-Squared 0.24 P-Value Mean StDev Variance Sk ewness Kurtosis N 10 Minimum st Quartile Median rd Quartile Maximum % Confidence Interval for Mean Mean 95% Confidence Intervals % Confidence Interval for Median Median 95% Confidence Interval for StDev ELEMENTI DI STATISTICA DESCRITTIVA 31 CONFRONTO TRA INDICI STATISTICI L informazione che si può desumere dagli indici statistici di sintesi può essere particolarmente apprezzata in caso di comparazione tra più serie di dati, come risulta chiaramente dall esempio tensione di rottura di barre d acciaio di 3 differenti diametri. Indice di posizione Media Mediana Skewness Indice di variabilità Dev.std IQR ELEMENTI DI STATISTICA DESCRITTIVA 32

17 STATISTICA DESCRITTIVA PER SERIE TEMPORALI Spostiamo ora l attenzione su alcune tecniche descrittive utilizzate per identificare eventuali pattern nei dati provenienti da serie temporali, ovvero sequenze di misure di uno stesso fenomeno/variabile di interesse e che seguono prefissato ordine non casuale (es. il livello delle piogge, maree, la pendenza di un campanile, ecc. misurate ad intervalli di ogni ora, giorno, ecc.). A differenza delle analisi dei campioni di dati che sono discussi nel contesto della maggior parte delle tecniche statistiche descrittive, l'analisi delle serie temporali si basa sul presupposto che i valori successivi nel set di dati rappresentano delle misurazioni, rilevate successivamente una altra in una ben determinata sequenza e ad intervalli di tempo equidistanti. ELEMENTI DI STATISTICA DESCRITTIVA 33 STATISTICA DESCRITTIVA PER SERIE TEMPORALI Ci sono due obiettivi principali nell analisi delle serie temporali: 1. Identificare la natura del fenomeno rappresentato dalla sequenza di osservazioni, e 2. Forecasting: prevedere valori futuri della serie temporale Entrambi questi obiettivi richiedono che un modello esplicativo alla base dei dati della serie temporale osservata sia identificato e descritto più o meno formalmente. Una volta che il modello viene stabilito, siamo in grado di interpretare e integrare con altri dati, con l'obiettivo di estrapolare il modello individuato per predire eventi futuri. Dal punto di vista descrittivo questo può essere fatto mediante un approccio di tipo grafico e per mezzo di due strumenti: trend analysis e smoothing. ELEMENTI DI STATISTICA DESCRITTIVA 34

18 STATISTICA DESCRITTIVA PER SERIE TEMPORALI Trend Analysis Plot della Precipitazione annua (Grandi Laghi) Quadratic Trend Model Yt = *t *t**2 Variable 40.0 Actual Fits 37.5 Accuracy Measures MA PE MAD MSD Precipitazione Trend analysis mediante trend quadratico Anno Smoothing Esponenziale Precipitazione annua (Grandi Laghi) 40.0 Variable Actual Fits 37.5 Smoothing Constant A lpha Lisciamento mediante Precipitazione Accuracy Measures MAPE MAD MSD smoothing 27.5 esponenziale Anno ELEMENTI DI STATISTICA DESCRITTIVA 35 STATISTICA DESCRITTIVA PER DATI BI- o MULTI-VARIATI Quando sulla stessa unità od oggetto vengono rilevati contemporaneamente due o più variabili numeriche, si parla di dati bi- o multi-variati. In questo caso può essere di interesse studiare il modo in cui queste variabili sono eventualmente legate tra loro. Ad esempio possiamo considerare la Resistenza a compressione (Rc), la Prova di compressione edometrica (Ed) e la Resistenza a trazione indiretta (Rt) misurate sugli stessi provini, ottenuti da scarti provenienti da lavorazioni siderurgiche per la realizzazione di rilevati stradali. Il diagramma di dispersione per una coppia di variabili numeriche X e Y, può fornire una prima chiave di lettura dell eventuale legame esistente tra le variabili. Infatti, a seconda di come si dispone la nuvola di punti, possiamo ritenere plausibile un eventuale legame tra le due variabili. ELEMENTI DI STATISTICA DESCRITTIVA 36

19 MATRIX PLOT Se consideriamo una serie di diagrammi di dispersione per ogni possibile coppia di variabili, otteniamo il cosiddetto matrix-plot, che può fornire una prima chiave lettura del legame esistente tra le variabili. Possiamo dedurre alcune chiare indicazioni: 1. tutte le tre misure prestazionali sono Rc correlate 5.0 positivamente, il legame più forte si Ed 1000 osserva tra Rt e Ed 0 Matrix Plot di Rc; Ed; Rt mentre quello più Rt debole tra Ed e Rc. ELEMENTI DI STATISTICA DESCRITTIVA 37 IL COEFFICIENTE DI CORRELAZIONE Un modalità più rigorosa che consente di studiare il grado di intensità del legame lineare tra coppie di variabili consiste nel calcolare l indice di correlazione (lineare) campionaria: r = n ( x x)( y y) i i i= 1 n n 2 2 ( xi x) ( yi y) i= 1 i= 1 Rc Ed Ed 0.45 Rt La correlazione, varia tra -1 e +1, indicando r = 1 (+1): perfetta correlazione negativa (positiva) 1 < r < 0.7 (+ 1 < r < + 0.7): forte correlazione negativa (positiva) 0.7 < r < 0.3 (+ 0.7 < r < + 0.3): debole correlazione negativa (positiva) 0.3 < r < + 0.3: assenza di correlazione ELEMENTI DI STATISTICA DESCRITTIVA 38

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Un po di statistica. Christian Ferrari. Laboratorio di Matematica Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di

Dettagli

Grafici delle distribuzioni di frequenza

Grafici delle distribuzioni di frequenza Grafici delle distribuzioni di frequenza L osservazione del grafico può far notare irregolarità o comportamenti anomali non direttamente osservabili sui dati; ad esempio errori di misurazione 1) Diagramma

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 5-Indici di variabilità (vers. 1.0c, 20 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Corso di. Dott.ssa Donatella Cocca

Corso di. Dott.ssa Donatella Cocca Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile

Dettagli

Relazioni statistiche: regressione e correlazione

Relazioni statistiche: regressione e correlazione Relazioni statistiche: regressione e correlazione È detto studio della connessione lo studio si occupa della ricerca di relazioni fra due variabili statistiche o fra una mutabile e una variabile statistica

Dettagli

Indici di dispersione

Indici di dispersione Indici di dispersione 1 Supponiamo di disporre di un insieme di misure e di cercare un solo valore che, meglio di ciascun altro, sia in grado di catturare le caratteristiche della distribuzione nel suo

Dettagli

Statistica descrittiva

Statistica descrittiva Corso di Laurea in Ingegneria per l Ambiente ed il Territorio Corso di Costruzioni Idrauliche A.A. 2004-05 www.dica.unict.it/users/costruzioni Statistica descrittiva Ing. Antonino Cancelliere Dipartimento

Dettagli

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva Brugnaro Luca Progetto formativo complessivo Obiettivo: incrementare le competenze degli operatori sanitari nelle metodiche

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara

Dettagli

Stima per intervalli Nei metodi di stima puntuale è sempre presente un ^ errore θ θ dovuto al fatto che la stima di θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una

Dettagli

Prova di autovalutazione Prof. Roberta Siciliano

Prova di autovalutazione Prof. Roberta Siciliano Prova di autovalutazione Prof. Roberta Siciliano Esercizio 1 Nella seguente tabella è riportata la distribuzione di frequenza dei prezzi per camera di alcuni agriturismi, situati nella regione Basilicata.

Dettagli

Analisi Statistica per le Imprese (6 CFU) - a.a. 2010-2011 Prof. L. Neri RICHIAMI DI STATISTICA DESCRITTIVA UNIVARIATA

Analisi Statistica per le Imprese (6 CFU) - a.a. 2010-2011 Prof. L. Neri RICHIAMI DI STATISTICA DESCRITTIVA UNIVARIATA Analisi Statistica per le Imprese (6 CFU) - a.a. 2010-2011 Prof. L. Neri RICHIAMI DI STATISTICA DESCRITTIVA UNIVARIATA 1 Distribuzione di frequenza Punto vendita e numero di addetti PUNTO VENDITA 1 2 3

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

Statistica descrittiva

Statistica descrittiva Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di indicatori sintetici che individuano, con un singolo valore, proprieta` statistiche di un campione/popolazione rispetto

Dettagli

Indici (Statistiche) che esprimono le caratteristiche di simmetria e

Indici (Statistiche) che esprimono le caratteristiche di simmetria e Indici di sintesi Indici (Statistiche) Gran parte della analisi statistica consiste nel condensare complessi pattern di osservazioni in un indicatore che sia capace di riassumere una specifica caratteristica

Dettagli

Analisi della performance temporale della rete

Analisi della performance temporale della rete Analisi della performance temporale della rete In questo documento viene analizzato l andamento nel tempo della performance della rete di promotori. Alcune indicazioni per la lettura di questo documento:

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva Università del Piemonte Orientale Corsi di Laurea Triennale Corso di Statistica e Biometria Introduzione e Statistica descrittiva Corsi di Laurea Triennale Corso di Statistica e Biometria: Introduzione

Dettagli

Dott.ssa Caterina Gurrieri

Dott.ssa Caterina Gurrieri Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo

Dettagli

Facciamo qualche precisazione

Facciamo qualche precisazione Abbiamo introdotto alcuni indici statistici (di posizione, di variabilità e di forma) ottenibili da Excel con la funzione Riepilogo Statistiche Facciamo qualche precisazione Al fine della partecipazione

Dettagli

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili

Dettagli

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri

Dettagli

ALLEGATO 1 Analisi delle serie storiche pluviometriche delle stazioni di Torre del Lago e di Viareggio.

ALLEGATO 1 Analisi delle serie storiche pluviometriche delle stazioni di Torre del Lago e di Viareggio. ALLEGATO 1 Analisi delle serie storiche pluviometriche delle stazioni di Torre del Lago e di Viareggio. Per una migliore caratterizzazione del bacino idrologico dell area di studio, sono state acquisite

Dettagli

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a) Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:

Dettagli

Misure della dispersione o della variabilità

Misure della dispersione o della variabilità QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.

Dettagli

Statistica descrittiva: prime informazioni dai dati sperimentali

Statistica descrittiva: prime informazioni dai dati sperimentali SECONDO APPUNTAMENTO CON LA SPERIMENTAZIONE IN AGRICOLTURA Statistica descrittiva: prime informazioni dai dati sperimentali La statistica descrittiva rappresenta la base di partenza per le applicazioni

Dettagli

Statistica. Lezione 6

Statistica. Lezione 6 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante

Dettagli

SPC e distribuzione normale con Access

SPC e distribuzione normale con Access SPC e distribuzione normale con Access In questo articolo esamineremo una applicazione Access per il calcolo e la rappresentazione grafica della distribuzione normale, collegata con tabelle di Clienti,

Dettagli

LEZIONE n. 5 (a cura di Antonio Di Marco)

LEZIONE n. 5 (a cura di Antonio Di Marco) LEZIONE n. 5 (a cura di Antonio Di Marco) IL P-VALUE (α) Data un ipotesi nulla (H 0 ), questa la si può accettare o rifiutare in base al valore del p- value. In genere il suo valore è un numero molto piccolo,

Dettagli

11. Analisi statistica degli eventi idrologici estremi

11. Analisi statistica degli eventi idrologici estremi . Analisi statistica degli eventi idrologici estremi I processi idrologici evolvono, nello spazio e nel tempo, secondo modalità che sono in parte predicibili (deterministiche) ed in parte casuali (stocastiche

Dettagli

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk

Dettagli

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA Seconda Lezione DISTRIBUZIONE DI FREQUENZA Frequenza assoluta: è il numero puro di casi per quella modalità Frequenze relative: sono il rapporto tra la frequenza assoluta con cui si manifesta una modalità

Dettagli

Metodi Matematici e Informatici per la Biologia----31 Maggio 2010

Metodi Matematici e Informatici per la Biologia----31 Maggio 2010 Metodi Matematici e Informatici per la Biologia----31 Maggio 2010 COMPITO 4 (3 CREDITI) Nome: Cognome: Matricola: ISTRUZIONI Gli esercizi che seguono sono di tre tipi: Domande Vero/Falso: cerchiate V o

Dettagli

Capitolo 11 Test chi-quadro

Capitolo 11 Test chi-quadro Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 11 Test chi-quadro Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova

Dettagli

Inferenza statistica. Statistica medica 1

Inferenza statistica. Statistica medica 1 Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella

Dettagli

La distribuzione Normale. La distribuzione Normale

La distribuzione Normale. La distribuzione Normale La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una

Dettagli

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

STATISTICA IX lezione

STATISTICA IX lezione Anno Accademico 013-014 STATISTICA IX lezione 1 Il problema della verifica di un ipotesi statistica In termini generali, si studia la distribuzione T(X) di un opportuna grandezza X legata ai parametri

Dettagli

STATISTICA DESCRITTIVA. Le misure di tendenza centrale

STATISTICA DESCRITTIVA. Le misure di tendenza centrale STATISTICA DESCRITTIVA Le misure di tendenza centrale 1 OBIETTIVO Individuare un indice che rappresenti significativamente un insieme di dati statistici. 2 Esempio Nella tabella seguente sono riportati

Dettagli

PRODUZIONE DI LENTI A CONTATTO

PRODUZIONE DI LENTI A CONTATTO 1 PRODUZIONE DI LENTI A CONTATTO Per monitorare il processo di produzione di un determinato tipo di lenti a contatto viene misurato, ad intervalli di tempo regolari di h 15 minuti, il diametro X (in mm)

Dettagli

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE e-mail: tommei@dm.unipi.it web: www.dm.unipi.it/ tommei Ricevimento: su appuntamento Dipartimento di Matematica, piano terra, studio 114

Dettagli

Lineamenti di econometria 2

Lineamenti di econometria 2 Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) Aspetti Statistici della Regressione Aspetti Statistici della Regressione

Dettagli

matematica probabilmente

matematica probabilmente IS science centre immaginario scientifico Laboratorio dell'immaginario Scientifico - Trieste tel. 040224424 - fax 040224439 - e-mail: lis@lis.trieste.it - www.immaginarioscientifico.it indice Altezze e

Dettagli

Analisi e diagramma di Pareto

Analisi e diagramma di Pareto Analisi e diagramma di Pareto L'analisi di Pareto è una metodologia statistica utilizzata per individuare i problemi più rilevanti nella situazione in esame e quindi le priorità di intervento. L'obiettivo

Dettagli

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA ESERCIZI SVOLTI PER LA PROVA DI STATISTICA Stefania Naddeo (anno accademico 4/5) INDICE PARTE PRIMA: STATISTICA DESCRITTIVA. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE. VALORI CARATTERISTICI

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 3.1 Introduzione all inferenza statistica Prima Parte Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014

Dettagli

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE DESCRIZIONE DEI DATI DA ESAMINARE Sono stati raccolti i dati sul peso del polmone di topi normali e affetti da una patologia simile

Dettagli

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione) Esercitazione #5 di Statistica Test ed Intervalli di Confidenza (per una popolazione) Dicembre 00 1 Esercizi 1.1 Test su media (con varianza nota) Esercizio n. 1 Il calore (in calorie per grammo) emesso

Dettagli

Capitolo 2 Distribuzioni di frequenza

Capitolo 2 Distribuzioni di frequenza Edizioni Simone - Vol. 43/1 Compendio di statistica Capitolo 2 Distribuzioni di frequenza Sommario 1. Distribuzioni semplici. - 2. Distribuzioni doppie. - 3. Distribuzioni parziali: condizionate e marginali.

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 12-Il t-test per campioni appaiati vers. 1.2 (7 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

1. Distribuzioni campionarie

1. Distribuzioni campionarie Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 3 e 6 giugno 2013 - di Massimo Cristallo - 1. Distribuzioni campionarie

Dettagli

ESAME DI STATISTICA Nome: Cognome: Matricola:

ESAME DI STATISTICA Nome: Cognome: Matricola: ESAME DI STATISTICA Nome: Cognome: Matricola: ISTRUZIONI: Per la prova è consentito esclusivamente l uso di una calcolatrice tascabile, delle tavole della normale e della t di Student. I risultati degli

Dettagli

VERIFICA DELLE IPOTESI

VERIFICA DELLE IPOTESI VERIFICA DELLE IPOTESI Nella verifica delle ipotesi è necessario fissare alcune fasi prima di iniziare ad analizzare i dati. a) Si deve stabilire quale deve essere l'ipotesi nulla (H0) e quale l'ipotesi

Dettagli

Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco

Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco Alfonso Iodice D Enza April 26, 2007 1...prima di cominciare Contare, operazione solitamente semplice, può diventare complicata se lo scopo

Dettagli

PROGRAMMA SVOLTO NELLA SESSIONE N.

PROGRAMMA SVOLTO NELLA SESSIONE N. Università C. Cattaneo Liuc, Corso di Statistica, Sessione n. 1, 2014 Laboratorio Excel Sessione n. 1 Venerdì 031014 Gruppo PZ Lunedì 061014 Gruppo AD Martedì 071014 Gruppo EO PROGRAMMA SVOLTO NELLA SESSIONE

Dettagli

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995).

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995). ANALISI DI UNA SERIE TEMPORALE Analisi statistica elementare Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995). Si puo' osservare una media di circa 26 C e una deviazione

Dettagli

Rapporto dal Questionari Insegnanti

Rapporto dal Questionari Insegnanti Rapporto dal Questionari Insegnanti SCUOLA CHIC81400N N. Docenti che hanno compilato il questionario: 60 Anno Scolastico 2014/15 Le Aree Indagate Il Questionario Insegnanti ha l obiettivo di rilevare la

Dettagli

VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011

VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011 VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011 1 RAPPRESENTARE I DATI: TABELLE E GRAFICI Un insieme di misure è detto serie statistica o serie dei dati 1) Una sua prima elementare elaborazione può

Dettagli

LA STATISTICA E IL CALCOLO DELLE PROBABILITÀ

LA STATISTICA E IL CALCOLO DELLE PROBABILITÀ LA STATISTICA E IL CALCOLO DELLE PROBABILITÀ Prof. Francesco Tottoli Versione 3 del 20 febbraio 2012 DEFINIZIONE È una scienza giovane e rappresenta uno strumento essenziale per la scoperta di leggi e

Dettagli

DISTRIBUZIONI DI PROBABILITÀ

DISTRIBUZIONI DI PROBABILITÀ Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 LE PRINCIPALI DISTRIBUZIONI

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 9 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 TEST D IPOTESI Partiamo da un esempio presente sul libro di testo.

Dettagli

Regressione Mario Guarracino Data Mining a.a. 2010/2011

Regressione Mario Guarracino Data Mining a.a. 2010/2011 Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1 Dott.ssa Antonella Costanzo a.costanzo@unicas.it A.Studio dell interdipendenza tra variabili: riepilogo Concetto relativo allo studio delle relazioni tra

Dettagli

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008 Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica 18 dicembre 008 Esame sull intero programma: esercizi da A a D Esame sulla seconda parte del programma: esercizi

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE

LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) LABORATORIO EXCEL

Dettagli

Statistica. Le rappresentazioni grafiche

Statistica. Le rappresentazioni grafiche Statistica Le rappresentazioni grafiche Introduzione Le rappresentazioni grafiche costituiscono uno dei mezzi più efficaci, sia per descrivere in forma visiva i risultati di numerose osservazioni riguardanti

Dettagli

~ Copyright Ripetizionando - All rights reserved ~ http://ripetizionando.wordpress.com STUDIO DI FUNZIONE

~ Copyright Ripetizionando - All rights reserved ~ http://ripetizionando.wordpress.com STUDIO DI FUNZIONE STUDIO DI FUNZIONE Passaggi fondamentali Per effettuare uno studio di funzione completo, che non lascia quindi margine a una quasi sicuramente errata inventiva, sono necessari i seguenti 7 passaggi: 1.

Dettagli

Ricerca di outlier. Ricerca di Anomalie/Outlier

Ricerca di outlier. Ricerca di Anomalie/Outlier Ricerca di outlier Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Ricerca di Anomalie/Outlier Cosa sono gli outlier? L insieme di dati che sono considerevolmente differenti dalla

Dettagli

Slide Cerbara parte1 5. Le distribuzioni teoriche

Slide Cerbara parte1 5. Le distribuzioni teoriche Slide Cerbara parte1 5 Le distribuzioni teoriche I fenomeni biologici, demografici, sociali ed economici, che sono il principale oggetto della statistica, non sono retti da leggi matematiche. Però dalle

Dettagli

Introduzione alle relazioni multivariate. Introduzione alle relazioni multivariate

Introduzione alle relazioni multivariate. Introduzione alle relazioni multivariate Introduzione alle relazioni multivariate Associazione e causalità Associazione e causalità Nell analisi dei dati notevole importanza è rivestita dalle relazioni causali tra variabili Date due variabili

Dettagli

Analisi di dati di frequenza

Analisi di dati di frequenza Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria. Statistica descrittiva

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria. Statistica descrittiva Università del Piemonte Orientale Corsi di Laurea Triennale di Area Tecnica Corso di Statistica e Biometria Statistica descrittiva 1 Statistica Funzioni Descrittiva Induttiva (inferenziale) Statistica

Dettagli

ANALISI DELLE FREQUENZE: IL TEST CHI 2

ANALISI DELLE FREQUENZE: IL TEST CHI 2 ANALISI DELLE FREQUENZE: IL TEST CHI 2 Quando si hanno scale nominali o ordinali, non è possibile calcolare il t, poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento

Dettagli

Intorni Fissato un punto sull' asse reale, si definisce intorno del punto, un intervallo aperto contenente e tutto contenuto in

Intorni Fissato un punto sull' asse reale, si definisce intorno del punto, un intervallo aperto contenente e tutto contenuto in Intorni Fissato un punto sull' asse reale, si definisce intorno del punto, un intervallo aperto contenente e tutto contenuto in Solitamente si fa riferimento ad intorni simmetrici =, + + Definizione: dato

Dettagli

ELEMENTI DI STATISTICA

ELEMENTI DI STATISTICA Dipartimento di Ingegneria Meccanica Chimica e dei Materiali PROGETTAZIONE E GESTIONE DEGLI IMPIANTI INDUSTRIALI Esercitazione 6 ORE ELEMENTI DI STATISTICA Prof. Ing. Maria Teresa Pilloni Anno Accademico

Dettagli

VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD. Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza.

VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD. Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza. VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD Si definisce varianza campionaria l indice s 2 = 1 (x i x) 2 = 1 ( xi 2 n x 2) Si definisce scarto quadratico medio o deviazione standard la radice quadrata della

Dettagli

LA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di

LA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di STATISTICA LA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di oggetti; cerca, attraverso l uso della matematica

Dettagli

LA RAPPRESENTAZIONE E LA SINTESI DEI DATI

LA RAPPRESENTAZIONE E LA SINTESI DEI DATI Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 LA RAPPRESENTAZIONE E LA SINTESI

Dettagli

INTEGRALI DEFINITI. Tale superficie viene detta trapezoide e la misura della sua area si ottiene utilizzando il calcolo di un integrale definito.

INTEGRALI DEFINITI. Tale superficie viene detta trapezoide e la misura della sua area si ottiene utilizzando il calcolo di un integrale definito. INTEGRALI DEFINITI Sia nel campo scientifico che in quello tecnico si presentano spesso situazioni per affrontare le quali è necessario ricorrere al calcolo dell integrale definito. Vi sono infatti svariati

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2013-2014 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Matematica e Statistica

Matematica e Statistica Matematica e Statistica Prova d esame (0/07/03) Università di Verona - Laurea in Biotecnologie - A.A. 0/3 Matematica e Statistica Prova di MATEMATICA (0/07/03) Università di Verona - Laurea in Biotecnologie

Dettagli

Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R

Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R Studio di funzione Per studio di funzione intendiamo un insieme di procedure che hanno lo scopo di analizzare le proprietà di una funzione f ( x) R R : allo scopo di determinarne le caratteristiche principali.

Dettagli

LE CARTE DI CONTROLLO (4)

LE CARTE DI CONTROLLO (4) LE CARTE DI CONTROLLO (4) Tipo di carta di controllo Frazione difettosa Carta p Numero di difettosi Carta np Dimensione campione Variabile, solitamente >= 50 costante, solitamente >= 50 Linea centrale

Dettagli

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE Psicometria (8 CFU) Corso di Laurea triennale Un punteggio all interno di una distribuzione è in realtà privo di significato se preso da solo. Sapere che un soggetto ha ottenuto un punteggio x=52 in una

Dettagli

La distribuzione Gaussiana

La distribuzione Gaussiana Università del Piemonte Orientale Corso di Laurea in Biotecnologie Corso di Statistica Medica La distribuzione Normale (o di Gauss) Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione

Dettagli

PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO

PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO L indagine si è svolta nel periodo dal 26 agosto al 16 settembre 2014 con l obiettivo di conoscere l opinione dei residenti

Dettagli

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010 LEZIONE 3 "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando uno

Dettagli

Brugnaro Luca Boscaro Gianni (2009) 1

Brugnaro Luca Boscaro Gianni (2009) 1 STATISTICA PER LE PROFESSIONI SANITARIE - LIVELLO BASE Brugnaro Luca Boscaro Gianni (2009) 1 Perché la statistica Prendere decisioni Bibliografia non soddisfacente Richieste nuove conoscenze Raccolta delle

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi per la media (varianza nota), p-value del test Il manager di un fast-food

Dettagli

UNIVERSITÀ DEGLI STUDI DI TERAMO

UNIVERSITÀ DEGLI STUDI DI TERAMO UNIVERSITÀ DEGLI STUDI DI TERAMO CORSO DI LAUREA IN ECONOMIA BANCARIA FINANZIARIA ED ASSICURATIVA (Classe 7) Corso di Matematica per l Economia (Prof. F. Eugeni) TEST DI INGRESSO Teramo, ottobre 00 SEZIONE

Dettagli

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI VERO FALSO CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI 1. V F Un ipotesi statistica è un assunzione sulle caratteristiche di una o più variabili in una o più popolazioni 2. V F L ipotesi nulla unita

Dettagli

Il confronto fra proporzioni

Il confronto fra proporzioni L. Boni Il rapporto Un rapporto (ratio), attribuendo un ampio significato al termine, è il risultato della divisione di una certa quantità a per un altra quantità b Il rapporto Spesso, in maniera più specifica,

Dettagli

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

L Analisi della Varianza ANOVA (ANalysis Of VAriance) L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 CONCETTI GENERALI Finora abbiamo descritto test di ipotesi finalizzati alla verifica di ipotesi sulla differenza tra parametri di due popolazioni

Dettagli

Statistiche campionarie

Statistiche campionarie Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle

Dettagli

Temi di Esame a.a. 2012-2013. Statistica - CLEF

Temi di Esame a.a. 2012-2013. Statistica - CLEF Temi di Esame a.a. 2012-2013 Statistica - CLEF I Prova Parziale di Statistica (CLEF) 11 aprile 2013 Esercizio 1 Un computer è collegato a due stampanti, A e B. La stampante A è difettosa ed il 25% dei

Dettagli

INDICE PREFAZIONE VII

INDICE PREFAZIONE VII INDICE PREFAZIONE VII CAPITOLO 1. LA STATISTICA E I CONCETTI FONDAMENTALI 1 1.1. Un po di storia 3 1.2. Fenomeno collettivo, popolazione, unità statistica 4 1.3. Caratteri e modalità 6 1.4. Classificazione

Dettagli

Statistica Applicata all edilizia Lezione 2: Analisi descrittiva dei dati

Statistica Applicata all edilizia Lezione 2: Analisi descrittiva dei dati Lezione 2: Analisi descrittiva dei dati E-mail: orietta.nicolis@unibg.it 1 marzo 2011 Prograa 1 Analisi grafica dei dati 2 Indici di posizione Indici di dispersione Il boxplot 3 4 Prograa Analisi grafica

Dettagli

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI 1. L azienda Wood produce legno compensato per costruzioni

Dettagli

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE Matematica e statistica: dai dati ai modelli alle scelte www.dima.unige/pls_statistica Responsabili scientifici M.P. Rogantin e E. Sasso (Dipartimento di Matematica Università di Genova) PROBABILITÀ -

Dettagli