2. Forma di investimento di ingresso 3. Forme di investimento: presenza in portafoglio 4. Forme di investimento più rilevanti

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "2. Forma di investimento di ingresso 3. Forme di investimento: presenza in portafoglio 4. Forme di investimento più rilevanti"

Transcript

1 Analisi delle scelte di investimento dei clienti In questo documento verranno analizzati i caratteri relativi alle scelte di investimento dei clienti, e verrà valutato anche se tali caratteristiche sono stabili nel tempo oppure no, al fine di comprendere se, nel tempo, il cliente tipico della società cambia. Alcune indicazioni per la lettura di questo documento: - breve spiegazione se una parola è evidenziata in verde, questo simbolo alla fine o all inizio della riga in cui si trova la parola contiene una brevissima spiegazione del concetto statistico. Per leggere il contenuto del commento basta toccare il simbolo con il mouse. - [Commento o descrizione più dettagliata di una tecnica] una frase evidenziata in giallo rimanda ad un documento con alcune considerazioni metodologiche o sulle modalità di utilizzo e di interpretazione degli strumenti statistici cui si fa riferimento. Per aprire il documento, selezionate la nella barra del menu di Adobe: Cliccando con il mouse sulla frase, si aprirà il documento. NB: i richiami metodologici cui si rimanda nel testo (ordinati per argomento) sono tutti contenuti in questo documenti [Richiami metodologici] - Output non riportato nel documento alcuni output non sono riportati nel documento per non appesantirlo eccessivamente; selezionando la e cliccando con il mouse sulla frase, si aprirà un nuovo documento che contiene l output. Di seguito sono riportati (a fini didattici) i principali strumenti statistici utilizzati nei diversi paragrafi. 1. Capitale totale di ingresso Rappresentazione grafica di una distribuzione asimmetrica: Istogramma, Box-plot, Curva di concentrazione. Cautele nelle rappresentazioni grafiche. Misure di sintesi: Scelta delle misure di sintesi nel caso di distribuzioni asimmetriche e in presenza di valori estremi o anomali Intervallo di confidenza per la media i

2 Studio della dipendenza Analisi della relazione lineare: diagrammi di dispersione, coefficiente di correlazione lineare, retta dei minimi quadrati, indice di determinazione, R 2. Verifica dell ipotesi nulla di non correlazione. Misure di concordanza. Verifica dell ipotesi di assenza di concordanza/discordanza. Analisi della dipendenza in media: Box plot (analisi stratificata) Medie condizionate. Valutazione (descrittiva) della dipendenza in media: indice Eta. Analisi inferenziale della funzione di regressione: Analisi della varianza a una via; test post hoc. Analisi della varianza nel caso di varianze non omogenee negli strati. Test di normalità. Analisi non parametrica della varianza 2. Forma di investimento di ingresso Distribuzione delle frequenze Misure di sintesi e loro valutazione inferenziale Analisi dell output di Statistica descrittiva di Excel Confronto tra istogrammi Studio della dipendenza: Tabelle a doppia entrata, distribuzioni congiunte e condizionate 3. Forme di investimento: presenza in portafoglio Stima della percentuale, e intervalli di confidenza per la percentuale Misure di sintesi e loro valutazione inferenziale Analisi dell output di Statistica descrittiva di Excel Studio della connessione: Misure di associazione e loro valutazione inferenziale. Test Chi-quadrato 4. Forme di investimento più rilevanti Misure di tendenza centrale Studio della dipendenza Analisi della relazione lineare: diagrammi di dispersione, coefficiente di correlazione lineare, retta dei minimi quadrati, indice di determinazione, R 2. Verifica dell ipotesi nulla di non correlazione. Misure di concordanza. Verifica dell ipotesi di assenza di concordanza/discordanza. Analisi della dipendenza in media: Box plot (analisi stratificata) Funzione di regressione: Medie condizionate. Valutazione descrittiva della dipendenza in media: indice Eta. Analisi inferenziale della funzione di regressione: Analisi della varianza a una via ; test post hoc. Analisi della varianza nel caso di varianze non omogenee negli strati. Test di normalità. Analisi non parametrica della varianza Analisi della varianza a più vie. Studio dell associazione: Distribuzioni congiunte e condizionate. Le diverse misure di associazione e loro valutazione inferenziale. 5. Numero di forme di investimento acquistate Distribuzione di frequenze Analisi dell associazione Distribuzioni congiunte e condizionate. Le diverse misure di associazione e loro valutazione inferenziale. ii

3 1. Capitale totale in ingresso nelle varie forme di investimento. Uno degli aspetti più rilevanti per la società riguarda l ammontare totale in ingresso nelle varie forme di investimento (che d ora in poi indicheremo semplicemente con capitale totale). Sostanzialmente, il capitale totale è la somma dei capitali in ingresso nelle varie forme di investimento, e dà un idea dell ammontare investito dai clienti della società ogni volta che entrano in contatto con nuovi tipi di prodotto. Inoltre, disaggregando il capitale totale per i diversi bienni di attività, si riesce a comprendere meglio le strategie di investimento degli investitori in termini di diversificazione del proprio portafoglio. E infatti possibile che i clienti inizino il contatto con la rete acquistando un determinato fondo (o un insieme ristretto di fondi) e rimangano sempre fedeli a quel tipo di fondo o, al contrario, che nel tempo si spostino anche su prodotti diversi. L analisi che segue mira quindi a chiarire questi aspetti. Come primo punto, cerchiamo di comprendere come è distribuito il capitale totale in ingresso (in milioni di lire) nelle varie forme di investimento tramite il box plot (Fig. 1.1) 1. [Box plot: una rappresentazione sintetica della distribuzione] 3 25 Capitale totale Valore Indice Minimo,14 1 Quartile 2,9983 Mediana (2 Quartile) 56, Quartile 14,75 Massimo Fig. 1.1 Box plot del capitale totale La distribuzione è fortemente asimmetrica a destra, con un nutrito gruppo di piccoli investitori e di pochi grandi investitori. Manca invece un folto gruppo di investitori medi. Se pensiamo poi che il range interquartile è pari al 4% circa del campo di variazione, è chiaro che la distribuzione risulta piuttosto dispersa. E però chiaro che la variabilità dei capitali investiti può anche derivare dal fatto che i clienti della società sono entrati in anni diversi. E quindi possibile che la distribuzione rifletta, più che una vera e propria eterogeneità negli investimenti, l anzianità di rapporto. Clienti di recente acquisizione hanno sicuramente avuto poco tempo per diversificare il proprio portafoglio, mentre clienti di più lunga attività possono essere riusciti ad entrare in contatto con più forme di investimento anche grazie alla rete di promotori. A questo punto, sembra opportuno valutare se esiste un legame tra capitale totale e anno di ingresso. Per rappresentare graficamente la distribuzione dei due caratteri, possiamo ricorrere al diagramma di dispersione, riportato nella Figura 1.2(a). 1 Risultati ottenuti utilizzando Excel. Il box-plot è stato ottenuto con la macro Stat438. 1

4 Fig. 1.2.(a) Capitale totale investito e anno di ingresso Il diagramma di dispersione non fornisce in realtà una rappresentazione di facile lettura della relazione tra i due caratteri considerati. Notiamo che sono presenti valori molto elevati che distorcono la visione di insieme della nuvola di punti. Per valutare meglio la relazione tra capitale totale e anno di ingresso, visto che il numero di anni di ingresso è piuttosto limitato, possiamo procedere ad un analisi stratificata, studiando quindi la distribuzione del capitale totale condizionatamente all anno di ingresso. [Analisi stratificata] Per farlo, consideriamo i box plot del capitale investito al variare dell anno di entrata nella società. [Analisi stratificata: box plot affiancati] Nella Figura 1.2(b) sono riportati i box-plot affiancati 2 ; nel grafico sono stati esclusi i valori estremi. [Box plot: cautele nella scelta delle scale] 15 1 Capitale totale (in milioni) 5 N = Fig. 1.2(b). Box plot del capitale totale investito, condizionatamente all anno di ingresso sono stati esclusi dal grafico i valori estremi) Dal grafico notiamo come valori molto alti del capitale totale corrispondano in particolar modo a clienti entrati a contatto con la società da molti anni. Nello stesso tempo però è intuibile la presenza 2 Ottenuti con SPSS (Analyze, Descriptives, Explore, Dependent = capitale totale, Factor= Anno di ingresso). 2

5 di un andamento ciclico degli investimenti, probabilmente dovuta al legame con il ciclo economico del paese. Per confrontare meglio l eterogeneità tra diversi clienti, è quindi opportuno scomporre il capitale totale per bienni di attività, tenendo conto del fatto che per alcuni clienti l osservazione è censurata, e quindi non è possibile tenere in considerazione queste osservazioni. [La censura delle osservazioni] Consideriamo il capitale investito rispettivamente nel primo, nel secondo e nel terzo biennio di attività e confrontiamo le loro distribuzioni, tramite un analisi delle misure di sintesi dei caratteri considerati (Tab. 1.1). Per facilitare il confronto tra le misure, è stato considerato l ammontare di capitale in milioni di lire. Tab Misure di sintesi del Capitale investito (in milioni di lire) Misure di sintesi Capitale investito nel Capitale investito nel Capitale investito nel 1 biennio 2 biennio 3 biennio Media 84,1 15,1 14,3 Deviazione standard 155,2 66,7 51,6 Varianza campionaria 2497,4 4444,9 2662,5 Range di variazione 1762,2 83,1 57,2 Coefficiente di variazione (CV) 1,8 4,4 3,6 Range interquartile 689,9 Minimo,14 Primo quartile 5 17, Mediana 35,9 Terzo quartile 86, Massimo 1762,2 83,1 57,2 Conteggio Livello di confidenza (95%) 9,6 4,4 3,7 Estremo inferiore IC(95%) 6 74,5 1,7 1, 6 Estremo superiore IC(95%) 93,7 19,5 18, Come è noto, la misura di tendenza centrale più comunemente utilizzata è la media (aritmetica). Dall analisi delle medie potremmo concludere che mentre nel primo biennio in media gli investitori impiegano circa 84 milioni del loro capitale, nei bienni successivi decidono di investire meno di un quinto di questa cifra in forme di investimento diverse. Ricordiamo che quello in esame è un campione di investitori. Le medie appena considerate sono quindi stime puntuali del capitale medio investito nei tre periodi considerati. Per tener conto, nella stima, dell incertezza dovuta al fatto che quello osservato è un campione, misurata dall errore standard della media campionaria, conviene fare riferimento agli intervalli di confidenza. Gli intervalli di confidenza al 95% per le tre medie considerate hanno ampiezze diverse (riflettendo i diversi errori standard delle medie campionarie). Per il primo biennio possiamo aspettarci un investimento medio tra i 74 e i 93 milioni da parte di un generico investitore. Nel secondo biennio possiamo aspettarci un investimento medio tra i 1 e i 19 milioni e nel terzo tra i 1 e i 17 milioni. Le misure di sintesi nella Tabella 1 evidenziano però che in questo caso, la media non è la misura di tendenza centrale più opportuna. Consideriamo infatti i cinque numeri di sintesi (minimo, massimo, primo, secondo e terzo quartile), necessari per studiare la forma della distribuzione per mezzo del box plot. Tramite questi indici 4 Risultati ottenuti utilizzando Excel (Strumenti: Analisi dei dati, statistica descrittiva) e con calcoli successivi (cfr. note a seguire). L output di Excel è stato riordinato per facilitare il commento dei risultati. 5 Il primo e il terzo quartile sono stati ottenuti utilizzando la funzione quarto di Excel. 6 Gli estremi inferiore e superiore IC(95%) sono gli estremi dell intervallo di confidenza al livello.95 per la media. Sono stati calcolati rispettivamente sottraendo e sommando alla media il livello di confidenza (95%) ottenuto con l Analisi dei dati di Excel. 3

6 notiamo che il massimo capitale investito diminuisce dal primo biennio a quelli successivi, e che le distribuzioni del capitale investito nel secondo e nel terzo biennio sono fortemente asimmetriche e caratterizzate da una lunghissima coda destra: il terzo quartile è nullo per entrambe le distribuzioni, ad evidenziare che almeno il 75% dei clienti non investe nei bienni successivi al primo. Si può quindi ipotizzare che la maggior parte dei clienti concentri le scelte di quali prodotti acquistare nel primo biennio di attività (o, addirittura, al primo contatto con la rete) e non si sposti in seguito su altre forme di investimento. Nello stesso tempo, il primo biennio è anche quello che vede impegnati i maggiori capitali. Data la forte asimmetria delle distribuzioni considerate, la media non è un informazione molto utile per la società, in quanto evidentemente risulta attratta dalla presenza di valori estremi molto elevati. [Valori estremi e outliers] Misure di sintesi più adeguate in questo caso (come in tutti i casi di distribuzioni asimmetriche) sono perciò le mediane, che assumono infatti valore nullo, ad indicare appunto la mancanza di iniziativa della maggior parte dei clienti nei bienni successivi al primo. [Media, mediana, media troncata per distribuzioni asimmetriche] Sostanzialmente, la maggior parte dei clienti della società non cambia prodotto. Analizziamo ora l ammontare di capitale investito in media nei bienni successivi al primo dai clienti che decidono di variare il proprio portafoglio. Tab. 1.1(a). Misure della posizione del Capitale (in milioni) investito escludendo i clienti che non hanno investito Sintesi Capitale (in milioni) investito dai soli clienti attivi nel 1 biennio 2 biennio 3 biennio Media 84,1 7,1 59,7 Mediana 35,9 23,3 28,5 Notiamo che si osserva comunque una flessione delle medie nei bienni successivi al primo, anche se meno rilevante di quella osservata includendo anche i clienti non attivi. Notiamo invece che per la mediana, la flessione passando dal secondo al terzo biennio non è nel senso di una diminuzione. In questa analisi abbiamo considerato l investimento di tutti i clienti attivi in un certo periodo, non tenendo conto delle differenze tra clienti con riferimento alla continuità o meno nell investimento. Sintetizziamo ora il capitale investito tenendo conto di questo aspetto. Nella Tabella 1.1.(b) riportiamo l ammontare medio (e mediano) di capitale investito dai clienti più attivi (investono in tutti e tre i bienni), dai clienti più discontinui (investono nel primo biennio e solo in uno dei bienni successivi) dai clienti meno attivi (investono solo nel 1 biennio). Tab. 1.1(b). Misure della posizione del Capitale (in milioni) investito a seconda della continuità nell investimento Capitale 1 biennio Capitale 2 biennio Capitale 3 biennio Azioni: Media Mediana Media Mediana Media Mediana Investe solo nel 1 biennio 68,81 3,46 Investe solo nel 1,2 biennio 139,43 54,3 67,6 21,27 Investe solo nel 1,3 biennio 13,31 53,94 63,77 29,5 Investe nel 1,2,3 biennio 98,98 46,19 75,92 32,81 5,94 26,8 E interessante notare che i clienti che investono solo nel 1 biennio sono quelli che investono (nel 1 biennio) un minor ammontare di capitale. I clienti che investono nel 1 biennio e/o nel 2 o nel 3 biennio sono quelli che investono di più in media nel 1 biennio. Per questi clienti si registra una flessione decisa dal 1 biennio a quello successivo (2 o 3 ). Notiamo infine che per i clienti più attivi (quelli che investono in tutti e tre i bienni) si ha una flessione nel capitale investito (sia in media che in mediana) da un biennio a quello successivo di entità inferiore rispetto a quelli saltuariamente attivi. 4

7 La asimmetria nella distribuzione dei capitali impiegati dai clienti nei bienni successivi al primo (molti investitori che non investono, pochi che diversificano il portafoglio) risulta in una maggior concentrazione degli investimenti per i bienni successivi al primo, quando solo il 2% dei clienti mostra qualche iniziativa (si veda in proposito il grafico delle curve di concentrazione in Fig. 1.3). Qi Fi Fig Curva di concentrazione del Capitale investito (Rapporto di Gini nei 3 bienni =.64,.93,.92) Nav 1 biennio Nav 2 biennio Nav 3 biennio Ancora, anche la variabilità delle distribuzioni risulta molto inferiore per il primo biennio che per i successivi. Il coefficiente di variazione, infatti, risulta più basso per il capitale investito nel primo biennio (1.8 contro 4.4). [Coefficiente di variazione e scarto quadratico medio] A questo punto, rappresentiamo graficamente solo la distribuzione del capitale investito nel 1 biennio tramite un istogramma. Per quanto riguarda le distribuzioni relative ai bienni successivi, infatti, la presenza di un 8% di clienti con nessun capitale investito rende tale rappresentazione grafica inutile. Come già visto in precedenza, la distribuzione del capitale investito nel 1 biennio è fortemente asimmetrica. In questo caso, è abbastanza cruciale scegliere opportunamente le classi da utilizzare per rappresentare graficamente la distribuzione del carattere. [Istogramma: la scelta delle classi]. La lunga coda destra che caratterizza la distribuzione suggerisce, inoltre di escludere l ultima classe dalla rappresentazione. [Istogramma: cautele nella scelta delle scale] Questo consente una visualizzazione più chiara della distribuzione del carattere nelle classi con frequenza più elevata (Fig. 1.4). Gli estremi delle classi e la relativa densità di frequenza sono presentate in Tab Tab Tabella delle frequenze relativa all istogramma (classi pre-assegnate) 7 Estr. inferiori Estr. superiori Fr. assolute Fr. relative Densità E-5 7 La tabella e il corrispondente istogramma sono stati ottenuti utilizzando EXCEL e la macro Stat438. 5

8 Densità Capitale investito nel 1 biennio (in milioni, escludendo l'ultima classe) Fig Istogramma del capitale investito nel 1 biennio (classi pre-assegnate) Il messaggio è ancora più chiaro: i clienti dell azienda nel primo biennio optano soprattutto per investimenti piuttosto cauti, la moda è infatti -5 milioni, e pochissimi si avventurano al di sopra dei 2 milioni. Quello che ci interessa comprendere è a questo punto se e come è cambiata nel tempo la capacità della rete di attrarre investitori che hanno impiegato, almeno nel 1 biennio, un elevato ammontare di capitale. Vogliamo cioè indagare sulla relazione (se esiste) che lega il capitale all anno di entrata. Il carattere dipendente (il capitale) è quantitativo e il carattere esplicativo è quantitativo ma assume un numero limitato di modalità. Potremmo indagare quindi sulla relazione tra i due caratteri o facendo riferimento al loro eventuale legame lineare o indagando sull esistenza di una relazione non necessariamente lineare o analitica. Indagare il legame lineare che lega i due caratteri significa domandarsi se all aumentare dell anno di entrata aumenta o diminuisce l ammontare di capitale investito nel 1 biennio. Il diagramma di dispersione relativo ai due caratteri è riportato nella Fig Nel diagramma è riportata anche la retta di regressione y = 1,875x - 364,4 R 2 =, Fig. 1.5 Capitale nel 1 biennio e anno di ingresso e retta di regressione Così come già osservato con riferimento al capitale totale (Fig. 1.2(a)) il diagramma di dispersione non suggerisce alcun tipo di relazione tra i caratteri. Inoltre l indice di determinazione, R 2, evidenzia che siamo in una situazione prossima a quella di indipendenza correlativa, il caso cioè in cui il coefficiente di correlazione lineare è prossimo a zero, ad indicare che non ha senso utilizzare la relazione lineare per spiegare il capitale nel 1 biennio in funzione del tempo. Per valutare se la vicinanza alla situazione di indipendenza correlativa può essere estesa all intera 6

9 198 popolazione, riportiamo nella Tabella 1. 3 il valore del coefficiente di correlazione lineare e il risultato del test per verificare l ipotesi nulla che il coefficiente di correlazione tra i due caratteri sia nullo nell intera popolazione. Il p-value risulta pari a.7. Fissato quindi un livello di significatività pari a.5 tale valore del p-value porterebbe a concludere a favore dell ipotesi nulla (secondo la quale il coefficiente di correlazione lineare è nullo). Tab Coefficienti di correlazione tra capitale investito nel 1 biennio e anno di ingresso 8 Coefficiente Valore assunto P-value Pearson Correlation,57,7 Kendall's tau_b,14,526 Spearman's rho,22,483 Il risultato ottenuto sembra coerente con il diagramma di dispersione. Procediamo ora valutando l esistenza di una generica relazione di concordanza (ricordiamo che due caratteri si dicono concordanti se a modalità elevate di uno dei due tendono ad essere associate modalità crescente, anche se tale relazione non è necessariamente lineare). Tra gli indici di concordanza più comunemente utilizzati, ricordiamo l indice tau di Kendall e il coefficiente di Spearman. Si noti come i due indici di concordanza assumano valori ancora più bassi rispetto al coefficiente di correlazione lineare. Questo è dovuto al fatto che il coefficiente di correlazione lineare è attratto da alcune coppie di valori anomali evidenti nel diagramma di dispersione, che lo inflazionano, facendogli quindi assumere un valore più elevato (per quanto basso) rispetto a quello che assumerebbe se tali coppie non fossero presenti. [Non robustezza del coefficiente di correlazione lineare] Non c è quindi evidenza favorevole all ipotesi che il capitale investito nel 1 biennio sia legato all anno di ingresso da una relazione lineare. Analizzando il diagramma di dispersione, ci rendiamo conto che non è probabilmente possibile individuare una funzione analitica (anche non lineare) che leghi tra loro i caratteri. Ci chiediamo quindi se al variare dell anno varia la distribuzione del capitale nel 1 biennio, senza fare alcun tipo di ipotesi sul la forma della dipendenza. Consideriamo innanzitutto, come già fatto per il capitale totale, le distribuzioni del capitale investito nel 1 biennio condizionate all anno di ingresso. [Analisi stratificata]. Nella Figura 1.6. sono riportati i box-plot affiancati del capitale investito nel 1 biennio al variare dell anno di ingresso, escludendo i valori estremi. [Box plot: cautele nella scelta delle scale] 5 Capitale investito nel 1 biennio (in milioni) 25 N = Fig Capitale investito nel 1 biennio (esclusi valori del capitale > 5 milioni) 8 Risultati ottenuti con SPSS (Analyze, Correlations, Bivariate). 7

10 Possiamo notare un andamento ciclico, presumibilmente legato al ciclo economico e/o all andamento dei mercati finanziari (e alla fiducia degli investitori). Notiamo inoltre, cosa più importante, che negli ultimissimi anni sembra comparire una tendenza alla diminuzione nella capacità di attrarre investitori fiduciosi (che investono quindi un elevato ammontare di capitale). Un modo per evidenziare ulteriormente le differenze tra gli anni di osservazione consiste nel disegnare degli istogrammi che rappresentano l importanza relativa delle diverse fasce di capitale al variare dell anno di ingresso. [Analisi stratificata: gli istogrammi]. Tuttavia, in questo caso il numero di istogrammi da confrontare sarebbe eccessivamente elevato, e un confronto tra questi sarebbe quantomeno poco agevole. Per agevolare il confronto tra le distribuzioni, raggruppiamo la variabile Anno di ingresso in 5 categorie: ; ; ; ; (tenendo conto dell andamento ciclico del capitale nel tempo). Nella Figura 1.7 sono riportate le distribuzioni di frequenza del capitale totale investito (considerando 8 classi pre-assegnate). (NB: ovviamente questi non sono gli istogrammi condizionati; stiamo solamente confrontando l importanza relativa di ogni fascia di capitale nelle distribuzioni condizionate all anno di ingresso (in classi): quella riportata in Fig rappresenta quindi la rappresentazione grafica della tabella delle frequenze che competono ad ogni classe di intervallo). Percent 1% 75% 5% Fascia di capitale 1 biennio -5 milioni 5-1 milioni 1-25milioni 25-5 milioni 5-1 milioni 1-2 milioni 2-35 milioni oltre 35 milioni 25% % Fig. 1.7 Distribuzioni di frequenza del capitale nel 1 biennio al variare dell anno di entrata (classi) I clienti di recente acquisizione () tendono ad investire meno (le classi relative ad un basso ammontare di capitale sono caratterizzate da una maggior frequenza) rispetto al triennio precedente; inoltre, gli investimenti più esigui si sono registrati soprattutto negli anni. Queste differenze nelle distribuzioni si riflettono nei valori di sintesi riportati nella Tabella Sostanzialmente si nota a partire dal 199 un iniziale aumento delle misure di sintesi (sia la media sia la mediana, più attendibile visto che sono presenti valori del capitale anche molto anomali), un picco negli anni dal 1994 al 1996 e una tendenza alla diminuzione negli ultimi anni. [Analisi stratificata: le misure di sintesi] Il fatto che le medie condizionate siano diverse tra loro implica che il capitale investito nel 1 biennio dipende in media dall anno di ingresso (in classi). Per valutare la forza di tale dipendenza, consideriamo l indice Eta quadro (riportato anch esso nella Tab. 1.4): esso assume un valore molto basso (.19) ad indicare che siamo prossimi alla situazione di indipendenza in media del capitale dal tempo. Anche se le medie sono diverse tra di loro, quindi, la dispersione (in particolare la 1 Risultati ottenuti utilizzando SPSS (Analyze, Compare Means, Means). 8

11 varianza) nelle sotto-popolazioni considerate è eccessivamente elevata perché le medie siano sintesi affidabili (che possono quindi essere utilizzate per sintetizzare l intera sotto-popolazione). Di fatto, stiamo dicendo che non è possibile utilizzare la media condizionata per prevedere il capitale investito dai clienti entrati in ogni periodo. Tab Misure di sintesi e indice Eta: cap. investito nel 1 biennio anno di ingresso (classi) Capitale investito nel 1 biennio (in milioni) Anno di ingresso (classi) Total Std. Mean N Deviation Minimum Maximum Median Measures of Association Capitale investito nel 1 biennio (in milioni) * Anno di ingresso (classi) Eta Eta Squared Serve però ora comprendere se le differenze osservate tra le medie siano significative, ovvero se si possa pensare che i comportamenti degli investitori si siano modificati sostanzialmente nel tempo, o invece se le differenze riscontrate siano effetto di oscillazioni casuali (dovute al fatto che stiamo considerando dei campioni). Per eseguire questo tipo di controllo, ricorriamo all analisi della varianza (ANOVA) del capitale nel 1 biennio sull anno di ingresso riportata nella Tab. 1.5(a). Ricordiamo che nell ANOVA, l ipotesi nulla è che l ammontare di capitale investito in media sia uguale in tutti i sotto-campioni indotti dalle modalità della variabile esplicativa (Anno di ingresso); l ipotesi alternativa è che la differenza sia significativamente diversa da zero almeno per una coppia di medie. [Analisi della varianza] La verifica di ipotesi viene condotta nell approccio standard assumendo che le varianze all interno degli strati siano uguali tra loro e che la distribuzione della variabile dipendente sia normale. Nella Tabella 1.5(a) sono riportati i risultati ottenuti con l approccio standard. L ipotesi nulla viene rifiutata: il p-value indicato con Sig della statistica test sotto l ipotesi nulla è prossimo a zero. Tab. 1.5.(a) Analisi della varianza di Capitale investito nel 1 biennio su anno di ingresso (in classi) Capitale investito nel 1 biennio (in milioni) Between Groups Within Groups Total ANOVA Sum of Squares df Mean Square F Sig Ciò non significa che le medie sono tutte significativamente diverse l una dall altra ma, piuttosto, che c è almeno una coppia di medie che risultano statisticamente diverse tra loro. Per comprendere quali sono le coppie di medie che inducono al rifiuto dell ipotesi nulla, consideriamo la Tabella 1.5(b) in cui sono riportati i risultati di due test post-hoc (test LSD e test di Bonferroni) per verificare, per ogni coppia di medie, l ipotesi nulla che queste siano uguali (contro l alternativa che siano diverse). [I test post-hoc per l individuazione delle differenze significative nell ANOVA] 9

12 Tab. 1.5.(b) ANOVA di Cap. investito nel 1 biennio su anno di ingresso (segue) Dependent Variable: Capitale investito nel 1 biennio (in milioni) LSD Bonferroni (I) Anno di ingresso (J) Anno di ingresso *. The mean difference is significant at the.5 level. Multiple Comparisons Mean Difference Std. 95% Confidence Interval (I-J) Error Sig. Lower Bound Upper Bound * * * * * * * * * * Dalla tabella notiamo che sulla base del test di Bonferroni, più conservativo, si può concludere, fissato un livello di significatività pari a.5, che esiste una differenza significativa tra il capitale medio nel (valore più basso osservato per la media) e quello del periodo (più alto valore della media). Facendo riferimento al test LSD vengono considerate significative le differenze osservate tra e ; questo ultimo periodo risulta inoltre caratterizzato da una media significativamente diversa da tutte le altre, tranne quella del periodo (quella più vicina in ordine di grandezza), e la media del risulta da ultimo significativamente diversa da quelle registrate nel periodo e I risultati ottenuti con l approccio standard sono affidabili solo se le assunzioni alla base dell ANOVA sono soddisfatte. Valutiamo in prima battuta se l ipotesi che le varianze del capitale investito nel 1 biennio nelle sottopopolazioni indotte dall anno di ingresso (strati) sono uguali debba essere accettata o meno. Nella Tabella 1.6 vengono riportati i risultati del test di Levene per la verifica dell ipotesi di 1

13 omogeneità delle varianze. Il p-value è decisamente basso, e l ipotesi nulla viene quindi rifiutata. In questo caso, l ANOVA standard è inadeguata e si deve ricorrere a test robusti all assunzione di omogeneità delle varianze. [ANOVA: varianze non omogenee] Tab Analisi della varianza del Cap. investito nel 1 biennio sull anno di ingresso nel caso di non omogeneità delle varianze Test of Homogeneity of Variances Capitale investito nel 1 biennio (in milioni) Levene Statistic df1 df2 Sig Robust Tests of Equality of Means Capitale investito nel 1 biennio (in milioni) Welch Brown-Forsythe a. Asymptotically F distributed. Statistic a df1 df2 Sig Multiple Comparison Dependent Variable: Capitale investito nel 1 biennio (in milioni) Tamhane Games-Howell (I) Anno di ingresso (classi) (J) Anno di ingresso (classi) *. The mean difference is significant at the.5 level. Mean Difference (I-J) 95% Confidence Interval Std. Error Sig. Lower Bound Upper Bound 32, ,29757,88-2, ,657 15, ,98339,964-24, ,3837-3, ,6357,776-88,747 27,3461-5, , , -52,182 41, , ,29757,88-67,657 2, , ,21834,662-47,39 12, ,9325* 15,3253,6-114, , , ,49777,55-76,2591, , ,98339,964-55, , , ,21834,662-12, ,39-45, ,88833,176-1,395 9,747-2, ,16272,857-63, ,35 3, ,6357,776-27, ,747 62,9325* 15,3253,6 11, , , ,88833,176-9,747 1,395 25,161 16,2422,934-34,715 84,7428 5, , , -41, ,182 37, ,49777,55 -, ,2591 2, ,16272,857-22,35 63, ,161 16,2422,934-84, ,715 32, ,29757,69-1, , , ,98339,82-23, ,3139-3, ,6357,573-86,518 25,7893-5, ,29889,998-5,8636 4, , ,29757,69-66,6638 1, , ,21834,475-46,237 11, ,9325* 15,3253,6-112, , ,9163* 14,49777,44-75,2227 -,61-15, ,98339,82-54, , , ,21834,475-11, ,237-45, ,88833,131-98,915 7,5858-2, ,16272,658-62,483 21,1995 3, ,6357,573-25, ,518 62,9325* 15,3253,6 13, , , ,88833,131-7, ,915 25,161 16,2422,762-33,144 83,1367 5, ,29889,998-4,1672 5, ,9163* 14,49777,44,61 75,2227 2, ,16272,658-21, ,483-25,161 16,2422,762-83, ,144 Sempre nella Tabella 1.6 riportiamo quindi i risultati ottenuti con i test di Welch e di Brown- Forsythe. L ipotesi di uguaglianza tra le medie viene rifiutata (quindi la decisione è la stessa presa sulla base della procedura standard), e il p-value è ancora molto basso. Analizziamo ora i test posthoc adeguati nel caso di varianze non uguali negli strati. 11

14 I due test considerati (il primo è più conservativo) danno risultati diversi rispetto a quelli ottenuti sotto l ipotesi di uguaglianza tra le varianze. Notiamo infatti che entrambi i test portano a concludere che il capitale medio investito dai clienti entrati nel periodo (che risulta il minimo) è significativamente diverso dal capitale medio massimo, che è quello investito dai clienti entrati nel Il test meno conservativo (il secondo) suggerisce una differenza significativa tra la media nel e quella dell ultimo periodo, (il secondo valore della media in ordine di grandezza quindi la media più bassa è significativamente diversa dalle due più elevate). Verifichiamo ora l assunzione di normalità, alla base dell ANOVA, con il test di Kolmogorov- Smirnov. 12 One-Sample Kolmogorov-Smirnov Test N Normal Parameters b Most Extreme Differences Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) b. Calculated from data. Mean Std. Deviation Absolute Positive Negative Capitale investito nel 1 biennio (in milioni) 12 84, ,23335,294,254 -,294 9,36, Bisogna sottolineare che l anova è robusta a deviazioni dall ipotesi di normalità, purché la distribuzione del carattere dipendente non sia eccessivamente obliqua. Nel nostro caso, come evidenzia il box plot riportato all inizio del paragrafo, la distribuzione del carattere è fortemente asimmetrica. Nel caso di distribuzioni fortemente asimmetriche, le medie, misure di sintesi non robuste, possono essere influenzate dalla presenza di valori anomali e fornire quindi un immagine distorta della relazione tra il carattere dipendente e quello esplicativo. E quindi opportuno, sia dal punto di vista descrittivo che dal punto di vista inferenziale confrontare le mediane piuttosto che le medie 13. [Analisi stratificata: le misure di sintesi] 2 5 Cap. 1 biennio (dettaglio) Cap. nel 1 biennio 1 N = N = Risultati ottenuti utilizzando SPSS (Analyze, Non parametric Tests, 1 independent sample). 13 Ovviamente, quando si procede ad un analisi della varianza si verifica prima se le assunzioni sono soddisfatte e si sceglie quindi l approccio più adeguato. In questo caso, quindi si sarebbero dovuti prendere in considerazione solo i risultati ottenuti con l approccio non parametrico. L approccio seguito è motivato da esigenze didattiche. 12

15 I box plot affiancati evidenziano una certa differenza tra le mediane e una possibile influenza dei valori anomali sulle medie. Procediamo quindi con un analisi della varianza non parametrica. [ANOVA non parametrica] Tab Analisi della varianza non parametrica 14 Test di Kruskal-Wallis Ranks Capitale investito nel 1 biennio (in milioni) Anno di i Total N Mean Rank Chi-Square df Asymp. Sig. Test Statistics Capitale investito nel 1 biennio (in milioni) Test delle Mediane Capitale investito nel 1 biennio (in milioni) > Median <= Median Frequencies Anno di ingresso (classi) Test Statistics N Median Chi-Square df Asymp. Sig. Capitale investito nel 1 biennio (in milioni) L ipotesi sottoposta a verifica è che la distribuzione del carattere dipendente non vari da strato a strato. Entrambi i test non parametrici portano al rifiuto dell ipotesi nulla. In sostanza, notiamo che in questo caso le conclusioni fornite dall ANOVA standard coincidono con quelle ottenute con le analisi della varianza quando si tenga della caduta delle due ipotesi di omogeneità delle varianze e di normalità. Ovviamente, a questo punto dovremmo per completezza procedere a verificare quali sono le coppie di popolazioni significativamente diverse tra loro. Per farlo dovremo effettuare dei test post-hoc. Tali test possono essere condotti o tenendo sotto controllo l errore di primo tipo relativo ad ognuno dei singoli confronti (detto anche Comparisonwise Error), oppure tenendo conto dell errore complessivo di primo tipo, cioè l errore di primo tipo relativo a tutti i confronti considerati (detto anche Experimentwise Error). Non sono disponibili test non parametrici del secondo tipo; dovremo quindi procedere a confrontare tutte le differenze separatamente [Test non parametrici per verificare l uguaglianza tra due popolazioni] I risultati dei test sono riportati nella Tabella 1.8 e, come si nota, coincidono con quelli ottenuti 14 Risultati ottenuti utilizzando SPSS (Analyze, Non parametric Tests, K independent samples). 13

16 utilizzando il test LSD (test che tiene anch esso sotto controllo la probabilità di commettere un errore di prima specie solo a livello di confronto singolo e non di confronto multiplo). Tab Risultato dei test post-hoc non parametrici (Mann Whitney) 15 e riassunto dei test post-hoc standard e sotto l ipotesi di non omogeneità delle varianze Periodi confrontati Test di Mann-Whitney LSD Bonferroni Tamhane Games-Howell Z P-value Risultati ottenuti utilizzando SPSS (Analyze, Non parametric Tests, 2 independent samples). 14

17 2. Forma di investimento di ingresso Come si è visto nel paragrafo 1, il primo biennio è quello durante il quale vengono investiti i maggiori capitali. E ora interessante comprendere quale sia il fondo che riscuote maggior successo tra gli investitori sia per quanto riguarda la diffusione del fondo tra i clienti della società che per l ammontare di capitale investito in ingresso, in media, per cliente attivo. Sostanzialmente, lo studio della forma di investimento di entrata dei nuovi investitori (qui di seguito) consente di valutare qual è la forma di investimento che attrae, almeno inizialmente, i nuovi clienti. Nella Tabella 2.1. è riportata la distribuzione delle frequenze della forma di investimento di ingresso. Tab Distribuzione delle frequenze 1 Forma di investimento di ingresso Fr. assolute Fr. relative Asvita % Fondo % Fondo % Fondo % Fondo3 2 2.% Fondo % Fondo % Fondo % Fondo % Fondo % Fondo9 4.4% Totale complessivo 12 1.% Le forme di ingresso più tipiche sono l assicurazione sulla vita (valore modale), il Fondo2, il Fondo4 e, anche se meno rilevante, il Fondo7. Per questi fondi, consideriamo le misure di sintesi del capitale di ingresso investito, riportate nella Tabella 2.2. Tab Misure di sintesi del capitale di ingresso (in milioni) per le 4 forme di ingresso preferite 2 Asvita Fondo2 Fondo4 Fondo7 Numero di osservazioni Media Varianza Deviazione standard Errore standard della media Livello inferiore IC Livello superiore IC Media troncata(5%) Minimo Primo quartile Secondo quartile Terzo quartile Massimo Range di variazione Range interquartile Nota: Le misure di sintesi qui riportate sono le realizzazioni campionarie (stime) dei cosiddetti stimatori analogici delle corrispondenti caratteristiche nella popolazione. Tali stimatori si ottengono applicando ai dati campionari le stesse formule che vengono utilizzate per valutare le misure nell intera popolazione (unica eccezione è la varianza: nella popolazione è definita come somma degli scarti dalla media divisa per l ampiezza della popolazione; la sua versione campionaria ha come denominatore l ampiezza campionaria diminuita di un unità) 1 Risultati ottenuti utilizzando EXCEL e la macro Stat438 2 Risultati ottenuti utilizzando Excel (Strumenti, Analisi dei dati, Statistica descrittiva) 15

18 Nella Tabella 2.3. sono riportate anche le distribuzioni di frequenza del capitale investito considerando 5 classi di intervallo. Tab Distribuzione del capitale di ingresso (in milioni) per le 4 forme di ingresso preferite 3 Estr. inf. Estr. sup. Asvita Fondo2 Fondo4 Fondo7 n i p i n i p i n i p i n i p i Assicurazioni sulla vita e Fondo2 sono le due forme di investimento in cui viene investito capitale (iniziale) più elevato. Notiamo infatti medie più elevate ma, considerazione più significativa, quartili più elevati e code destre caratterizzate da frequenze relative più elevate rispetto al Fondo4 e al Fondo7. Le forme di investimento più frequentemente scelte all ingresso sono anche quelle che inducono a stanziare un maggior capitale iniziale. In altre parole, i prodotti dell azienda di gestione fondi che risultano più diffusi al primo contatto con la clientela sono anche quelli che, in media, attirano più capitale. Ma è cambiato qualcosa nel tempo? L azienda è riuscita a diffondere con maggior efficacia altre forme di investimento già al primo contatto? Per capire se ci siano differenze temporali consideriamo ora se e come variano le scelte di investimento iniziali in funzione dell anno di ingresso (raggruppato in classi). Nella Tabella 2.4 sono riportate la distribuzione congiunta dei due caratteri e la distribuzione di (Primo investimento Anno di ingresso). [Analisi condizionata: le distribuzioni di frequenza] Tab Tabella a doppia entrata del primo investimento e dell anno di ingresso (% of Total) e distribuzioni del primo investimento condizionate all anno di ingresso (% within Anno di ingresso) 4 Anno di ingresso (categorie) primo_inv Total asvita % within Anno di ingresso 48.6% 28.5% 24.4% 24.8% 11.1% 27.9% % of Total 1.1% 7.5% 4.1% 4.1% 2.2% 27.9% fondo % within Anno di ingresso 1.2% 4.5% 1.1% % of Total.2%.9% 1.1% fondo1 % within Anno di ingresso 1.5% 14.9% 21.2% 6.6% 7.7% % of Total.4% 2.5% 3.5% 1.3% 7.7% fondo2 % within Anno di ingresso 25.% 22.1% 48.2% 23.6% 12.1% 25.3% % of Total 5.2% 5.8% 8.1% 3.9% 2.4% 25.3% fondo3 % within Anno di ingresso 1.1% 5.4% 1.8% 2.5% 2.% % of Total.3%.9%.3%.5% 2.% fondo4 % within Anno di ingresso 22.6% 33.1% 1.2% 4.5% 14.5% % of Total 4.7% 8.7%.2%.9% 14.5% fondo5 % within Anno di ingresso 3.% 12.1% 1.6% 4.6% % of Total.5% 2.% 2.1% 4.6% fondo6 % within Anno di ingresso 3.8% 1.5%.6% 1.1% 3.3% % of Total.8%.4%.1% 2.% 3.3% fondo7 % within Anno di ingresso 12.2% 4.2% 1.9% 21.7% 1.% % of Total 3.2%.7% 1.8% 4.3% 1.% fondo8 % within Anno di ingresso 16.2% 3.2% % of Total 3.2% 3.2% fondo9 % within Anno di ingresso 2.4%.4% % of Total.4%.4% Total % within Anno di ingresso 1.% 1.% 1.% 1.% 1.% 1.% % of Total 2.8% 26.2% 16.8% 16.5% 19.8% 1.% 3 Risultati ottenuti utilizzando la macro Stat438 4 Risultati ottenuti utilizzando SPSS (Analyze, Descriptive, Cross-tabs). 16

19 Per una più agevole lettura della tabella, utilizziamo una rappresentazione della distribuzione congiunta e delle distribuzioni condizionate per mezzo di barre, riportate nella Figura 2.1. In particolare, nel primo grafico è riportata la distribuzione congiunta dei due caratteri: ogni barra ha un altezza proporzionale alla frequenza marginale che compete al carattere le cui modalità sono riportate sull asse delle ascisse (anno di ingresso). Nella seconda figura sono invece riportate le distribuzioni condizionate: l altezza di ogni barra è pari a 1, e ogni barra rappresenta la distribuzione di frequenza del carattere in un certo anno. 25% 2% Primo_inv asvita fondo fondo1 fondo2 fondo3 fondo4 fondo5 fondo6 fondo7 fondo8 fondo9 Percent 15% 1% 5% 1% 75% Primo_inv asvita fondo fondo1 fondo2 fondo3 fondo4 fondo5 fondo6 fondo7 fondo8 fondo9 Percent 5% 25% % Fig Distribuzioni di frequenze della forma di inv. iniziale per anno di ingresso Notiamo che negli anni dal 1985 al 1987 le forme di ingresso sono poche e concentrate soprattutto su assicurazioni vita e 2 tipi di fondi (il Fondo2 e il Fondo4). Nei periodi successivi si osserva però una maggior differenziazione delle forme di ingresso: i clienti entrano meno spesso con investimenti di tipo assicurativo e anche altri fondi vengono prescelti come forme di investimento iniziali. La rete sembra quindi aver acquisito la capacità di proporre forme di investimento diverse anche ai nuovi clienti. 17

20 3. Forme di investimento: presenza in portafoglio e capitale investito. Passiamo ora a considerare le diverse forme di investimento presenti nel portafoglio di un generico cliente. Rispetto all analisi appena fatta, qui si riflette sulla notorietà dei prodotti dell azienda in un arco di tempo pari alla durata di rapporto con l azienda. Nella Tabella 3.1 è riportata, per ogni forma di investimento, la percentuale di clienti che la possiedono nel loro portafoglio, che rappresenta la stima puntuale della percentuale di clienti che acquistano la forma di investimento considerata. Tale percentuale può essere anche riguardata come la probabilità che un generico cliente decida di acquistare una certa forma di investimento. Nelle ultime due colonne della tabella è riportato l intervallo di confidenza al 95% della percentuale. Tab Stima della percentuale di clienti per ogni fi e intervallo di confidenza 1 Forma di investimento q P Se Intervallo di confidenza per P (.95) estremo inf estremo sup Asvita Fondo Fondo Fondo Fondo Fondo Fondo Fondo Fondo Fondo Fondo Note: p = % di clienti che possiedono la i-esima forma di investimento, q = % di clienti che non possiedono la i-esima forma di investimento. Se = stima dello standard error di p. Le forme di investimento preferite dagli investitori sono assicurazioni vita, Fondo2 e Fondo1, 5 e 7. Restringendosi ai soli clienti attivi su una certa forma di investimento (vengono quindi esclusi, per ogni tipo di prodotto, i clienti che lo non possiedono), possiamo anche considerare la distribuzione degli investimenti fatti per forma di investimento e calcolare alcune misure di sintesi (Tabella 3.2). Per agevolare la lettura dei risultati, nella Figura 3.1. sono riportate le misure della posizione (media, media troncata e mediana) del capitale investito in ogni forma di investimento. L asimmetria delle distribuzioni è assolutamente evidente, sia dal confronto tra media e mediana che dalla rappresentazione delle distribuzioni tramite box-plot affiancati. La misura di sintesi più adeguata per rappresentare il capitale investito per forma di investimento risulta quindi in questo caso la mediana [Media, mediana, media troncata per distribuzioni asimmetriche]. Notiamo che le forme di investimento che attirano maggior capitale sono Fondo8, Fondo2 e Assicurazioni sulla vita. E interessante notare che le ultime due forme di investimento sono anche quelle più presenti nei portafogli clienti, mentre Fondo8, che è la forma di investimento che attrae maggior capitale, non è scelta da molti investitori. La presenza in portafoglio di un certo tipo di fondo può però variare a seconda dell anno di entrata (ad esempio perché clienti di più lunga data sono stati più a contatto con la rete di promotori, che hanno avuto maggiori possibilità di convincerli a spostarsi su nuove forme di investimento). Quindi, per valutare se le distribuzioni delle variabili relative alla presenza delle forme di investimento cambiano nel tempo, riportiamo in Tab. 3.3 tali distribuzioni condizionate all anno di entrata (classi). [Analisi condizionata: le distribuzioni di frequenza] 1 Risultati ottenuti utilizzando Excel. 18

Analisi della performance temporale della rete

Analisi della performance temporale della rete Analisi della performance temporale della rete In questo documento viene analizzato l andamento nel tempo della performance della rete di promotori. Alcune indicazioni per la lettura di questo documento:

Dettagli

Misure della dispersione o della variabilità

Misure della dispersione o della variabilità QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.

Dettagli

Dott.ssa Caterina Gurrieri

Dott.ssa Caterina Gurrieri Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo

Dettagli

Approfondimento 4.6. La valutazione statistica della discriminatività di un item

Approfondimento 4.6. La valutazione statistica della discriminatività di un item Approfondimento.6 La valutazione statistica della discriminatività di un item. Item di test di prestazione massima Per valutare la discriminatività di un item di un test di prestazione massima occorre

Dettagli

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk

Dettagli

Elaborazione dei dati su PC Regressione Multipla

Elaborazione dei dati su PC Regressione Multipla 21 Elaborazione dei dati su PC Regressione Multipla Analizza Regressione Statistiche Grafici Metodo di selezione Analisi dei dati 21.1 Introduzione 21.2 Regressione lineare multipla con SPSS 21.3 Regressione

Dettagli

Statistica descrittiva: prime informazioni dai dati sperimentali

Statistica descrittiva: prime informazioni dai dati sperimentali SECONDO APPUNTAMENTO CON LA SPERIMENTAZIONE IN AGRICOLTURA Statistica descrittiva: prime informazioni dai dati sperimentali La statistica descrittiva rappresenta la base di partenza per le applicazioni

Dettagli

CAPITOLO 10. Controllo di qualità. Strumenti per il controllo della qualità e la sua gestione

CAPITOLO 10. Controllo di qualità. Strumenti per il controllo della qualità e la sua gestione CAPITOLO 10 Controllo di qualità Strumenti per il controllo della qualità e la sua gestione STRUMENTI PER IL CONTROLLO E LA GESTIONE DELLA QUALITÀ - DIAGRAMMI CAUSA/EFFETTO - DIAGRAMMI A BARRE - ISTOGRAMMI

Dettagli

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva Brugnaro Luca Progetto formativo complessivo Obiettivo: incrementare le competenze degli operatori sanitari nelle metodiche

Dettagli

Università del Piemonte Orientale. Corsi di Specialità. Corso di Statistica Medica. Analisi dei dati quantitativi : Analisi della varianza

Università del Piemonte Orientale. Corsi di Specialità. Corso di Statistica Medica. Analisi dei dati quantitativi : Analisi della varianza Università del Piemonte Orientale Corsi di Specialità Corso di Statistica Medica Analisi dei dati quantitativi : Analisi della varianza Università del Piemonte Orientale Corso di laurea in biotecnologie

Dettagli

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice cap 0 Romane - def_layout 1 12/06/12 07.51 Pagina V Prefazione xiii Capitolo 1 Nozioni introduttive 1 1.1 Introduzione 1 1.2 Cenni storici sullo sviluppo della Statistica 2 1.3 La Statistica nelle scienze

Dettagli

ELEMENTI DI STATISTICA DESCRITTIVA

ELEMENTI DI STATISTICA DESCRITTIVA Metodi Statistici e Probabilistici per l Ingegneria ELEMENTI DI STATISTICA DESCRITTIVA Corso di Laurea in Ingegneria Civile Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain E-mail:

Dettagli

Elaborazione dati in Analisi Sensoriale

Elaborazione dati in Analisi Sensoriale Elaborazione dati in Analisi Sensoriale Si è parlato di interpretazione corretta dei risultati ottenuti; a questo concorrono due fattori: affidabilità e validità. Se i test fossero stati ripetuti con lo

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 5-Indici di variabilità (vers. 1.0c, 20 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Esplorazione dei dati

Esplorazione dei dati Esplorazione dei dati Introduzione L analisi esplorativa dei dati evidenzia, tramite grafici ed indicatori sintetici, le caratteristiche di ciascun attributo presente in un dataset. Il processo di esplorazione

Dettagli

Grafici delle distribuzioni di frequenza

Grafici delle distribuzioni di frequenza Grafici delle distribuzioni di frequenza L osservazione del grafico può far notare irregolarità o comportamenti anomali non direttamente osservabili sui dati; ad esempio errori di misurazione 1) Diagramma

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Economia Facoltà di Economia, Università di Ferrara

Dettagli

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

RICCHEZZA E ISTRUZIONE (NEL MONDO)

RICCHEZZA E ISTRUZIONE (NEL MONDO) RICCHEZZA E ISTRUZIOE (EL MODO) Descrizione della base dati Il dataste considerato è tratto dal report annuale dell UESCO, relativo a 12 Stati, sui quali sono rilevate un certo numero di caratteristiche,

Dettagli

Esercitazione di riepilogo 23 Aprile 2013

Esercitazione di riepilogo 23 Aprile 2013 Esercitazione di riepilogo 23 Aprile 2013 Grafici Grafico a barre Servono principalmente per rappresentare variabili (caratteri) qualitative, quantitative e discrete. Grafico a settori circolari (torta)

Dettagli

Lineamenti di econometria 2

Lineamenti di econometria 2 Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4) Aspetti Statistici della Regressione Aspetti Statistici della Regressione

Dettagli

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri

Dettagli

Excel Terza parte. Excel 2003

Excel Terza parte. Excel 2003 Excel Terza parte Excel 2003 TABELLA PIVOT Selezioniamo tutti i dati (con le relative etichette) Dati Rapporto tabella pivot e grafico pivot Fine 2 La tabella pivot viene messa di default in una pagina

Dettagli

Statistiche campionarie

Statistiche campionarie Statistiche campionarie Sul campione si possono calcolare le statistiche campionarie (come media campionaria, mediana campionaria, varianza campionaria,.) Le statistiche campionarie sono stimatori delle

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi sulla varianza In un azienda che produce componenti meccaniche, è stato

Dettagli

Indici (Statistiche) che esprimono le caratteristiche di simmetria e

Indici (Statistiche) che esprimono le caratteristiche di simmetria e Indici di sintesi Indici (Statistiche) Gran parte della analisi statistica consiste nel condensare complessi pattern di osservazioni in un indicatore che sia capace di riassumere una specifica caratteristica

Dettagli

Inferenza statistica. Statistica medica 1

Inferenza statistica. Statistica medica 1 Inferenza statistica L inferenza statistica è un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione sulla base di alcune informazioni ricavate da un campione estratto da quella

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva Università del Piemonte Orientale Corsi di Laurea Triennale Corso di Statistica e Biometria Introduzione e Statistica descrittiva Corsi di Laurea Triennale Corso di Statistica e Biometria: Introduzione

Dettagli

STATISTICA DESCRITTIVA. Le misure di tendenza centrale

STATISTICA DESCRITTIVA. Le misure di tendenza centrale STATISTICA DESCRITTIVA Le misure di tendenza centrale 1 OBIETTIVO Individuare un indice che rappresenti significativamente un insieme di dati statistici. 2 Esempio Nella tabella seguente sono riportati

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 2.1 Statistica descrittiva (Richiami) Prima Parte Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario

Dettagli

Strumenti informatici 7.1 - Realizzare analisi statistiche su una tavola di contingenza con Excel e SPSS

Strumenti informatici 7.1 - Realizzare analisi statistiche su una tavola di contingenza con Excel e SPSS Strumenti informatici 7.1 - Realizzare analisi statistiche su una tavola di contingenza con Excel e SPSS Excel può essere utilizzato per realizzare un test del chi-quadrato per l indipendenza di variabili

Dettagli

Metodi statistici e probabilistici per l ingegneria. Corso di Laurea in Ingegneria Civile A.A. 2009-10. Facoltà di Ingegneria. Università di Padova

Metodi statistici e probabilistici per l ingegneria. Corso di Laurea in Ingegneria Civile A.A. 2009-10. Facoltà di Ingegneria. Università di Padova Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 29- Facoltà di Ingegneria Università di Padova Docente: Dott. L. Corain ESERCIZIO (TEST AD UN CAMPIONE) Un

Dettagli

Analisi di dati di frequenza

Analisi di dati di frequenza Analisi di dati di frequenza Fase di raccolta dei dati Fase di memorizzazione dei dati in un foglio elettronico 0 1 1 1 Frequenze attese uguali Si assuma che dalle risposte al questionario sullo stato

Dettagli

Elementi di Statistica descrittiva Parte I

Elementi di Statistica descrittiva Parte I Elementi di Statistica descrittiva Parte I Che cos è la statistica Metodo di studio di caratteri variabili, rilevabili su collettività. La statistica si occupa di caratteri (ossia aspetti osservabili)

Dettagli

Elementi di Statistica

Elementi di Statistica Elementi di Statistica Contenuti Contenuti di Statistica nel corso di Data Base Elementi di statistica descrittiva: media, moda, mediana, indici di dispersione Introduzione alle variabili casuali e alle

Dettagli

Il concetto di correlazione

Il concetto di correlazione SESTA UNITA Il concetto di correlazione Fino a questo momento ci siamo interessati alle varie statistiche che ci consentono di descrivere la distribuzione dei punteggi di una data variabile e di collegare

Dettagli

Capitolo 13: L offerta dell impresa e il surplus del produttore

Capitolo 13: L offerta dell impresa e il surplus del produttore Capitolo 13: L offerta dell impresa e il surplus del produttore 13.1: Introduzione L analisi dei due capitoli precedenti ha fornito tutti i concetti necessari per affrontare l argomento di questo capitolo:

Dettagli

Elementi di Psicometria

Elementi di Psicometria Elementi di Psicometria 12-Correlazione vers. 1.1 (27 novembre 2012) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2011-2012 G. Rossi (Dip. Psicologia)

Dettagli

Strumenti statistici per l analisi di dati genetici

Strumenti statistici per l analisi di dati genetici Strumenti statistici per l analisi di dati genetici Luca Tardella + Maria Brigida Ferraro 1 email: luca.tardella@uniroma1.it Lezione #1 Introduzione al software R al suo utilizzo per l implementazione

Dettagli

Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media.

Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media. FORMA DI UNA DISTRIBUZIONE Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media. Le prime informazioni sulla forma di

Dettagli

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al secondo anno, primo semestre.

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al secondo anno, primo semestre. Corso di Statistica Medica 2004-2005 Il corso si colloca nell ambito del corso integrato di scienze quantitative, al secondo anno, primo semestre. Sono previste 30 ore di lezione di statistica e 12 di

Dettagli

Istituzioni di Economia Laurea Triennale in Ingegneria Gestionale. Lezione 24 Il mercato dei beni

Istituzioni di Economia Laurea Triennale in Ingegneria Gestionale. Lezione 24 Il mercato dei beni UNIVERSITÀ DEGLI STUDI DI BERGAMO Laurea Triennale in Ingegneria Gestionale Lezione 24 Il mercato dei beni Prof. Gianmaria Martini Domanda ed offerta Uno degli schemi logici fondamentali dell analisi economica

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi : Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Analisi dei dati quantitativi : Confronto tra due medie Università del Piemonte Orientale Corso di laurea in

Dettagli

I punteggi zeta e la distribuzione normale

I punteggi zeta e la distribuzione normale QUINTA UNITA I punteggi zeta e la distribuzione normale I punteggi ottenuti attraverso una misurazione risultano di difficile interpretazione se presi in stessi. Affinché acquistino significato è necessario

Dettagli

Strumenti informatici 2.3 - Le statistiche descrittive con Excel e SPSS

Strumenti informatici 2.3 - Le statistiche descrittive con Excel e SPSS Strumenti informatici 2.3 - Le statistiche descrittive con Excel e SPSS Per ottenere le statistiche descrittive di una o più variabili in Excel occorre utilizzare le funzioni, che sono operatori matematici,

Dettagli

VARIABILI ALEATORIE MULTIPLE E TEOREMI ASSOCIATI. Dopo aver trattato delle distribuzioni di probabilità di una variabile aleatoria, che

VARIABILI ALEATORIE MULTIPLE E TEOREMI ASSOCIATI. Dopo aver trattato delle distribuzioni di probabilità di una variabile aleatoria, che VARIABILI ALATORI MULTIPL TORMI ASSOCIATI Fonti: Cicchitelli Dall Aglio Mood-Grabill. Moduli 6 9 0 del programma. VARIABILI ALATORI DOPPI Dopo aver trattato delle distribuzioni di probabilità di una variabile

Dettagli

Dai dati al modello teorico

Dai dati al modello teorico Dai dati al modello teorico Analisi descrittiva univariata in R 1 Un po di terminologia Popolazione: (insieme dei dispositivi che verranno messi in produzione) finito o infinito sul quale si desidera avere

Dettagli

1 Associazione tra variabili quantitative COVARIANZA E CORRELAZIONE

1 Associazione tra variabili quantitative COVARIANZA E CORRELAZIONE 1 Associazione tra variabili quantitative ASSOCIAZIONE FRA CARATTERI QUANTITATIVI: COVARIANZA E CORRELAZIONE 2 Associazione tra variabili quantitative Un esempio Prezzo medio per Nr. Albergo cliente (Euro)

Dettagli

Strumenti informatici 11.1. Realizzare un test per proporzioni dipendenti in Excel ed SPSS

Strumenti informatici 11.1. Realizzare un test per proporzioni dipendenti in Excel ed SPSS 1 Strumenti informatici 11.1 Realizzare un test per proporzioni dipendenti in Excel ed SPSS Excel non dispone di una funzione che consenta di realizzare il test statistico z per il confronto di proporzioni

Dettagli

ESERCIZI DI STATISTICA DESCRITTIVA

ESERCIZI DI STATISTICA DESCRITTIVA ESERCIZI DI STATISTICA DESCRITTIVA ES1 Data la seguente serie di dati su Sesso e Altezza di 8 pazienti, riempire opportunamente due tabelle per rappresentare le distribuzioni di frequenze dei due caratteri,

Dettagli

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA ESERCIZI SVOLTI PER LA PROVA DI STATISTICA Stefania Naddeo (anno accademico 4/5) INDICE PARTE PRIMA: STATISTICA DESCRITTIVA. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE. VALORI CARATTERISTICI

Dettagli

Brugnaro Luca Boscaro Gianni (2009) 1

Brugnaro Luca Boscaro Gianni (2009) 1 STATISTICA PER LE PROFESSIONI SANITARIE - LIVELLO BASE Brugnaro Luca Boscaro Gianni (2009) 1 Perché la statistica Prendere decisioni Bibliografia non soddisfacente Richieste nuove conoscenze Raccolta delle

Dettagli

1 BREVE RIPASSO DEI TEST STATISTICI 2 I TEST STATISTICI NEI SOFTWARE ECONOMETRICI E IL P-VALUE 3 ESERCIZI DI ALLENAMENTO

1 BREVE RIPASSO DEI TEST STATISTICI 2 I TEST STATISTICI NEI SOFTWARE ECONOMETRICI E IL P-VALUE 3 ESERCIZI DI ALLENAMENTO I TEST STATISTICI E IL P-VALUE Obiettivo di questo Learning Object è ripassare la teoria ma soprattutto la pratica dei test statistici, con un attenzione particolare ai test che si usano in Econometria.

Dettagli

3. Piano di lavoro: - applicazione di alcune semplici procedure, con il confronto tra le diverse soluzioni possibili nell ambito del programma SPSS

3. Piano di lavoro: - applicazione di alcune semplici procedure, con il confronto tra le diverse soluzioni possibili nell ambito del programma SPSS Per utilizzare SPSS sui PC dell aula informatica occorre accedere come: ID: SPSS Password: winidams Testo rapido di consultazione: Fideli R. Come analizzare i dati al computer. ed. Carocci, Urbino, 2002.

Dettagli

INTERPRETAZIONE DEI RISULTATI DEL QUESTIONARIO I

INTERPRETAZIONE DEI RISULTATI DEL QUESTIONARIO I CeSe.Di. - Riorientamento nel primo anno delle superiori INTERPRETAZIONE DEI RISULTATI DEL QUESTIONARIO I dati Sezione 1 - AFFERMAZIONI GENERALI (10 item): affermazioni che afferiscono alle percezioni

Dettagli

iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi

iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi iovanella@disp.uniroma2.it http://www.disp.uniroma2.it/users/iovanella Verifica di ipotesi Idea di base Supponiamo di avere un idea del valore (incognito) di una media di un campione, magari attraverso

Dettagli

ELABORATO FINALE DI STATISTICA:

ELABORATO FINALE DI STATISTICA: ELABORATO FINALE DI STATISTICA: PRIMA PARTE Analisi Descrittiva e Inferenziale di un campione di dati SECONDA PARTE Anova ad una via PRIMA PARTE Analisi Descrittiva e Inferenziale di un campione di dati

Dettagli

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al primo anno.

Il corso si colloca nell ambito del corso integrato di scienze quantitative, al primo anno. Corso di Statistica Medica Il corso si colloca nell ambito del corso integrato di scienze quantitative, al primo anno. Sono previste 40 ore complessive, di cui almeno 16 di lezione frontale e le restanti

Dettagli

Statistica descrittiva

Statistica descrittiva Corso di Laurea in Ingegneria per l Ambiente ed il Territorio Corso di Costruzioni Idrauliche A.A. 2004-05 www.dica.unict.it/users/costruzioni Statistica descrittiva Ing. Antonino Cancelliere Dipartimento

Dettagli

Statistica descrittiva univariata

Statistica descrittiva univariata Statistica descrittiva univariata Elementi di statistica 2 1 Tavola di dati Una tavola (o tabella) di dati è l insieme dei caratteri osservati nel corso di un esperimento o di un rilievo. Solitamente si

Dettagli

Indice Prefazione xiii 1 Probabilità

Indice Prefazione xiii 1 Probabilità Prefazione xiii 1 Probabilità 1 1.1 Origini del Calcolo delle Probabilità e della Statistica 1 1.2 Eventi, stato di conoscenza, probabilità 4 1.3 Calcolo Combinatorio 11 1.3.1 Disposizioni di n elementi

Dettagli

Il coefficiente di correlazione di Spearman per ranghi

Il coefficiente di correlazione di Spearman per ranghi Il coefficiente di correlazione di Spearman per ranghi Questo indice di correlazione non parametrico viene indicato con r s o Spearman rho e permette di valutare la forza del rapporto tra due variabili

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici Test non parametrici Test non parametrici Il test T di Student per uno o per due campioni, il test F di Fisher per l'analisi della varianza, la correlazione, la regressione, insieme ad altri test di statistica

Dettagli

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995).

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995). ANALISI DI UNA SERIE TEMPORALE Analisi statistica elementare Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995). Si puo' osservare una media di circa 26 C e una deviazione

Dettagli

Indice. 1 La statistica, i dati e altri concetti fondamentali ---------------------------------------------------- 3

Indice. 1 La statistica, i dati e altri concetti fondamentali ---------------------------------------------------- 3 LEZIONE ELEMENTI DI STATISTICA DESCRITTIVA PROF. CRISTIAN SIMONI Indice 1 La statistica, i dati e altri concetti fondamentali ---------------------------------------------------- 3 1.1. Popolazione --------------------------------------------------------------------------------------------

Dettagli

LA CORRELAZIONE LINEARE

LA CORRELAZIONE LINEARE LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione

Dettagli

METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica

METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica EPIDEMIOLOGIA Ha come oggetto lo studio della distribuzione delle malattie in un popolazione e dei fattori che la influenzano

Dettagli

EMBA PART TIME 2012 ROMA I ANNO

EMBA PART TIME 2012 ROMA I ANNO BUSINESS STATISTICS: ASSIGNMENT II: EMBA PART TIME 2012 ROMA I ANNO PROF. MOSCONI ESERCIZIO 1: USO DEL MODELLO DI REGRESSIONE PER DETERMINARE IL VALORE DEGLI IMMOBILI. ESERCIZIO 2: PREVISIONE DI VARIABILI

Dettagli

è decidere sulla verità o falsità

è decidere sulla verità o falsità I test di ipotesi I test di ipotesi Il test delle ipotesi consente di verificare se, e in quale misura, una determinata ipotesi (di carattere sociale, biologico, medico, economico, ecc.) è supportata dall

Dettagli

Capitolo 20: Scelta Intertemporale

Capitolo 20: Scelta Intertemporale Capitolo 20: Scelta Intertemporale 20.1: Introduzione Gli elementi di teoria economica trattati finora possono essere applicati a vari contesti. Tra questi, due rivestono particolare importanza: la scelta

Dettagli

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili

Dettagli

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008 Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica 18 dicembre 008 Esame sull intero programma: esercizi da A a D Esame sulla seconda parte del programma: esercizi

Dettagli

Approfondimento 5.2. Individuare gli outlier

Approfondimento 5.2. Individuare gli outlier Approfondimento 5.2 Individuare gli outlier Gli outlier sono quei valori che, rispetto agli altri del campione, risultano particolarmente estremi. Questo non significa che non siano punteggi validi, ma

Dettagli

RISCHIO E RENDIMENTO DEGLI STRUMENTI FINANZIARI. Docente: Prof. Massimo Mariani

RISCHIO E RENDIMENTO DEGLI STRUMENTI FINANZIARI. Docente: Prof. Massimo Mariani RISCHIO E RENDIMENTO DEGLI STRUMENTI FINANZIARI Docente: Prof. Massimo Mariani 1 SOMMARIO Il rendimento di un attività finanziaria: i parametri rilevanti Rendimento totale, periodale e medio Il market

Dettagli

STATISTICA DESCRITTIVA UNIVARIATA

STATISTICA DESCRITTIVA UNIVARIATA Capitolo zero: STATISTICA DESCRITTIVA UNIVARIATA La STATISTICA è la scienza che si occupa di fenomeni collettivi che richiedono lo studio di un grande numero di dati. Il termine STATISTICA deriva dalla

Dettagli

LE ASSUNZIONI DELL'ANOVA

LE ASSUNZIONI DELL'ANOVA LE ASSUNZIONI DELL'ANOVA Sono le assunzioni del test t, ma estese a tutti i gruppi: o La variabile deve avere una distribuzione normale in tutte le popolazioni corrispondenti ai gruppi campionati o Le

Dettagli

STATISTICA E PROBABILITá

STATISTICA E PROBABILITá STATISTICA E PROBABILITá Statistica La statistica è una branca della matematica, che descrive un qualsiasi fenomeno basandosi sulla raccolta di informazioni, sottoforma di dati. Questi ultimi risultano

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 10-Il test t per un campione e la stima intervallare (vers. 1.1, 25 ottobre 2015) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

Piacenza, 10 marzo 2014 La preparazione della tesi di Laurea Magistrale

Piacenza, 10 marzo 2014 La preparazione della tesi di Laurea Magistrale Piacenza, 0 marzo 204 La preparazione della tesi di Laurea Magistrale ma questa statistica a che cosa serve? non vedo l ora di cominciare a lavorare per la tesi. e dimenticarmi la statistica!! il mio relatore

Dettagli

CAPITOLO III CONFRONTI TRA DISTRIBUZIONI

CAPITOLO III CONFRONTI TRA DISTRIBUZIONI CAPITOLO III CONFRONTI TRA DISTRIBUZIONI 3.1 CONFRONTI TRA DISTRIBUZIONI OSSERVATE E DISTRIBUZIONI TEORICHE OD ATTESE. Nella teoria statistica e nella pratica sperimentale, è frequente la necessità di

Dettagli

Strumenti informatici Realizzare l analisi della varianza con Excel e SPSS

Strumenti informatici Realizzare l analisi della varianza con Excel e SPSS Strumenti informatici 6.4 - Realizzare l analisi della varianza con Excel e SPSS Excel non dispone di una funzione che realizzi l analisi della varianza, a meno di aver installato uno dei moduli aggiunti

Dettagli

3. Confronto tra medie di due campioni indipendenti o appaiati

3. Confronto tra medie di due campioni indipendenti o appaiati BIOSTATISTICA 3. Confronto tra medie di due campioni indipendenti o appaiati Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health m.blangiardo@imperial.ac.uk MARTA BLANGIARDO

Dettagli

3) ANALISI DEI RESIDUI

3) ANALISI DEI RESIDUI 3) ANALISI DEI RESIDUI Dopo l analisi di regressione si eseguono alcuni test sui residui per avere una ulteriore conferma della validità del modello e delle assunzioni (distribuzione normale degli errori,

Dettagli

La regressione lineare multipla

La regressione lineare multipla 13 La regressione lineare multipla Introduzione 2 13.1 Il modello di regressione multipla 2 13.2 L analisi dei residui nel modello di regressione multipla 9 13.3 Il test per la verifica della significatività

Dettagli

UNIVERSITÀ DEGLI STUDI DI MILANO-BICOCCA A. A. 2008-2009 FACOLTÀ DI ECONOMIA. Programma del modulo di STATISTICA I (6 crediti)

UNIVERSITÀ DEGLI STUDI DI MILANO-BICOCCA A. A. 2008-2009 FACOLTÀ DI ECONOMIA. Programma del modulo di STATISTICA I (6 crediti) UNIVERSITÀ DEGLI STUDI DI MILANO-BICOCCA A. A. 2008-2009 FACOLTÀ DI ECONOMIA Programma del modulo di STATISTICA I (6 crediti) ECOCOM (lettere A-Lh): ECOCOM (lettere Li-Z): ECOBAN: ECOAMM (Lettere A-Lh):

Dettagli

Il risultato di un analisi chimica è un informazione costituita da: un numero un incertezza un unità di misura

Il risultato di un analisi chimica è un informazione costituita da: un numero un incertezza un unità di misura Il risultato di un analisi chimica è un informazione costituita da: un numero un incertezza un unità di misura Conversione del risultato in informazione utile È necessario fare alcune considerazioni sul

Dettagli

Strumenti Informatici 8.1. Realizzare il test della binomiale (o test dei segni) con Excel e SPSS

Strumenti Informatici 8.1. Realizzare il test della binomiale (o test dei segni) con Excel e SPSS 1 Strumenti Informatici 8.1 Realizzare il test della binomiale (o test dei segni) con Excel e SPSS Il test della binomiale (o test dei segni) può essere eseguito con Excel impostando le formule adeguate

Dettagli

CLASSIFICAZIONE DEI CARATTERI

CLASSIFICAZIONE DEI CARATTERI CLASSIFICAZIONE DEI CARATTERI Come abbiamo visto, su ogni unità statistica si rilevano una o più informazioni di interesse (caratteri). Il modo in cui un carattere si manifesta in un unità statistica è

Dettagli

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a) Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B Eventi indipendenti: un evento non influenza l altro Eventi disgiunti: il verificarsi di un evento esclude l altro Evento prodotto:

Dettagli

VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD. Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza.

VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD. Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza. VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD Si definisce varianza campionaria l indice s 2 = 1 (x i x) 2 = 1 ( xi 2 n x 2) Si definisce scarto quadratico medio o deviazione standard la radice quadrata della

Dettagli

LA STATISTICA E IL CALCOLO DELLE PROBABILITÀ

LA STATISTICA E IL CALCOLO DELLE PROBABILITÀ LA STATISTICA E IL CALCOLO DELLE PROBABILITÀ Prof. Francesco Tottoli Versione 3 del 20 febbraio 2012 DEFINIZIONE È una scienza giovane e rappresenta uno strumento essenziale per la scoperta di leggi e

Dettagli

Correzione dell Esame di Statistica Descrittiva (Mod. B) 1 Appello - 28 Marzo 2007 Facoltà di Astronomia

Correzione dell Esame di Statistica Descrittiva (Mod. B) 1 Appello - 28 Marzo 2007 Facoltà di Astronomia Correzione dell Esame di Statistica Descrittiva (Mod. B) 1 Appello - 8 Marzo 007 Facoltà di Astronomia ESERCIZIO 1 La seguente tabella riporta la distribuzione congiunta della situazione lavorativa e dello

Dettagli

Scheda n.5: variabili aleatorie e valori medi

Scheda n.5: variabili aleatorie e valori medi Scheda n.5: variabili aleatorie e valori medi October 26, 2008 1 Variabili aleatorie Per la definizione rigorosa di variabile aleatoria rimandiamo ai testi di probabilità; essa è non del tutto immediata

Dettagli

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL 1 RAPPRESENTAZIONE GRAFICA Per l analisi dati con Excel si fa riferimento alla versione 2007 di Office, le versioni successive non differiscono

Dettagli

Statistica descrittiva

Statistica descrittiva Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di indicatori sintetici che individuano, con un singolo valore, proprieta` statistiche di un campione/popolazione rispetto

Dettagli

Rischio e rendimento degli strumenti finanziari

Rischio e rendimento degli strumenti finanziari Finanza Aziendale Analisi e valutazioni per le decisioni aziendali Rischio e rendimento degli strumenti finanziari Capitolo 15 Indice degli argomenti 1. Analisi dei rendimenti delle principali attività

Dettagli

Soluzioni Esercizi elementari

Soluzioni Esercizi elementari Soluzioni sercizi elementari Capitolo. carattere: itolo di Studio, carattere qualitativo ordinato modalità: Diploma, Licenza media, Laurea, Licenza elementare unità statistiche: Individui. carattere: Fatturato,

Dettagli

Analisi Statistica per le Imprese (6 CFU) - a.a. 2010-2011 Prof. L. Neri RICHIAMI DI STATISTICA DESCRITTIVA UNIVARIATA

Analisi Statistica per le Imprese (6 CFU) - a.a. 2010-2011 Prof. L. Neri RICHIAMI DI STATISTICA DESCRITTIVA UNIVARIATA Analisi Statistica per le Imprese (6 CFU) - a.a. 2010-2011 Prof. L. Neri RICHIAMI DI STATISTICA DESCRITTIVA UNIVARIATA 1 Distribuzione di frequenza Punto vendita e numero di addetti PUNTO VENDITA 1 2 3

Dettagli

8 Elementi di Statistica

8 Elementi di Statistica 8 Elementi di Statistica La conoscenza di alcuni elementi di statistica e di analisi degli errori è importante quando si vogliano realizzare delle osservazioni sperimentali significative, ed anche per

Dettagli