MODELLI STATISTICI PER LA PREVISIONE DEL RISCHIO DI INSOLVENZA (O VALUTAZIONE DEL MERITO DI CREDITO)

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "MODELLI STATISTICI PER LA PREVISIONE DEL RISCHIO DI INSOLVENZA (O VALUTAZIONE DEL MERITO DI CREDITO)"

Transcript

1 MODELLI STATISTICI PER LA PREVISIONE DEL RISCHIO DI INSOLVENZA (O VALUTAZIONE DEL MERITO DI CREDITO) I vari operatori del credito ricevono richieste di finanziamento da potenziali clienti (individui o imprese) ed hanno la necessità di prendere una decisione circa la concessione o il rifiuto del credito. Obiettivo: l istituto di credito ha l esigenza di costruire una regola di classificazione che suddivida il collettivo dei richiedenti il credito in due classi - soggetti che potenzialmente rimborseranno il prestito ( sani ) e soggetti potenzialmente insolventi (insolvenza: incapacità di fronteggiare gli impegni assunti). L impiego di strumenti statistici a supporto del processo decisionale di concessione del credito si sostanzia nell attribuzione di un punteggio (score) ai soggetti che richiedono il credito punteggio che rappresenta le probabilità di rimborso. Sulla base di tale punteggio il soggetto sarà assegnato al gruppo dei potenzialmente sani o al gruppo dei potenzialmente insolventi La valutazione del rischio di insolvenza viene effettuata sulla base di informazioni individuali (le variabili predittive), osservate sia con riferimento ai soggetti sani sia a quelli insolventi, che riguardano caratteristiche socio-demografiche ed economiche con riferimento agli individui o caratteristiche legate allo stato di salute dell azienda (ad es. indici di bilancio). Unità 12 - Corso di Statistica aziendale (prof. M.R. Ferrante) Laurea Specialistica in Economia e Gestione Aziendale - Facoltà di Economia, Polo di Forlì, Università di Bologna

2 Vantaggi dell impiego di una procedura statistica: semplificazione ed automatizzazione oggettività ed omogeneità (o soggettività condivisa) riduzione del rischio di inadempienza e quindi dei contenziosi Concentriamoci sulla previsione del rischio di insolvenza aziendale. Tipologie di insolvenza: finanziaria problemi di liquidità, squilibri fra debiti a breve e a lungo termine, fra mezzi propri e mezzi di terzi. giuridica: il fallimento è la constatazione giuridica dell insolvenza finanziaria e rappresenta lo strumento col quale il legislatore dichiara la crisi aziendale e garantisce i diritti dei terzi. Cause principali interne ed esterne della crisi aziendale: squilibri ed inefficienze strutturali incapacità del management ciclo economico La valutazione della condizione economica, finanziaria e patrimoniale dell impresa può essere importante al fine di diagnosticare precocemente lo stato di crisi 2

3 I vari aspetti che definiscono lo stato di salute dell impresa possono essere valutati attraverso gli indici di bilancio (redditività, liquidità, solvibilità, leverage, dimensione, ecc.) L analisi basata sugli indici di bilancio costituisce l elemento fondamentale dell approccio più recente alla modellazione del rischio di insolvenza. Il contributo dell analisi statistica in questo senso può avere: 1) scopi descrittivi ed esplicativi di come si manifesta e si sviluppa una crisi aziendale; si tenta di risalire alle variabili che maggiormente sono responsabili dell insolvenza e quindi di identificare gli indici di bilancio che meglio possono diagnosticare precocemente stati di crisi 2) scopi predittivi: costruzione di una regola che consenta di assegnare unità nuove ad uno dei gruppi Perchè non si analizzano gli indici singolarmente? Gli indici sono espressione dei vari aspetti dello stato di salute di un azienda, aspetti che sono, ovviamente, interconnessi. Lo studio separato dei vari indici può condurre a difficoltà interpretative laddove indici diversi conducano a conclusioni diverse sullo stato di salute dell azienda. Perchè non si ricorre per costruire un indice sintetico - una media ponderata dei vari indici? Determinazione soggettiva dei pesi Mancata considerazione della correlazione tra indici 3

4 Mediante le tecniche di analisi statistica multivariata è possibile valutare la situazione economicofinanziaria complessiva dell impresa (vari indici) e di sintetizzare tale valutazione in modo da rendere possibile il confronto tra soggetti diversi Allo scopo di diagnosticare precocemente il rischio di insolvenza aziendale o di valutare, in generale, il merito di credito si possono usare le tecniche statistiche di tipo classificatorio. Tra le più frequentemente impiegate: l Analisi Discriminante (Centrale dei bilanci) gli Alberi di Classificazione Per costruire una regola classificatoria, occorre dunque: 1) stabilire la definizione dello stato di crisi, in riferimento: a) allo stato di crisi terminale (fallimento) b) ad uno degli stati di disequilibrio economico, finanziario o patrimoniale che precede il fallimento vero e proprio 2) disporre di dati retrospettivi, relativi ad indici di bilancio, per un gruppo di imprese sane e un gruppo di imprese in stato di crisi (o fallite al tempo corrente) 4

5 GLI ALBERI DI CLASSIFICAZIONE Considerato un campione di n unità statistiche su cui sono state osservate: La variabile dipendente Y (la base) che identifica a priori le classi Le variabili esplicative X=(X 1,X 2,, X s,,x p ) o predittori, impiegate per descrivere le caratteristiche delle classi identificate dalla base Le tecniche di partizione ricorsiva permettono di individuare l appartenenza di ogni unità statistica alle classi definite da Y, mediante suddivisione progressiva del collettivo in gruppi via via più omogenei al loro interno rispetto alla variabile dipendente Y, suddivisione effettuata sulla base di ciascuna X j Ttecniche di partizione ricorsiva (anche denominate di "Segmentazione gerarchica"): AID, CHAID, CART Segmentazione gerarchica (SG): Al primo passo del procedimento l insieme di n unità è suddiviso in due o più sottoinsiemi, definiti dalle modalità di una fra le variabili esplicative X. I passi successivi si realizzano suddividendo ulteriormente i sottoinsiemi ottenuti al passo precedente. 5

6 Ogni gruppo formato ad uno stadio del processo può essere cioè ulteriormente suddiviso negli stadi seguenti, fino a quando tale processo viene portato a termine con riferimento ad una prefissata regola di arresto (Criterio scissorio o top down) La segmentazione migliore, a questo e ad ogni passo successivo: viene individuata sulla base di una regola di ottimalità, che si realizza massimizzando l omogeneità entro/massimizzando l eterogeneità tra i sottoinsiemi, valutate secondo la variabile criterio (base). viene ricercata valutando tutte le segmentazioni possibili per ciascuna variabile esplicativa, e scegliendo la variabile che dà origine alla segmentazione migliore Schema che richiede notevoli potenzialità di calcolo : molti degli algoritmi di SG proposti di recente non erano realizzabili prima dello sviluppo dei calcolatori. 6

7 Un esempio di impiego degli alberi (credit scoring) (Zani, 2000) Informazioni relative a 323 clienti di un istituto di credito americano1, classificati in base alla loro affidabilità nel pagamento delle quote di un prestito elargito (variabile credit ranking, CR): la modalità affidabile è stata attribuita a coloro che hanno rispettato tutte le scadenze del prestito nella categoria non affidabile sono stati inseriti i clienti che non hanno rispettato le scadenze e sono quindi caduti in mora PAGA CREDIT RANKING Affidabile Non affidabile Totale <= sett. ETA > <= mens ETA > Totale Variabili esplicative: periodicità (mensile o settimanale) con la quale viene percepita la retribuzione (PAGA) età del cliente (ETA ). 1 I dati sono tratti dal file credit.sav collocato nella directory di lavoro del modulo AnswerTree del package SPSS. 7

8 I risultati delle tecniche di segmentazione vengono visualizzati attraverso strutture grafiche gerarchiche dette alberi : 8

9 L albero è costituito da un insieme finito di elementi, i nodi. Ogni nodo è un gruppo di unità, si riferisce a diversi stadi del processo di classificazione. Il rettangolo superiore rappresenta la radice (R) in cui è riportata la distribuzione delle freq. relative secondo la variabile CR (affidabile e non affidabile). Il nodo radice è un nodo disomogeneo al suo interno rispetto alla variabile obiettivo CREDIT RANKING perché racchiude tutti gli individui considerati, non classificati attraverso le variabili esplicative. I valori di soglia di una variabile che dividono le unità di un determinato nodo sono chiamati split (o suddivisioni). -- I rami sono le condizioni che hanno determinato la suddivisione. L insieme di tutti i nodi terminali di un albero viene indicato con il simbolo T ~. Le foglie sono i nodi terminali per i quali non si ritiene utile una ulteriore suddivisione. Nell esempio in esame i due sottoalberi sottostanti la radice sono formati distinguendo le due modalità del la variabile PAGA (mensile e settimanale): a sx clienti che percepiscono una retribuzione con cadenza settimanale a dx clienti che vengono retribuiti mensilmente; 9

10 Nell esperienza statunitense (alla quale si riferisce l esempio) una retribuzione settimanale è sintomo di un lavoro instabile, che può ripercuotersi negativamente sulla regolarità dei pagamenti alla banca nel nodo di sx compare una % elevata di clienti non affidabili nel nodo di dx la maggioranza dei clienti risulta affidabile Il valore % nella riga dei totali (riportato fra parentesi) fornisce il peso di un nodo nel livello in cui si trova Nelle foglie, punto di arrivo della rappresentazione: ulteriore classificazione delle unità in base alla variabile ETA utilizzando come split il valore 35 a sinistra ed il valore 25 a destra. La distinzione fra clienti affidabili e non affidabili ottenuta a livello finale è più netta rispetto alla classificazione di primo livello. In sintesi: Fra tutti i clienti che percepiscono una retribuzione settimanale, coloro con età superiore ai 35 anni sono, nella sostanza, affidabili, mentre il 90.51% dei clienti con età inferiore o pari a 35 anni è inaffidabile. 10

11 L ulteriore ripartizione dei clienti con retribuzione mensile individua i clienti con età superiore ai 25 anni che sono quasi totalmente affidabili (99,08%) Per età inferiore ai 25 anni, sempre per i clienti con paga mensile, si verifica una situazione incerta che potrebbe fare pensare alla necessità di una ulteriore variabile esplicativa per ottenere una distinzione più netta (51% vs 49%) Importante: tali considerazioni hanno conseguenze rilevanti in ambito previsivo la regola individuata può essere impiegata per classificare (nei gruppi definiti dalla var. obiettivo) nuove unità statistiche di cui si ignora la categoria di appartenenza (sulla base dei predittori). In base all esperienza, in futuro l istituto di credito sarà: disposto nella concessione di un credito ad un potenziale cliente con retribuzione mensile e con età superiore ai 25 anni più restio verso clienti giovani con retribuzione settimanale, a cui potrebbe chedere maggiori garanzie o non concedere il credito. 11

12 Ambiti economico-aziendali di impiego degli alberi credit scoring per valutare il rischio potenziale di una linea di credito; profiling per costruire i profili dei consumatori, degli utenti, dei clienti; direct marketing e comunicazione per scoprire quali gruppi risponderanno favorevolmente a determinate iniziative promozionali; previsione dello stato di crisi di un azienda qualità per scoprire le cause di difettosità di prodotti e servizi; database marketing per utilizzare appieno le informazioni sulla clientela effettiva e potenziale; Punto in comune con la cluster analysis gerarchica: nello stadio finale entrambe le procedure producono una partizione dell'insieme delle unità statistiche ( similarità con il dendrogramma ) Tuttavia, le differenze sono sostanziali: la SG richiede la conoscenza a priori della classe di appartenenza delle unità; scopo della cluster analysis è invece quello di costruire gruppi di unità statistiche partendo da un insieme indistinto 12

13 la SG viene operata utilizzando una sola variabile (selezionata fra tutte la variabili a disposizione) alla volta (si individua così una gerarchia di variabili), mentre la formazione dei gruppi nella cluster analysis viene fatta usando contemporaneamente tutte le variabili a disposizione la regola di classificazione individuata attraverso gli algoritmi di segmentazione viene usata per prevedere la collocazione di unità statistiche di cui non si conosce la classe di appartenenza Le tecniche di SG sono applicabili qualunque sia la natura della variabile dipendente: - qualitativa alberi di classificazione - quantitativa alberi di regressione (di cui non ci occuperemo) Le variabili esplicative possono essere su qualsiasi scala (se CART) In base al numero di sottoinsiemi che si possono formare ad ogni passo della procedura: Partizioni a due vie: segmentazione binaria Partizioni a un numero >2 vie: segmentazione multipla, o a K vie Negli ultimi tempi sono state proposti molti algoritmi di segmentazione, che si caratterizzano soprattutto per il diverso problema che affrontano, per la scelta dei criteri di analisi, per il modo in cui viene fatta la ricerca della migliore segmentazione (accenneremo a CART) 13

14 Obiettivi di un albero di classificazione 1) Individuazione delle determinanti della variabile dipendente L analisi individua le variabili esplicative che meglio spiegano la variabile dipendente. La segmentazione permette, cioè, di individuare le variabili esplicative rilevanti all interno di sottoinsiemi di unità via via più chiaramente definiti. 2) "Eliminazione" dell'informazione ridondante In subordine, l analisi di segmentazione è in grado di eliminare anche le variabili che ripetono l informazione contenuta in altre e le variabili che non sono rilevanti per spiegare la Y 3) Ricerca di interazioni fra variabili predittive. L interazione è l effetto che una combinazione di modalità ha sulla variabile dipendente e si può scoprire solo analizzando le distribuzioni condizionate (gerarchia delle variabili) 4) Produzione di regole di previsione o di classificazione. Sulla base del campione osservato si crea una regola di previsione del valore della var. dipendente di un nuovo soggetto per il quale si siano osservate le variabili esplicative. 5) Ricerca di relazioni non lineari o non monotone. Poiché alla base degli alberi di classificazione non c'è un modello che lega la var. dipendente alle esplicative, tale relazione può essere di forma qualsiasi. 14

15 LE FASI DI UNA PROCEDURA DI SEGMENTAZIONE 1. Scelta del tipo di segmentazione: binaria o multipla? 2. Dicotomizzazione delle variabili esplicative (suddivisione dello spazio delle variabili esplicative) 3. Scelta del criterio di suddivisione di ogni nodo t nei nodi figli equivale a scegliere una funzione criterio (misura della diversità tra gruppi) 4. Definizione di un criterio d arresto 5. Interpretazione dei risultati 6. Stima del costo di errata classificazione 7. Individuazione di una regola per l assegnazione di una delle J modalità della variabile dipendente ad ogni foglia e costruzione della regola d(x) per la classificazione dei nuovi casi 15

16 1. SEGMENTAZIONE BINARIA O MULTIPLA? La suddivisione multipla consente di suddividere un nodo in s sottoinsiemi, in un unico passo Può rivelarsi più efficiente nella costruzione dell albero poiché potenzialmente consente: un migliore adattamento alle relazioni fra variabili rispetto a quelle binarie (ad es. offre la possibilità di evidenziare relazioni non monotòne, fra la variabile dipendente e i predittori) di costruire alberi meno profondi e più sintetici, quindi più facilmente leggibili ed interpretabili. Tuttavia: Il problema principale della segmentazione multipla è costituito dai tempi di calcolo (il numero delle segmentazioni da esaminare aumenta molto velocemente) Inoltre, si dimostra che una segmentazione a tre modalità corrisponde a due segm. binarie. 2. SUDDIVISIONE DELLO SPAZIO DELLE VARIABILI ESPLICATIVE I criteri di partizione hanno come obiettivo quello di individuare la migliore suddivisione dello spazio X delle variabili esplicative ai fini della previsione della classe j della variabile dipendente è necessario identificare tutte le possibili partizioni fra cui scegliere quella ottimale. 16

17 Le possibili suddivisioni dipendono dalla natura qualitativa o quantitativa dei predittori. Ad es. per suddivisioni binarie: var. quantitativa: la divisione binaria delle unità statistiche avviene individuando un valore che rappresenta la soglia di ripartizione con riferimento a tale soglia si considerano due sottoinsiemi, da un lato quello comprendente tutti i valori inferiori o uguali al valore considerato e dall altro tutti i valori superiori a quello considerato In generale, se nel campione la variabile X s assume n valori distinti, i possibili split connessi a quella variabile saranno pari a n - 1. var. ordinale con m modalità: il numero di suddivisioni possibili sarà pari a m 1. Se, ad esempio, distinguiamo i giudizi riportati da n individui in una prova d esame secondo le modalità insufficiente, sufficiente, buono e ottimo, il numero di possibili split sarà pari a 3: (insufficiente), (sufficiente, buono, ottimo) (insufficiente, sufficiente), (buono, ottimo) (insufficiente, sufficiente, buono), (ottimo). var. nominale con m modalità: m 1 Poiché le modalità sono sconnesse, il numero delle possibili suddivisioni è pari a

18 Ad es., considerando la variabile forma giuridica di n aziende con modalità azienda individuale, società di persone, società di capitale, altro, il numero di possibili partizioni con due classi sarà pari a =7, cioè: (az. individuale, soc. di persone), (soc. di capitale, altro) (az. individuale, soc. di capitale), (soc. di persone, altro) (soc. di persone, soc. di capitale), (az. individuale, altro) (az. individuale, soc. di persone, soc. di capitale), (altro) (az. individuale, soc. di persone, altro), (soc. di capitale) (az. individuale, soc. di capitale, altro), (soc. di persone) (soc. di persone, soc. di capitale, altro), (az. individuale). Si noti che, per un numero elevato di variabili, il numero di possibili partizioni da considerare è molto ampio. 3. FUNZIONE CRITERIO PER LA SEGMENTAZIONE Si considerino n unità statistiche su cui sono state osservate p variabili che denoteremo come esplicative, X = (X 1, X 2, X 3,,X p ), ed una variabile Y, dipendente Obiettivo: ottenere nodi figli più puri dei nodi genitori, rispetto alla Y 18

19 Si ha riduzione dell impurità (disomogeneità) di un nodo se lo stesso viene suddiviso in sottoinsiemi che sono più omogenei al loro interno rispetto al gruppo di partenza. Valutazione della bontà della modalità di segmentazione s di un gruppo genitore, o nodo genitore, t si definisce una misura di IMPURITA Φ(s,t), detta funzione criterio della segmentazione, che misura la omogeneità (rispetto alla Y) all interno di ognuno dei gruppi figli generati dalla suddivisione s del gruppo genitore t. La massimizzazione della riduzione di Φ(s,t), Φ(s,t), sull insieme di tutte le segmentazioni considerate, porta a individuare la suddivisione che genera sottoinsiemi massimamente diversi fra loro, e quindi massimamente omogenei al loro interno. Varie sono le possibili definizioni di Φ(s,t). Un esempio ne è la devianza ENTRO. Data la Dev entro (Y) calcolata in t, tra le possibili suddivisioni di t si sceglie quella che determina la più piccola Dev entro (Y) associata alla suddivisione (equivale a massimizzare la Dev tra (Y) associata alla suddivisione)): Dev entro, t (Y) = Dev entro,s (Y) + Dev tra (Y) Φ(s,t) = Dev entro, t (Y) - Dev entro,s (Y) = Dev tra (Y) =max Ovviamente tale misura è adatta solo se Y è una var. quantitativa. 19

20 4. CRITERI PER L ARRESTO DEL PROCESSO DI SEGMENTAZIONE Se non si definisce una regola di stop, la segmentazione si blocca quando i nodi terminali contengono solo casi appartenenti alla stessa classe della variabile dipendente (eccessiva complessità nell interpretazione dell albero) Fra due regole di arresto si sceglie, ceteris paribus: quella che determina l albero di taglia minore, e quindi più facilmente leggibile quella che permette di distinguere nel modo più efficace possibile unità statistiche appartenenti a classi diverse. le due proprietà sono fra loro difficilmente conciliabili. A fronte di un numero elevato di variabili: l albero risulta, ovviamente, più complesso e quindi meno interpretabile può presentare nodi terminali costruiti sulla base di poche informazioni e ciò rende il risultato poco affidabile Nessuna regola di arresto riesce a garantire la giusta dimensione dell albero per il semplice motivo che non esiste una giusta dimensione 20

21 Tuttavia se le regole di arresto sono allentate, l albero risulta troppo ramificato, se, invece, sono restrittive si preclude la possibilità di individuare segmentazioni, magari rilevanti dal punto di vista esplicativo, che si sarebbero potute verificare ad un passo successivo. Nessun criterio è in grado di fornire da solo la migliore partizione conviene impiegare questi metodi congiuntamente, per cercare di ottenere una soluzione stabile e interpretabile. 1. DIMENSIONE MINIMA DEI GRUPPI per prevenire la formazione di gruppi di numerosità ridotta si impone una soglia sotto la quale la numerosità dei gruppi può non essere sufficiente per garantire l attendibilità delle stime 2. MINIMO DELLA CAPACITA ESPLICATIVA DELLA MIGLIORE SUDDIVISIONE AD OGNI PASSO Tale criterio richiede che la suddivisione contribuisca in modo significativo a spiegare la disomogeneità entro i gruppi riferita alla var. Y -- in caso contrario la procedura si arresta (equivale ad esempio a decremento significativo di impurità ) Ovviamente bisogna tenere conto del fatto che il contributo è direttamente proporzionale al numero di categorie e inversamente proporzionale alla numerosità campionaria 21

22 3. MINIMA DISOMOGENEITA DEL GRUPPO GENITORE muove dal presupposto che un gruppo genitore la cui misura di disomogeneità è inferiore a un certo valore si considera sufficientemente compatto, o puro, e non più divisibile 4. MASSIMO NUMERO DI PASSI DEL PROCESSO equivale a determinare il massimo numero di gruppi finali 5. PRUNING In alternativa alle regole di arresto della segmentazione, Breiman et al. (1984) propongono la procedura di sfoltimento o potatura (in inglese: pruning) di un albero: espansione dell albero fino alla sua dimensione massima, T max, e, con una procedura stepwise a ritroso, nell eliminazione dei rami meno utili: estrazione del sottoalbero ottimale da quello massimo (l argomento sarà approfondito nel seguito) 22

23 5. INTERPRETAZIONE DEI RISULTATI Output dell analisi di segmentazione è un diagramma ad albero su cui è buona norma riportare: - per ogni nodo, corrispondente ad un gruppo formato: il numero di unità e la distribuzione della variabile dipendente - per ogni ramo: le modalità e i predittori che determinano la suddivisione, e il guadagno portato dalla stessa Dall albero si possono, dunque, dedurre: o la numerosità dei nodi o le categorie del predittore in base al quale è stata effettuata la suddivisione o alcuni valori caratteristici della distribuzione di Y nel nodo genitore e nei nodi figli o il valore della funzione adottata per la segmentazione Inoltre si possono ottenere statistiche sintetiche sia dei gruppi creati che di quelli esaminati per scegliere la suddivisione migliore 23

24 Per verificare la Stabilità della soluzione ottenuta è possibile: 1. alterare casualmente un certo numero di dati, ripetere l analisi e verificare se e in quale misura il nuovo albero di segmentazione differisce da quello ottenuto nella prima fase 2. suddividere il campione osservato in due o più parti casualmente determinate e confrontare le configurazioni risultanti dall analisi con le stesse opzioni ( se n elevato ). Denominazione dei gruppi formati: in base alle categorie dei predittori che li hanno determinati. E necessario, tuttavia, tener conto del fatto che l ordine di selezione dei predittori non riflette necessariamente la loro importanza nella spiegazione della variabile dipendente Un predittore che non compare nell albero finale può, infatti: a) essere ininfluente nella spiegazione della variabile dipendente, b) potrebbe essere stato respinto dalla selezione di una variabile predittiva ad esso correlata (per ranghi), magari risultata migliore solo di poco al momento della segmentazione. Due predittori fortemente correlati, difficilmente saranno selezionati entrambi nella costruzione dell albero: la scelta dell uno o dell altro determinerà un albero completamente diverso. 24

25 6. IL COSTO DI ERRATA CLASSIFICAZIONE Data una certa regola d(x) di classificazione, costruita sulla base di del campione S di apprendimento (e definita su x), la misura utilizzata per valutare la capacità predittiva dell albero è il costo di errata classificazione La probabilità di classificare erroneamente un caso di classe i nella classe j mediante d è data da: Q( j i) = P d( X ) = j Y = i il costo atteso di errata classificazione dei casi di classe i sarà R (i) = C( j i) Q( j i) j in cui C( j i ) è il costo che si sostiene classificando erroneamente un caso di classe i nelle classe j 25

26 il costo di errata classificazione connesso al generico albero (e quindi al classificatore d ) sarà: R(T) = R( i) π ( i) con π ( i) prob. a priori che un caso venga classificato nella classe i R(T) varierà al variare della complessità dell albero: i a parità di semplicità della rappresentazione ad albero (in termini di numero di foglie) verrà selezionata la regola che consente di allocare correttamente la percentuale più elevata di unità statistiche Si consideri Ω un insieme artificiale (di dimensione non necessariamente finita) di unità statistiche avente le stesse caratteristiche di S il tasso di errata classificazione dovrebbe essere calcolato confrontando la reale classificazione delle osservazioni in Ω con quella prevista da d. Tale procedura non può essere applicata concretamente per cui si deve ricorrere ad una stima di R(T) che chiameremo Rˆ (T) e vi sono vari modi per ottenere tale stima 26

27 a. Stima di risostituzione R ˆr (T) Questa stima viene definita stima interna, cioè basata sulle n unità statistiche usate per costruire l albero Stimiamo Q( j i ) sulla base della frequenza delle osservazioni classificate erroneamente e quindi: Qˆ j i n n ( ) = r j i i in cui n j i è il numero di osservazioni di S appartenenti alla classe i e classificati in j ed n i è il numero di osservazioni di S appartenenti alla classe i La stima del costo atteso di errata classificazione dei casi di classe i sarà Rˆ i = C j i Qˆ j i r ( ) ( ) ( ) E la stima del costo di errata classificazione connesso al generico albero: j R ˆr (T) = i r ˆ R ( i ) π ( i ) r 27

28 Fornisce stime ottimistiche del costo di errata classificazione (lo sottostima) e l impiego di questo criterio per la selezione dell albero porta a scegliere sempre l albero T max Esempio ( i=classe effettiva, j=classe prevista): j=a j=b j=c tot i=a i=b i=c tot ˆ ( ) 10 /100 Q( c a ) = Q b a = ˆ 25 /100. Considerando costi di errata classificazione C( j i ) costanti, il costo atteso di errata classificazione dei casi di classe a sarà: Rˆ ( a ) = 10/ /100 = 35/100 =

29 analogamente: ˆ ( ) 5/87 2/ ( ) R b = + = Rˆ c = 4/32 + 8/32 = e la stima del costo di errata classificazione connesso al generico albero, per : π ( i) costanti: R ˆr (T) = 35/ / /32 = per π (1) = 100/ 219, π (2) = 87 / 219 e π (3) = 32/ Rˆ r ( T ) = + + = b. Stima mediante un campione test ( test sample ) Il campione S viene partizionato in maniera casuale in due sottocampioni S 1 e S 2 di numerosità, rispettivamente, n 1 e n 2, tali che S 1 S 2 = S e S 1 S 2 = (dove indica l insieme vuoto). 29

30 S 1 viene definito campione di apprendimento (learning sample) S 2 viene denominato campione test (testing sample) I due campioni possono considerarsi indipendenti. La regola d viene costruita utilizzando il campione d apprendimento e poi viene testata stimando R(T) sul campione test, per cui la stima del campione test, Rˆ (T), è data da: Stima della prob. di errata classificazione: ( ) 2 2 ts Qˆ j i = n n ts j i i in cui 2 n j i ed 2 n i assumono lo stesso significato precedente ma sono valutate sul campione test Stima del costo atteso di errata classificazione dei casi di classe i sarà Rˆ i = C j i Qˆ j i ts ( ) ( ) ( ) j ts ˆ = ˆ Stima del costo di errata classificazione connesso al generico albero: R ( T ) R ( i) π ( i) ts i ts 30

31 Le stime del tasso di errata classificazione così ottenute sono più affidabili rispetto alle R ˆ r ( T ), visto che usano dati esterni rispetto a quelli impiegati per la costruzione della regola di classificazione. Tuttavia: riduzione della numerosità del campione su cui viene costruito il classificatore d, per cui è auspicabile la sua applicazione solo se il campione S è di numerosità elevata. Generalmente la numerosità di S 2 è pari ad 1/3 della numerosità complessiva del campione. c. Stima mediante cross-validation (V-fold cross-validation) Metodo preferibile alla stima basata sul campione test, qualora la numerosità di S sia bassa. Innanzitutto, si costruisce l albero sulla base degli n elementi di S e quindi la stima del costo atteso di errata classificazione dell albero precedentemente costruito avviene nel seguente modo: il campione iniziale S viene ripartito casualmente in V > 2 sottocampioni S 1, S2,..., S v,..., SV di dimensione il più possibile prossima fra loro ( v) la regola di classificazione d ( x) viene costruita sul campione di apprendimento S - S (v), v = 1,2,,V.; lasciando ogni volta fuori un solo sottoinsieme S (v) da usare per il test di validità. 31

32 Se V è sufficientemente elevato, ogni regola 1/V), che è prossima alla dimensione di S. d (v) (x) viene costruita su un campione di dimensione n(1- Poiché, v, nessun elemento di S v è compreso in S - S v, è possibile stimare il costo di errata classificazione sulla base del campione test: Rˆ T = Rˆ i i v = 1,2,,V. ( v ) ( ) ts i ( v ) ( ) π ( ) ts Ogni classificatore d a R(T) (v) (x), v = 1,2,,V avrà un costo di errata classificazione ˆ v ts R ( ) ( ) T molto prossimo la stima del costo di errata classificazione dell albero T la ottengo facendo la media di tutti i tassi precedentemente ottenuti: 1 V ˆ ˆ ( v) R ( T ) = R ( T ) cv V v= 1 ts 32

MODELLI STATISTICI PER LA PREVISIONE DEL RISCHIO DI INSOLVENZA (O VALUTAZIONE DEL MERITO DI CREDITO)

MODELLI STATISTICI PER LA PREVISIONE DEL RISCHIO DI INSOLVENZA (O VALUTAZIONE DEL MERITO DI CREDITO) MODELLI STATISTICI PER LA PREVISIONE DEL RISCHIO DI INSOLVENZA (O VALUTAZIONE DEL MERITO DI CREDITO) I vari operatori del credito ricevono richieste di finanziamento da potenziali clienti (individui o

Dettagli

DATA MINING PER IL MARKETING

DATA MINING PER IL MARKETING DATA MINING PER IL MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso GLI ALBERI DI CLASSIFICAZIONE Algoritmi di classificazione Zani-Cerioli, Cap. XI CHAID: Chi-square Automatic Interaction

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it LA CLASSIFICAZIONE CAP IX, pp.367-457 Problema generale della scienza (Linneo, ) Analisi discriminante Cluster Analysis

Dettagli

Dott.ssa Caterina Gurrieri

Dott.ssa Caterina Gurrieri Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo

Dettagli

Analisi discriminante

Analisi discriminante Capitolo 6 Analisi discriminante L analisi statistica multivariata comprende un corpo di metodologie statistiche che permettono di analizzare simultaneamente misurazioni riguardanti diverse caratteristiche

Dettagli

Tecniche di DM: Alberi di decisione ed algoritmi di classificazione

Tecniche di DM: Alberi di decisione ed algoritmi di classificazione Tecniche di DM: Alberi di decisione ed algoritmi di classificazione Vincenzo Antonio Manganaro vincenzomang@virgilio.it, www.statistica.too.it Indice 1 Concetti preliminari: struttura del dataset negli

Dettagli

STUDIO DI SETTORE SG42U

STUDIO DI SETTORE SG42U ALLEGATO 2 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE SG42U NOTA TECNICA E METODOLOGICA CRITERI PER LA COSTRUZIONE DELLO STUDIO DI SETTORE Di seguito vengono esposti i criteri seguiti per la costruzione

Dettagli

Analisi di Mercato. Facoltà di Economia. Analisi sui consumi. Metodo delle inchieste familiari. Metodo delle disponibilità globali

Analisi di Mercato. Facoltà di Economia. Analisi sui consumi. Metodo delle inchieste familiari. Metodo delle disponibilità globali Obiettivi delle aziende Analisi di Mercato Facoltà di Economia francesco mola Analisi sui consumi Conoscere i bisogni e i gusti dei consumatori Valutare la soddisfazione della clientela Lanciare nuovi

Dettagli

LE DETERMINANTI DELLA REDDITIVITÀ DELLE SOCIETA OPERANTI NEL COMPARTO TESSILE ABBIGLIAMENTO IN ITALIA

LE DETERMINANTI DELLA REDDITIVITÀ DELLE SOCIETA OPERANTI NEL COMPARTO TESSILE ABBIGLIAMENTO IN ITALIA LE DETERMINANTI DELLA REDDITIVITÀ DELLE SOCIETA OPERANTI NEL COMPARTO TESSILE ABBIGLIAMENTO IN ITALIA Il metodo CVRP per l analisi delle maggiori società tessili italiane Stefano Cordero di Montezemolo

Dettagli

EVOLUZIONE STUDIO DI SETTORE TG42U

EVOLUZIONE STUDIO DI SETTORE TG42U ALLEGATO 5 NOTA TECNICA E METODOLOGICA EVOLUZIONE STUDIO DI SETTORE TG42U NOTA TECNICA E METODOLOGICA CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L evoluzione dello Studio di Settore ha il fine di

Dettagli

Statistica descrittiva univariata

Statistica descrittiva univariata Statistica descrittiva univariata Elementi di statistica 2 1 Tavola di dati Una tavola (o tabella) di dati è l insieme dei caratteri osservati nel corso di un esperimento o di un rilievo. Solitamente si

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Un breve riepilogo: caratteri, unità statistiche e collettivo UNITA STATISTICA: oggetto dell osservazione

Dettagli

ALLEGATO 7. Nota Tecnica e Metodologica SK16U

ALLEGATO 7. Nota Tecnica e Metodologica SK16U ALLEGATO 7 Nota Tecnica e Metodologica SK16U NOTA TECNICA E METODOLOGICA 1. CRITERI PER LA COSTRUZIONE DELLO STUDIO DI SETTORE Di seguito vengono esposti i criteri seguiti per la costruzione dello studio

Dettagli

I Modelli della Ricerca Operativa

I Modelli della Ricerca Operativa Capitolo 1 I Modelli della Ricerca Operativa 1.1 L approccio modellistico Il termine modello è di solito usato per indicare una costruzione artificiale realizzata per evidenziare proprietà specifiche di

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva Università del Piemonte Orientale Corsi di Laurea Triennale Corso di Statistica e Biometria Introduzione e Statistica descrittiva Corsi di Laurea Triennale Corso di Statistica e Biometria: Introduzione

Dettagli

Statistica descrittiva: prime informazioni dai dati sperimentali

Statistica descrittiva: prime informazioni dai dati sperimentali SECONDO APPUNTAMENTO CON LA SPERIMENTAZIONE IN AGRICOLTURA Statistica descrittiva: prime informazioni dai dati sperimentali La statistica descrittiva rappresenta la base di partenza per le applicazioni

Dettagli

STUDIO DI SETTORE TK16U

STUDIO DI SETTORE TK16U ALLEGATO 7 NOTA TECNICA E METODOLOGICA EVOLUZIONE STUDIO DI SETTORE TK16U NOTA TECNICA E METODOLOGICA CRITERI PER LA COSTRUZIONE DELLO STUDIO DI SETTORE L evoluzione dello Studio di Settore ha il fine

Dettagli

Altri metodi di indicizzazione

Altri metodi di indicizzazione Organizzazione a indici su più livelli Altri metodi di indicizzazione Al crescere della dimensione del file l organizzazione sequenziale a indice diventa inefficiente: in lettura a causa del crescere del

Dettagli

Regressione non lineare con un modello neurale feedforward

Regressione non lineare con un modello neurale feedforward Reti Neurali Artificiali per lo studio del mercato Università degli studi di Brescia - Dipartimento di metodi quantitativi Marco Sandri (sandri.marco@gmail.com) Regressione non lineare con un modello neurale

Dettagli

Capitolo IV. I mercati finanziari

Capitolo IV. I mercati finanziari Capitolo IV. I mercati finanziari 2 I MERCATI FINANZIARI OBIETTIVO: SPIEGARE COME SI DETERMINANO I TASSI DI INTERESSE E COME LA BANCA CENTRALE PUO INFLUENZARLI LA DOMANDA DI MONETA DETERMINAZIONE DEL TASSO

Dettagli

Elementi di Statistica descrittiva Parte I

Elementi di Statistica descrittiva Parte I Elementi di Statistica descrittiva Parte I Che cos è la statistica Metodo di studio di caratteri variabili, rilevabili su collettività. La statistica si occupa di caratteri (ossia aspetti osservabili)

Dettagli

STATISTICA ECONOMICA STATISTICA PER L ECONOMIA

STATISTICA ECONOMICA STATISTICA PER L ECONOMIA STATISTICA ECONOMICA STATISTICA PER L ECONOMIA a.a. 2009-2010 Facoltà di Economia, Università Roma Tre Archivio Statistico delle Imprese Attive (ASIA) L archivio è costituito dalle unità economiche che

Dettagli

Tecniche di analisi multivariata

Tecniche di analisi multivariata Tecniche di analisi multivariata Metodi che fanno riferimento ad un modello distributivo assunto per le osservazioni e alla base degli sviluppi inferenziali - tecniche collegate allo studio della dipendenza

Dettagli

Analisi dei gruppi (Cluster analysis)

Analisi dei gruppi (Cluster analysis) Capitolo 10 Analisi dei gruppi (Cluster analysis) Partendo da un collettivo multidimensionale, l analisi dei gruppi mira ad assegnarne le unità a categorie non definite a priori, formando dei gruppi di

Dettagli

CAPITOLO 10. Controllo di qualità. Strumenti per il controllo della qualità e la sua gestione

CAPITOLO 10. Controllo di qualità. Strumenti per il controllo della qualità e la sua gestione CAPITOLO 10 Controllo di qualità Strumenti per il controllo della qualità e la sua gestione STRUMENTI PER IL CONTROLLO E LA GESTIONE DELLA QUALITÀ - DIAGRAMMI CAUSA/EFFETTO - DIAGRAMMI A BARRE - ISTOGRAMMI

Dettagli

RISCHIO E RENDIMENTO DEGLI STRUMENTI FINANZIARI. Docente: Prof. Massimo Mariani

RISCHIO E RENDIMENTO DEGLI STRUMENTI FINANZIARI. Docente: Prof. Massimo Mariani RISCHIO E RENDIMENTO DEGLI STRUMENTI FINANZIARI Docente: Prof. Massimo Mariani 1 SOMMARIO Il rendimento di un attività finanziaria: i parametri rilevanti Rendimento totale, periodale e medio Il market

Dettagli

Misure della dispersione o della variabilità

Misure della dispersione o della variabilità QUARTA UNITA Misure della dispersione o della variabilità Abbiamo visto che un punteggio di per sé non ha alcun significato e lo acquista solo quando è posto a confronto con altri punteggi o con una statistica.

Dettagli

Data Mining in SAP. Alessandro Ciaramella

Data Mining in SAP. Alessandro Ciaramella UNIVERSITÀ DI PISA Corsi di Laurea Specialistica in Ingegneria Informatica per la Gestione d Azienda e Ingegneria Informatica Data Mining in SAP A cura di: Alessandro Ciaramella La Business Intelligence

Dettagli

EVOLUZIONE STUDIO DI SETTORE TG87U

EVOLUZIONE STUDIO DI SETTORE TG87U ALLEGATO 21 NOTA TECNICA E METODOLOGICA EVOLUZIONE STUDIO DI SETTORE TG87U NOTA TECNICA E METODOLOGICA CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L evoluzione dello Studio di Settore ha il fine di

Dettagli

1. Aspetti di Marketing... 3 Obiettivi... 3 Esempi... 4 2. Aspetti Applicativi... 4 Obiettivi... 4. 3. Aspetti Prestazionali... 4

1. Aspetti di Marketing... 3 Obiettivi... 3 Esempi... 4 2. Aspetti Applicativi... 4 Obiettivi... 4. 3. Aspetti Prestazionali... 4 Pagina 2 1. Aspetti di Marketing... 3 Obiettivi... 3 Esempi... 4 2. Aspetti Applicativi... 4 Obiettivi... 4 Esempi... 4 3. Aspetti Prestazionali... 4 Obiettivi... 4 Esempi... 4 4. Gestione del Credito

Dettagli

STUDIO DI SETTORE SG87U

STUDIO DI SETTORE SG87U ALLEGATO 9 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE SG87U NOTA TECNICA E METODOLOGICA CRITERI PER LA COSTRUZIONE DELLO STUDIO DI SETTORE Di seguito vengono esposti i criteri seguiti per la costruzione

Dettagli

STATISTICA INFERENZIALE

STATISTICA INFERENZIALE STATISTICA INFERENZIALE Premessa importante: si ipotizza che il comportamento della popolazione rispetto ad una variabile casuale X viene descritto attraverso una funzione parametrica di probabilità p

Dettagli

Funzioni in due variabili Raccolta di FAQ by Andrea Prevete

Funzioni in due variabili Raccolta di FAQ by Andrea Prevete Funzioni in due variabili Raccolta di FAQ by Andrea Prevete 1) Cosa intendiamo, esattamente, quando parliamo di funzione reale di due variabili reali? Quando esiste una relazione fra tre variabili reali

Dettagli

SISTEMI INFORMATIVI AZIENDALI

SISTEMI INFORMATIVI AZIENDALI SISTEMI INFORMATIVI AZIENDALI Prof. Andrea Borghesan venus.unive.it/borg borg@unive.it Ricevimento: Alla fine di ogni lezione Modalità esame: scritto 1 Data Mining. Introduzione La crescente popolarità

Dettagli

Economia Aziendale- Corso Progredito

Economia Aziendale- Corso Progredito Economia Aziendale- Corso Progredito Valutazione delle Banche!!! Palmeri Stefano! Voina Daniela! Introduzione Una banca è un istituto di credito che esercita congiuntamente l'attività di raccolta del risparmio

Dettagli

Alberi Decisionali di Vito Madaio

Alberi Decisionali di Vito Madaio Tecnica degli Alberi Decisionali Cosa è un albero decisionale Un albero decisionale è la dimostrazione grafica di una scelta effettuata o proposta. Non sempre ciò che istintivamente ci appare più interessante

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it RIPASSO SULLE MATRICI 1 Addizione tra matrici Moltiplicazione Matrice diagonale Matrice identità Matrice trasposta

Dettagli

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici Test non parametrici Test non parametrici Il test T di Student per uno o per due campioni, il test F di Fisher per l'analisi della varianza, la correlazione, la regressione, insieme ad altri test di statistica

Dettagli

modo differenziato i clienti ricadenti nelle differenti classi. Tecnica RFM Questo approccio considera, oltre al valore di fatturato (contemplato

modo differenziato i clienti ricadenti nelle differenti classi. Tecnica RFM Questo approccio considera, oltre al valore di fatturato (contemplato Metodi quantitativi per il targeting Per le piccole e medie imprese il Data Base di Marketing (DBM) è di importanza cruciale nella segmentazione della clientela e individuazione del target di interesse

Dettagli

Brugnaro Luca Boscaro Gianni (2009) 1

Brugnaro Luca Boscaro Gianni (2009) 1 STATISTICA PER LE PROFESSIONI SANITARIE - LIVELLO BASE Brugnaro Luca Boscaro Gianni (2009) 1 Perché la statistica Prendere decisioni Bibliografia non soddisfacente Richieste nuove conoscenze Raccolta delle

Dettagli

Elementi di Statistica

Elementi di Statistica Elementi di Statistica Contenuti Contenuti di Statistica nel corso di Data Base Elementi di statistica descrittiva: media, moda, mediana, indici di dispersione Introduzione alle variabili casuali e alle

Dettagli

NOTE METODOLOGICHE PRINCIPALI MARGINI ECONOMICI - SOCIETA INDUSTRIALI, COMMERCIALI E PLURIENNALI

NOTE METODOLOGICHE PRINCIPALI MARGINI ECONOMICI - SOCIETA INDUSTRIALI, COMMERCIALI E PLURIENNALI NOTE METODOLOGICHE PRINCIPALI MARGINI ECONOMICI - SOCIETA INDUSTRIALI, COMMERCIALI E PLURIENNALI Valore aggiunto Valore della produzione - Consumi di materie - Spese generali + Accantonamenti Mol (Valore

Dettagli

Capitolo 20: Scelta Intertemporale

Capitolo 20: Scelta Intertemporale Capitolo 20: Scelta Intertemporale 20.1: Introduzione Gli elementi di teoria economica trattati finora possono essere applicati a vari contesti. Tra questi, due rivestono particolare importanza: la scelta

Dettagli

10 L EFFICIENZA. L efficienza

10 L EFFICIENZA. L efficienza 10 L EFFICIENZA Ragioneria Generale e Applicata 1 L efficienza Quali condizioni aiutano l azienda a raggiungere l equilibrio economico? L Efficienza Un impresa è efficiente quando riesce a massimizzare

Dettagli

info Prodotto Eurizon Multiasset Reddito Ottobre 2020 A chi si rivolge

info Prodotto Eurizon Multiasset Reddito Ottobre 2020 A chi si rivolge info Prodotto Eurizon Multiasset Reddito è un Fondo comune di diritto italiano, gestito da Eurizon Capital SGR, che persegue l'obiettivo di ottimizzare il rendimento del Fondo in un orizzonte temporale

Dettagli

Il settore del trasporto su strada: analisi del rischio.

Il settore del trasporto su strada: analisi del rischio. Newsletter Phedro febbraio 2007 Il settore del trasporto su strada: analisi del rischio. Lo scopo del presente contributo è di analizzare il settore del trasporto su strada sotto due punti di vista: 1.

Dettagli

evolution and innovation in SME s rating

evolution and innovation in SME s rating evolution and innovation in SME s rating IL RISCHIO OPERATIVO GMA 4 5 LA STRUTTURA PROGETTUALE IL RISCHIO OPERATIVO GMA Il rischio operativo GMA prevede l elaborazione degli ultimi tre bilanci aziendali

Dettagli

Pivot è bello. Principali. misure di variabilità. Il contesto è di tipo matematico, in particolare riguarda l uso di dati numerici e delle loro

Pivot è bello. Principali. misure di variabilità. Il contesto è di tipo matematico, in particolare riguarda l uso di dati numerici e delle loro Pivot è bello Livello scolare: 1 biennio Abilità Conoscenze interessate Predisporre la struttura della Distribuzioni delle matrice dei dati grezzi con frequenze a seconda del riguardo a una rilevazione

Dettagli

Sommario. Capitolo 1 Impiego della statistica per la gestione dell azienda 1. Capitolo 2 Disponibilità e produzione delle informazioni statistiche 19

Sommario. Capitolo 1 Impiego della statistica per la gestione dell azienda 1. Capitolo 2 Disponibilità e produzione delle informazioni statistiche 19 Prefazione XI Capitolo 1 Impiego della statistica per la gestione dell azienda 1 1.1 Premessa 1 1.2 Il ruolo della statistica a supporto del processo decisionale del manager 3 1.3 L impiego della statistica

Dettagli

La Regressione Lineare

La Regressione Lineare La Regressione Lineare. Cos è l Analisi della Regressione Multipla? L analisi della regressione multipla è una tecnica statistica che può essere impiegata per analizzare la relazione tra una variabile

Dettagli

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva Brugnaro Luca Progetto formativo complessivo Obiettivo: incrementare le competenze degli operatori sanitari nelle metodiche

Dettagli

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: Esempi di domande risposta multipla (Modulo II) 1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario: 1) ha un numero di elementi pari a 5; 2) ha un numero di elementi

Dettagli

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2. Analisi multivariata Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Cercare di capire le relazioni

Dettagli

Disegno campionario e metodi utilizzati Versione 3.2

Disegno campionario e metodi utilizzati Versione 3.2 Indagine sulle imprese industriali e dei servizi BIRD Bank of Italy Remote access to micro Data Disegno campionario e metodi utilizzati Versione 3.2 novembre 2014 Indice Indice... 2 Disegno campionario

Dettagli

PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO

PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO L indagine si è svolta nel periodo dal 26 agosto al 16 settembre 2014 con l obiettivo di conoscere l opinione dei residenti

Dettagli

Competenza chiave europea: MATEMATICA. Scuola Primaria. DISCIPLINE DI RIFERIMENTO: MATEMATICA DISCIPLINE CONCORRENTI: tutte

Competenza chiave europea: MATEMATICA. Scuola Primaria. DISCIPLINE DI RIFERIMENTO: MATEMATICA DISCIPLINE CONCORRENTI: tutte Competenza chiave europea: MATEMATICA Scuola Primaria DISCIPLINE DI RIFERIMENTO: MATEMATICA DISCIPLINE CONCORRENTI: tutte TAB. A TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE al termine della Scuola Primaria

Dettagli

STUDIO DI SETTORE VG87U

STUDIO DI SETTORE VG87U ALLEGATO 21 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VG87U CONSULENZA FINANZIARIA, AMMINISTRATIVO-GESTIONALE E AGENZIE DI INFORMAZIONI COMMERCIALI CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE

Dettagli

Università del Piemonte Orientale. Corsi di Specialità. Corso di Statistica Medica. Analisi dei dati quantitativi : Analisi della varianza

Università del Piemonte Orientale. Corsi di Specialità. Corso di Statistica Medica. Analisi dei dati quantitativi : Analisi della varianza Università del Piemonte Orientale Corsi di Specialità Corso di Statistica Medica Analisi dei dati quantitativi : Analisi della varianza Università del Piemonte Orientale Corso di laurea in biotecnologie

Dettagli

Capitolo V. I mercati dei beni e i mercati finanziari: il modello IS-LM

Capitolo V. I mercati dei beni e i mercati finanziari: il modello IS-LM Capitolo V. I mercati dei beni e i mercati finanziari: il modello IS-LM 2 OBIETTIVO: Il modello IS-LM Fornire uno schema concettuale per analizzare la determinazione congiunta della produzione e del tasso

Dettagli

Esercitazione in Laboratorio: risoluzione di problemi di programmazione lineare tramite Excel il mix di produzione

Esercitazione in Laboratorio: risoluzione di problemi di programmazione lineare tramite Excel il mix di produzione Esercitazione in Laboratorio: risoluzione di problemi di programmazione lineare tramite Excel il mix di produzione Versione 11/03/2004 Contenuto e scopo esercitazione Contenuto esempi di problema di programmazione

Dettagli

Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla

Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla Il metodo della regressione può essere esteso dal caso in cui si considera la variabilità della risposta della y in relazione ad una sola variabile indipendente X ad una situazione più generale in cui

Dettagli

5.4 Solo titoli rischiosi

5.4 Solo titoli rischiosi 56 Capitolo 5. Teoria matematica del portafoglio finanziario II: analisi media-varianza 5.4 Solo titoli rischiosi Suppongo che sul mercato siano presenti n titoli rischiosi i cui rendimenti aleatori sono

Dettagli

online La situazione operativa. In ambito aziendale i processi decisionali richiedono assunzioni di responsabilità a vari LABORATORIO 1

online La situazione operativa. In ambito aziendale i processi decisionali richiedono assunzioni di responsabilità a vari LABORATORIO 1 LABORATORIO 1 Scelta tra preventivi per l acquisto di un impianto di Luca CAGLIERO Materie: Informatica, Matematica, Economia aziendale (Triennio IT) L attività da svolgere in laboratorio, di carattere

Dettagli

Presentazione. Risorse Web. Metodi Statistici 1

Presentazione. Risorse Web. Metodi Statistici 1 I-XVI Romane_ 27-10-2004 14:25 Pagina VII Prefazione Risorse Web XI XIII XVII Metodi Statistici 1 Capitolo 1 Tecniche Statistiche 3 1.1 Probabilità, Variabili Casuali e Statistica 3 1.1.1 Introduzione

Dettagli

Indice-sommario INDICE SOMMARIO CAPITOLO I LE MATRICI DEI DATI E LE ANALISI UNIVARIATE

Indice-sommario INDICE SOMMARIO CAPITOLO I LE MATRICI DEI DATI E LE ANALISI UNIVARIATE VII INDICE SOMMARIO Prefazione... xv CAPITOLO I LE MATRICI DEI DATI E LE ANALISI UNIVARIATE 1. Analisi dei dati e data mining... 1 2. La matrice dei dati «unità pervariabili»... 6 3. Idatiricavatidaun

Dettagli

Capitolo 26: Il mercato del lavoro

Capitolo 26: Il mercato del lavoro Capitolo 26: Il mercato del lavoro 26.1: Introduzione In questo capitolo applichiamo l analisi della domanda e dell offerta ad un mercato che riveste particolare importanza: il mercato del lavoro. Utilizziamo

Dettagli

AREA MATEMATICO-SCIENTIFICO-TECNOLOGICA MATEMATICA

AREA MATEMATICO-SCIENTIFICO-TECNOLOGICA MATEMATICA AREA MATEMATICO-SCIENTIFICO-TECNOLOGICA MATEMATICA TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE AL TERMINE DELLA SCUOLA SECONDARIA DI PRIMO GRADO. L alunno ha rafforzato un atteggiamento positivo rispetto

Dettagli

LA CONTABILITA INTERNA. La contabilità interna

LA CONTABILITA INTERNA. La contabilità interna LA CONTABILITA INTERNA 1 LA CONTABILITA ANALITICA La gestione dei costi aziendali richiede informazioni più dettagliate rispetto a quelle offerte dalla contabilità esterna: è, infatti, necessario individuare

Dettagli

Valutare un test. Affidabilità e validità di un test. Sensibilità e specificità

Valutare un test. Affidabilità e validità di un test. Sensibilità e specificità Valutare un test 9 Quando si sottopone una popolazione ad una procedura diagnostica, non tutti i soggetti malati risulteranno positivi al test, così come non tutti i soggetti sani risulteranno negativi.

Dettagli

LA SEGMENTAZIONE DEL MERCATO

LA SEGMENTAZIONE DEL MERCATO LA SEGMENTAZIONE DEL MERCATO La segmentazione Considerato l insieme dei clienti che costituiscono il mercato potenziale, occorre trovare dei tratti, omogenei a più clienti, che determinano risposte simili

Dettagli

STUDIO DI SETTORE VG82U

STUDIO DI SETTORE VG82U ALLEGATO 18 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VG82U SERVIZI PUBBLICITARI, RELAZIONI PUBBLICHE E COMUNICAZIONE 862 CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio

Dettagli

190 LA DUALITÀ NELLA PROGRAMMAZIONE LINEARE 7.2 INTERPRETAZIONE DELLA DUALITÀ

190 LA DUALITÀ NELLA PROGRAMMAZIONE LINEARE 7.2 INTERPRETAZIONE DELLA DUALITÀ 190 LA DUALITÀ NELLA PROGRAMMAZIONE LINEARE 7.2 INTERPRETAZIONE DELLA DUALITÀ [Questo paragrafo non fa parte del programma di esame] Nei modelli reali le variabili (primali) possono rappresentare, ad esempio,

Dettagli

Tecniche di stima del costo e delle altre forme di finanziamento

Tecniche di stima del costo e delle altre forme di finanziamento Finanza Aziendale Analisi e valutazioni per le decisioni aziendali Tecniche di stima del costo e delle altre forme di finanziamento Capitolo 17 Indice degli argomenti 1. Rischio operativo e finanziario

Dettagli

1. Introduzione. 2. I metodi di valutazione

1. Introduzione. 2. I metodi di valutazione 1. Introduzione La Riserva Sinistri è l accantonamento che l impresa autorizzata all esercizio dei rami danni deve effettuare a fine esercizio in previsione dei costi che essa dovrà sostenere in futuro

Dettagli

Analizza/Confronta medie. ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107. Test t. Test t. t-test test e confronto tra medie chi quadrato

Analizza/Confronta medie. ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107. Test t. Test t. t-test test e confronto tra medie chi quadrato Analizza/Confronta medie ELEMENTI DI PSICOMETRIA Esercitazione n. 7-8-9-107 t-test test e confronto tra medie chi quadrato C.d.L. Comunicazione e Psicologia a.a. 2008/09 Medie Calcola medie e altre statistiche

Dettagli

Rischio e rendimento degli strumenti finanziari

Rischio e rendimento degli strumenti finanziari Finanza Aziendale Analisi e valutazioni per le decisioni aziendali Rischio e rendimento degli strumenti finanziari Capitolo 15 Indice degli argomenti 1. Analisi dei rendimenti delle principali attività

Dettagli

INDICI DI BILANCIO. Lo stato patrimoniale, riclassificato, assume la forma che schematizziamo di seguito:

INDICI DI BILANCIO. Lo stato patrimoniale, riclassificato, assume la forma che schematizziamo di seguito: INDICI DI BILANCIO L analisi per indici del bilancio consiste nel calcolare, partendo dai dati dello Stato patrimoniale e del Conto economico, opportunamente revisionati e riclassificati, indici (quozienti,

Dettagli

SISTEMA DI VALUTAZIONE DELLA PERFORMANCE del personale non dirigente

SISTEMA DI VALUTAZIONE DELLA PERFORMANCE del personale non dirigente ALLEGATO 1 COMUNE DI ASTI Settore Risorse Umane e Sistemi Informativi SISTEMA DI VALUTAZIONE DELLA PERFORMANCE del personale non dirigente 1 I N D I C E OGGETTO E FINALITA' pag. 3 LA METODOLOGIA DI VALUTAZIONE

Dettagli

Verifica e Validazione (V & V) Software e difetti. Processo di V & V. Test

Verifica e Validazione (V & V) Software e difetti. Processo di V & V. Test Software e difetti Il software con difetti è un grande problema I difetti nel software sono comuni Come sappiamo che il software ha qualche difetto? Conosciamo tramite qualcosa, che non è il codice, cosa

Dettagli

STUDIO DI SETTORE VG39U

STUDIO DI SETTORE VG39U A L L E G AT O 8 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VG39U A G E N Z I E D I M E D I A Z I O N E I M M O B I L I A R E CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio

Dettagli

I contenuti informativi

I contenuti informativi I contenuti informativi La rilevazione sulle forze di lavoro riveste un ruolo di primo piano nella documentazione statistica sul mercato del lavoro. Oltre a misurare l occupazione e la disoccupazione,

Dettagli

Programmazione lineare

Programmazione lineare Programmazione lineare Dualitá: definizione, teoremi ed interpretazione economica Raffaele Pesenti 1 Dualità 1.1 Definizione e teoremi Definizione 1 Dato un problema di LP in forma canonica max x = ct

Dettagli

CURRICOLO MATEMATICA ABILITA COMPETENZE

CURRICOLO MATEMATICA ABILITA COMPETENZE CURRICOLO MATEMATICA 1) Operare con i numeri nel calcolo aritmetico e algebrico, scritto e mentale, anche con riferimento a contesti reali. Per riconoscere e risolvere problemi di vario genere, individuando

Dettagli

14.6 Effettuare scelte in presenza di vincoli 15

14.6 Effettuare scelte in presenza di vincoli 15 14 18-12-2007 19:04 Pagina 403 Le decisioni di breve termine fra alternative diverse 403 Fig. 14.5 Il trattamento analitico dei costi a gradino Costo Comportamento reale del costo Trattamento analitico

Dettagli

Esplorazione dei dati

Esplorazione dei dati Esplorazione dei dati Introduzione L analisi esplorativa dei dati evidenzia, tramite grafici ed indicatori sintetici, le caratteristiche di ciascun attributo presente in un dataset. Il processo di esplorazione

Dettagli

STUDIO DI SETTORE VK17U

STUDIO DI SETTORE VK17U A L L E G AT O 6 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VK17U P E R I T I I N D U S T R I A L I CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio di settore attribuisce

Dettagli

Regressione logistica

Regressione logistica Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer Metodi di classificazione Tecniche principali Alcuni esempi Data set Default I dati La regressione logistica Esempio Il modello

Dettagli

Capitolo 13: L offerta dell impresa e il surplus del produttore

Capitolo 13: L offerta dell impresa e il surplus del produttore Capitolo 13: L offerta dell impresa e il surplus del produttore 13.1: Introduzione L analisi dei due capitoli precedenti ha fornito tutti i concetti necessari per affrontare l argomento di questo capitolo:

Dettagli

SoftWare DMGraphics. Indice. Manuale d uso. 1) Introduzione. 2) Pagine grafiche. 3) Grafici. 4) Menù

SoftWare DMGraphics. Indice. Manuale d uso. 1) Introduzione. 2) Pagine grafiche. 3) Grafici. 4) Menù SoftWare DMGraphics Manuale d uso Indice 1) Introduzione 2) Pagine grafiche. 2.1) Pagina grafica 2.2) Concetti generali 2.3) Scale dei valori 2.4) Posizionamento elementi nel grafico 3) Grafici 3.1) Grafici

Dettagli

Soluzioni Esercizi elementari

Soluzioni Esercizi elementari Soluzioni sercizi elementari Capitolo. carattere: itolo di Studio, carattere qualitativo ordinato modalità: Diploma, Licenza media, Laurea, Licenza elementare unità statistiche: Individui. carattere: Fatturato,

Dettagli

0. Piano cartesiano 1

0. Piano cartesiano 1 0. Piano cartesiano Per piano cartesiano si intende un piano dotato di due assi (che per ragioni pratiche possiamo scegliere ortogonali). Il punto in comune ai due assi è detto origine, e funziona da origine

Dettagli

Nozioni di base sulla stesura di un piano economico-finanziario. Daniela Cervi Matteo Pellegrini 10 Febbraio 2014

Nozioni di base sulla stesura di un piano economico-finanziario. Daniela Cervi Matteo Pellegrini 10 Febbraio 2014 Nozioni di base sulla stesura di un piano economico-finanziario Daniela Cervi Matteo Pellegrini 10 Febbraio 2014 Il Piano Economico Finanziario Il piano economico-finanziario costituisce la porzione più

Dettagli

MATEMATICA DEL DISCRETO elementi di teoria dei grafi. anno acc. 2009/2010

MATEMATICA DEL DISCRETO elementi di teoria dei grafi. anno acc. 2009/2010 elementi di teoria dei grafi anno acc. 2009/2010 Grafi semplici Un grafo semplice G è una coppia ordinata (V(G), L(G)), ove V(G) è un insieme finito e non vuoto di elementi detti vertici o nodi di G, mentre

Dettagli

STUDIO DI SETTORE WK21U

STUDIO DI SETTORE WK21U ALLEGATO 12 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE WK21U ATTIVITÀ DEGLI STUDI ODONTOIATRICI CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio di settore attribuisce ai

Dettagli

STUDIO DI SETTORE UG93U

STUDIO DI SETTORE UG93U A L L E G AT O 5 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE UG93U A T T I V I T À D E G L I S T U D I D I D E S I G N CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio di

Dettagli

CLASSIFICAZIONE DEI CARATTERI

CLASSIFICAZIONE DEI CARATTERI CLASSIFICAZIONE DEI CARATTERI Come abbiamo visto, su ogni unità statistica si rilevano una o più informazioni di interesse (caratteri). Il modo in cui un carattere si manifesta in un unità statistica è

Dettagli

Il concetto di correlazione

Il concetto di correlazione SESTA UNITA Il concetto di correlazione Fino a questo momento ci siamo interessati alle varie statistiche che ci consentono di descrivere la distribuzione dei punteggi di una data variabile e di collegare

Dettagli

I punteggi zeta e la distribuzione normale

I punteggi zeta e la distribuzione normale QUINTA UNITA I punteggi zeta e la distribuzione normale I punteggi ottenuti attraverso una misurazione risultano di difficile interpretazione se presi in stessi. Affinché acquistino significato è necessario

Dettagli

BILANCIO DELLE IMPRESE BANCARIE E INDUSTRIALI di Lucia BARALE

BILANCIO DELLE IMPRESE BANCARIE E INDUSTRIALI di Lucia BARALE Tema d esame BILANCIO DELLE IMPRESE BANCARIE E INDUSTRIALI di Lucia BARALE ATTIVITÀ DIDATTICHE 1 MATERIE AZIENDALI (classe 5 a ITC) Il tema proposto è articolato in tre parti, di cui l ultima con tre alternative

Dettagli

Dai dati al modello teorico

Dai dati al modello teorico Dai dati al modello teorico Analisi descrittiva univariata in R 1 Un po di terminologia Popolazione: (insieme dei dispositivi che verranno messi in produzione) finito o infinito sul quale si desidera avere

Dettagli