MODELLI STATISTICI PER LA PREVISIONE DEL RISCHIO DI INSOLVENZA (O VALUTAZIONE DEL MERITO DI CREDITO)

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "MODELLI STATISTICI PER LA PREVISIONE DEL RISCHIO DI INSOLVENZA (O VALUTAZIONE DEL MERITO DI CREDITO)"

Transcript

1 MODELLI STATISTICI PER LA PREVISIONE DEL RISCHIO DI INSOLVENZA (O VALUTAZIONE DEL MERITO DI CREDITO) I vari operatori del credito ricevono richieste di finanziamento da potenziali clienti (individui o imprese) ed hanno la necessità di prendere una decisione circa la concessione o il rifiuto del credito. Obiettivo: l istituto di credito ha l esigenza di costruire una regola di classificazione che suddivida il collettivo dei richiedenti il credito in due classi - soggetti che potenzialmente rimborseranno il prestito ( sani ) e soggetti potenzialmente insolventi (insolvenza: incapacità di fronteggiare gli impegni assunti). L impiego di strumenti statistici a supporto del processo decisionale di concessione del credito si sostanzia nell attribuzione di un punteggio (score) ai soggetti che richiedono il credito punteggio che rappresenta le probabilità di rimborso. Sulla base di tale punteggio il soggetto sarà assegnato al gruppo dei potenzialmente sani o al gruppo dei potenzialmente insolventi La valutazione del rischio di insolvenza viene effettuata sulla base di informazioni individuali (le variabili predittive), osservate sia con riferimento ai soggetti sani sia a quelli insolventi, che riguardano caratteristiche socio-demografiche ed economiche con riferimento agli individui o caratteristiche legate allo stato di salute dell azienda (ad es. indici di bilancio). Unità 12 - Corso di Statistica aziendale (prof. M.R. Ferrante) Laurea Specialistica in Economia e Gestione Aziendale - Facoltà di Economia, Polo di Forlì, Università di Bologna

2 Vantaggi dell impiego di una procedura statistica: semplificazione ed automatizzazione oggettività ed omogeneità (o soggettività condivisa) riduzione del rischio di inadempienza e quindi dei contenziosi Concentriamoci sulla previsione del rischio di insolvenza aziendale. Tipologie di insolvenza: finanziaria problemi di liquidità, squilibri fra debiti a breve e a lungo termine, fra mezzi propri e mezzi di terzi. giuridica: il fallimento è la constatazione giuridica dell insolvenza finanziaria e rappresenta lo strumento col quale il legislatore dichiara la crisi aziendale e garantisce i diritti dei terzi. Cause principali interne ed esterne della crisi aziendale: squilibri ed inefficienze strutturali incapacità del management ciclo economico La valutazione della condizione economica, finanziaria e patrimoniale dell impresa può essere importante al fine di diagnosticare precocemente lo stato di crisi 2

3 I vari aspetti che definiscono lo stato di salute dell impresa possono essere valutati attraverso gli indici di bilancio (redditività, liquidità, solvibilità, leverage, dimensione, ecc.) L analisi basata sugli indici di bilancio costituisce l elemento fondamentale dell approccio più recente alla modellazione del rischio di insolvenza. Il contributo dell analisi statistica in questo senso può avere: 1) scopi descrittivi ed esplicativi di come si manifesta e si sviluppa una crisi aziendale; si tenta di risalire alle variabili che maggiormente sono responsabili dell insolvenza e quindi di identificare gli indici di bilancio che meglio possono diagnosticare precocemente stati di crisi 2) scopi predittivi: costruzione di una regola che consenta di assegnare unità nuove ad uno dei gruppi Perchè non si analizzano gli indici singolarmente? Gli indici sono espressione dei vari aspetti dello stato di salute di un azienda, aspetti che sono, ovviamente, interconnessi. Lo studio separato dei vari indici può condurre a difficoltà interpretative laddove indici diversi conducano a conclusioni diverse sullo stato di salute dell azienda. Perchè non si ricorre per costruire un indice sintetico - una media ponderata dei vari indici? Determinazione soggettiva dei pesi Mancata considerazione della correlazione tra indici 3

4 Mediante le tecniche di analisi statistica multivariata è possibile valutare la situazione economicofinanziaria complessiva dell impresa (vari indici) e di sintetizzare tale valutazione in modo da rendere possibile il confronto tra soggetti diversi Allo scopo di diagnosticare precocemente il rischio di insolvenza aziendale o di valutare, in generale, il merito di credito si possono usare le tecniche statistiche di tipo classificatorio. Tra le più frequentemente impiegate: l Analisi Discriminante (Centrale dei bilanci) gli Alberi di Classificazione Per costruire una regola classificatoria, occorre dunque: 1) stabilire la definizione dello stato di crisi, in riferimento: a) allo stato di crisi terminale (fallimento) b) ad uno degli stati di disequilibrio economico, finanziario o patrimoniale che precede il fallimento vero e proprio 2) disporre di dati retrospettivi, relativi ad indici di bilancio, per un gruppo di imprese sane e un gruppo di imprese in stato di crisi (o fallite al tempo corrente) 4

5 GLI ALBERI DI CLASSIFICAZIONE Considerato un campione di n unità statistiche su cui sono state osservate: La variabile dipendente Y (la base) che identifica a priori le classi Le variabili esplicative X=(X 1,X 2,, X s,,x p ) o predittori, impiegate per descrivere le caratteristiche delle classi identificate dalla base Le tecniche di partizione ricorsiva permettono di individuare l appartenenza di ogni unità statistica alle classi definite da Y, mediante suddivisione progressiva del collettivo in gruppi via via più omogenei al loro interno rispetto alla variabile dipendente Y, suddivisione effettuata sulla base di ciascuna X j Ttecniche di partizione ricorsiva (anche denominate di "Segmentazione gerarchica"): AID, CHAID, CART Segmentazione gerarchica (SG): Al primo passo del procedimento l insieme di n unità è suddiviso in due o più sottoinsiemi, definiti dalle modalità di una fra le variabili esplicative X. I passi successivi si realizzano suddividendo ulteriormente i sottoinsiemi ottenuti al passo precedente. 5

6 Ogni gruppo formato ad uno stadio del processo può essere cioè ulteriormente suddiviso negli stadi seguenti, fino a quando tale processo viene portato a termine con riferimento ad una prefissata regola di arresto (Criterio scissorio o top down) La segmentazione migliore, a questo e ad ogni passo successivo: viene individuata sulla base di una regola di ottimalità, che si realizza massimizzando l omogeneità entro/massimizzando l eterogeneità tra i sottoinsiemi, valutate secondo la variabile criterio (base). viene ricercata valutando tutte le segmentazioni possibili per ciascuna variabile esplicativa, e scegliendo la variabile che dà origine alla segmentazione migliore Schema che richiede notevoli potenzialità di calcolo : molti degli algoritmi di SG proposti di recente non erano realizzabili prima dello sviluppo dei calcolatori. 6

7 Un esempio di impiego degli alberi (credit scoring) (Zani, 2000) Informazioni relative a 323 clienti di un istituto di credito americano1, classificati in base alla loro affidabilità nel pagamento delle quote di un prestito elargito (variabile credit ranking, CR): la modalità affidabile è stata attribuita a coloro che hanno rispettato tutte le scadenze del prestito nella categoria non affidabile sono stati inseriti i clienti che non hanno rispettato le scadenze e sono quindi caduti in mora PAGA CREDIT RANKING Affidabile Non affidabile Totale <= sett. ETA > <= mens ETA > Totale Variabili esplicative: periodicità (mensile o settimanale) con la quale viene percepita la retribuzione (PAGA) età del cliente (ETA ). 1 I dati sono tratti dal file credit.sav collocato nella directory di lavoro del modulo AnswerTree del package SPSS. 7

8 I risultati delle tecniche di segmentazione vengono visualizzati attraverso strutture grafiche gerarchiche dette alberi : 8

9 L albero è costituito da un insieme finito di elementi, i nodi. Ogni nodo è un gruppo di unità, si riferisce a diversi stadi del processo di classificazione. Il rettangolo superiore rappresenta la radice (R) in cui è riportata la distribuzione delle freq. relative secondo la variabile CR (affidabile e non affidabile). Il nodo radice è un nodo disomogeneo al suo interno rispetto alla variabile obiettivo CREDIT RANKING perché racchiude tutti gli individui considerati, non classificati attraverso le variabili esplicative. I valori di soglia di una variabile che dividono le unità di un determinato nodo sono chiamati split (o suddivisioni). -- I rami sono le condizioni che hanno determinato la suddivisione. L insieme di tutti i nodi terminali di un albero viene indicato con il simbolo T ~. Le foglie sono i nodi terminali per i quali non si ritiene utile una ulteriore suddivisione. Nell esempio in esame i due sottoalberi sottostanti la radice sono formati distinguendo le due modalità del la variabile PAGA (mensile e settimanale): a sx clienti che percepiscono una retribuzione con cadenza settimanale a dx clienti che vengono retribuiti mensilmente; 9

10 Nell esperienza statunitense (alla quale si riferisce l esempio) una retribuzione settimanale è sintomo di un lavoro instabile, che può ripercuotersi negativamente sulla regolarità dei pagamenti alla banca nel nodo di sx compare una % elevata di clienti non affidabili nel nodo di dx la maggioranza dei clienti risulta affidabile Il valore % nella riga dei totali (riportato fra parentesi) fornisce il peso di un nodo nel livello in cui si trova Nelle foglie, punto di arrivo della rappresentazione: ulteriore classificazione delle unità in base alla variabile ETA utilizzando come split il valore 35 a sinistra ed il valore 25 a destra. La distinzione fra clienti affidabili e non affidabili ottenuta a livello finale è più netta rispetto alla classificazione di primo livello. In sintesi: Fra tutti i clienti che percepiscono una retribuzione settimanale, coloro con età superiore ai 35 anni sono, nella sostanza, affidabili, mentre il 90.51% dei clienti con età inferiore o pari a 35 anni è inaffidabile. 10

11 L ulteriore ripartizione dei clienti con retribuzione mensile individua i clienti con età superiore ai 25 anni che sono quasi totalmente affidabili (99,08%) Per età inferiore ai 25 anni, sempre per i clienti con paga mensile, si verifica una situazione incerta che potrebbe fare pensare alla necessità di una ulteriore variabile esplicativa per ottenere una distinzione più netta (51% vs 49%) Importante: tali considerazioni hanno conseguenze rilevanti in ambito previsivo la regola individuata può essere impiegata per classificare (nei gruppi definiti dalla var. obiettivo) nuove unità statistiche di cui si ignora la categoria di appartenenza (sulla base dei predittori). In base all esperienza, in futuro l istituto di credito sarà: disposto nella concessione di un credito ad un potenziale cliente con retribuzione mensile e con età superiore ai 25 anni più restio verso clienti giovani con retribuzione settimanale, a cui potrebbe chedere maggiori garanzie o non concedere il credito. 11

12 Ambiti economico-aziendali di impiego degli alberi credit scoring per valutare il rischio potenziale di una linea di credito; profiling per costruire i profili dei consumatori, degli utenti, dei clienti; direct marketing e comunicazione per scoprire quali gruppi risponderanno favorevolmente a determinate iniziative promozionali; previsione dello stato di crisi di un azienda qualità per scoprire le cause di difettosità di prodotti e servizi; database marketing per utilizzare appieno le informazioni sulla clientela effettiva e potenziale; Punto in comune con la cluster analysis gerarchica: nello stadio finale entrambe le procedure producono una partizione dell'insieme delle unità statistiche ( similarità con il dendrogramma ) Tuttavia, le differenze sono sostanziali: la SG richiede la conoscenza a priori della classe di appartenenza delle unità; scopo della cluster analysis è invece quello di costruire gruppi di unità statistiche partendo da un insieme indistinto 12

13 la SG viene operata utilizzando una sola variabile (selezionata fra tutte la variabili a disposizione) alla volta (si individua così una gerarchia di variabili), mentre la formazione dei gruppi nella cluster analysis viene fatta usando contemporaneamente tutte le variabili a disposizione la regola di classificazione individuata attraverso gli algoritmi di segmentazione viene usata per prevedere la collocazione di unità statistiche di cui non si conosce la classe di appartenenza Le tecniche di SG sono applicabili qualunque sia la natura della variabile dipendente: - qualitativa alberi di classificazione - quantitativa alberi di regressione (di cui non ci occuperemo) Le variabili esplicative possono essere su qualsiasi scala (se CART) In base al numero di sottoinsiemi che si possono formare ad ogni passo della procedura: Partizioni a due vie: segmentazione binaria Partizioni a un numero >2 vie: segmentazione multipla, o a K vie Negli ultimi tempi sono state proposti molti algoritmi di segmentazione, che si caratterizzano soprattutto per il diverso problema che affrontano, per la scelta dei criteri di analisi, per il modo in cui viene fatta la ricerca della migliore segmentazione (accenneremo a CART) 13

14 Obiettivi di un albero di classificazione 1) Individuazione delle determinanti della variabile dipendente L analisi individua le variabili esplicative che meglio spiegano la variabile dipendente. La segmentazione permette, cioè, di individuare le variabili esplicative rilevanti all interno di sottoinsiemi di unità via via più chiaramente definiti. 2) "Eliminazione" dell'informazione ridondante In subordine, l analisi di segmentazione è in grado di eliminare anche le variabili che ripetono l informazione contenuta in altre e le variabili che non sono rilevanti per spiegare la Y 3) Ricerca di interazioni fra variabili predittive. L interazione è l effetto che una combinazione di modalità ha sulla variabile dipendente e si può scoprire solo analizzando le distribuzioni condizionate (gerarchia delle variabili) 4) Produzione di regole di previsione o di classificazione. Sulla base del campione osservato si crea una regola di previsione del valore della var. dipendente di un nuovo soggetto per il quale si siano osservate le variabili esplicative. 5) Ricerca di relazioni non lineari o non monotone. Poiché alla base degli alberi di classificazione non c'è un modello che lega la var. dipendente alle esplicative, tale relazione può essere di forma qualsiasi. 14

15 LE FASI DI UNA PROCEDURA DI SEGMENTAZIONE 1. Scelta del tipo di segmentazione: binaria o multipla? 2. Dicotomizzazione delle variabili esplicative (suddivisione dello spazio delle variabili esplicative) 3. Scelta del criterio di suddivisione di ogni nodo t nei nodi figli equivale a scegliere una funzione criterio (misura della diversità tra gruppi) 4. Definizione di un criterio d arresto 5. Interpretazione dei risultati 6. Stima del costo di errata classificazione 7. Individuazione di una regola per l assegnazione di una delle J modalità della variabile dipendente ad ogni foglia e costruzione della regola d(x) per la classificazione dei nuovi casi 15

16 1. SEGMENTAZIONE BINARIA O MULTIPLA? La suddivisione multipla consente di suddividere un nodo in s sottoinsiemi, in un unico passo Può rivelarsi più efficiente nella costruzione dell albero poiché potenzialmente consente: un migliore adattamento alle relazioni fra variabili rispetto a quelle binarie (ad es. offre la possibilità di evidenziare relazioni non monotòne, fra la variabile dipendente e i predittori) di costruire alberi meno profondi e più sintetici, quindi più facilmente leggibili ed interpretabili. Tuttavia: Il problema principale della segmentazione multipla è costituito dai tempi di calcolo (il numero delle segmentazioni da esaminare aumenta molto velocemente) Inoltre, si dimostra che una segmentazione a tre modalità corrisponde a due segm. binarie. 2. SUDDIVISIONE DELLO SPAZIO DELLE VARIABILI ESPLICATIVE I criteri di partizione hanno come obiettivo quello di individuare la migliore suddivisione dello spazio X delle variabili esplicative ai fini della previsione della classe j della variabile dipendente è necessario identificare tutte le possibili partizioni fra cui scegliere quella ottimale. 16

17 Le possibili suddivisioni dipendono dalla natura qualitativa o quantitativa dei predittori. Ad es. per suddivisioni binarie: var. quantitativa: la divisione binaria delle unità statistiche avviene individuando un valore che rappresenta la soglia di ripartizione con riferimento a tale soglia si considerano due sottoinsiemi, da un lato quello comprendente tutti i valori inferiori o uguali al valore considerato e dall altro tutti i valori superiori a quello considerato In generale, se nel campione la variabile X s assume n valori distinti, i possibili split connessi a quella variabile saranno pari a n - 1. var. ordinale con m modalità: il numero di suddivisioni possibili sarà pari a m 1. Se, ad esempio, distinguiamo i giudizi riportati da n individui in una prova d esame secondo le modalità insufficiente, sufficiente, buono e ottimo, il numero di possibili split sarà pari a 3: (insufficiente), (sufficiente, buono, ottimo) (insufficiente, sufficiente), (buono, ottimo) (insufficiente, sufficiente, buono), (ottimo). var. nominale con m modalità: m 1 Poiché le modalità sono sconnesse, il numero delle possibili suddivisioni è pari a

18 Ad es., considerando la variabile forma giuridica di n aziende con modalità azienda individuale, società di persone, società di capitale, altro, il numero di possibili partizioni con due classi sarà pari a =7, cioè: (az. individuale, soc. di persone), (soc. di capitale, altro) (az. individuale, soc. di capitale), (soc. di persone, altro) (soc. di persone, soc. di capitale), (az. individuale, altro) (az. individuale, soc. di persone, soc. di capitale), (altro) (az. individuale, soc. di persone, altro), (soc. di capitale) (az. individuale, soc. di capitale, altro), (soc. di persone) (soc. di persone, soc. di capitale, altro), (az. individuale). Si noti che, per un numero elevato di variabili, il numero di possibili partizioni da considerare è molto ampio. 3. FUNZIONE CRITERIO PER LA SEGMENTAZIONE Si considerino n unità statistiche su cui sono state osservate p variabili che denoteremo come esplicative, X = (X 1, X 2, X 3,,X p ), ed una variabile Y, dipendente Obiettivo: ottenere nodi figli più puri dei nodi genitori, rispetto alla Y 18

19 Si ha riduzione dell impurità (disomogeneità) di un nodo se lo stesso viene suddiviso in sottoinsiemi che sono più omogenei al loro interno rispetto al gruppo di partenza. Valutazione della bontà della modalità di segmentazione s di un gruppo genitore, o nodo genitore, t si definisce una misura di IMPURITA Φ(s,t), detta funzione criterio della segmentazione, che misura la omogeneità (rispetto alla Y) all interno di ognuno dei gruppi figli generati dalla suddivisione s del gruppo genitore t. La massimizzazione della riduzione di Φ(s,t), Φ(s,t), sull insieme di tutte le segmentazioni considerate, porta a individuare la suddivisione che genera sottoinsiemi massimamente diversi fra loro, e quindi massimamente omogenei al loro interno. Varie sono le possibili definizioni di Φ(s,t). Un esempio ne è la devianza ENTRO. Data la Dev entro (Y) calcolata in t, tra le possibili suddivisioni di t si sceglie quella che determina la più piccola Dev entro (Y) associata alla suddivisione (equivale a massimizzare la Dev tra (Y) associata alla suddivisione)): Dev entro, t (Y) = Dev entro,s (Y) + Dev tra (Y) Φ(s,t) = Dev entro, t (Y) - Dev entro,s (Y) = Dev tra (Y) =max Ovviamente tale misura è adatta solo se Y è una var. quantitativa. 19

20 4. CRITERI PER L ARRESTO DEL PROCESSO DI SEGMENTAZIONE Se non si definisce una regola di stop, la segmentazione si blocca quando i nodi terminali contengono solo casi appartenenti alla stessa classe della variabile dipendente (eccessiva complessità nell interpretazione dell albero) Fra due regole di arresto si sceglie, ceteris paribus: quella che determina l albero di taglia minore, e quindi più facilmente leggibile quella che permette di distinguere nel modo più efficace possibile unità statistiche appartenenti a classi diverse. le due proprietà sono fra loro difficilmente conciliabili. A fronte di un numero elevato di variabili: l albero risulta, ovviamente, più complesso e quindi meno interpretabile può presentare nodi terminali costruiti sulla base di poche informazioni e ciò rende il risultato poco affidabile Nessuna regola di arresto riesce a garantire la giusta dimensione dell albero per il semplice motivo che non esiste una giusta dimensione 20

21 Tuttavia se le regole di arresto sono allentate, l albero risulta troppo ramificato, se, invece, sono restrittive si preclude la possibilità di individuare segmentazioni, magari rilevanti dal punto di vista esplicativo, che si sarebbero potute verificare ad un passo successivo. Nessun criterio è in grado di fornire da solo la migliore partizione conviene impiegare questi metodi congiuntamente, per cercare di ottenere una soluzione stabile e interpretabile. 1. DIMENSIONE MINIMA DEI GRUPPI per prevenire la formazione di gruppi di numerosità ridotta si impone una soglia sotto la quale la numerosità dei gruppi può non essere sufficiente per garantire l attendibilità delle stime 2. MINIMO DELLA CAPACITA ESPLICATIVA DELLA MIGLIORE SUDDIVISIONE AD OGNI PASSO Tale criterio richiede che la suddivisione contribuisca in modo significativo a spiegare la disomogeneità entro i gruppi riferita alla var. Y -- in caso contrario la procedura si arresta (equivale ad esempio a decremento significativo di impurità ) Ovviamente bisogna tenere conto del fatto che il contributo è direttamente proporzionale al numero di categorie e inversamente proporzionale alla numerosità campionaria 21

22 3. MINIMA DISOMOGENEITA DEL GRUPPO GENITORE muove dal presupposto che un gruppo genitore la cui misura di disomogeneità è inferiore a un certo valore si considera sufficientemente compatto, o puro, e non più divisibile 4. MASSIMO NUMERO DI PASSI DEL PROCESSO equivale a determinare il massimo numero di gruppi finali 5. PRUNING In alternativa alle regole di arresto della segmentazione, Breiman et al. (1984) propongono la procedura di sfoltimento o potatura (in inglese: pruning) di un albero: espansione dell albero fino alla sua dimensione massima, T max, e, con una procedura stepwise a ritroso, nell eliminazione dei rami meno utili: estrazione del sottoalbero ottimale da quello massimo (l argomento sarà approfondito nel seguito) 22

23 5. INTERPRETAZIONE DEI RISULTATI Output dell analisi di segmentazione è un diagramma ad albero su cui è buona norma riportare: - per ogni nodo, corrispondente ad un gruppo formato: il numero di unità e la distribuzione della variabile dipendente - per ogni ramo: le modalità e i predittori che determinano la suddivisione, e il guadagno portato dalla stessa Dall albero si possono, dunque, dedurre: o la numerosità dei nodi o le categorie del predittore in base al quale è stata effettuata la suddivisione o alcuni valori caratteristici della distribuzione di Y nel nodo genitore e nei nodi figli o il valore della funzione adottata per la segmentazione Inoltre si possono ottenere statistiche sintetiche sia dei gruppi creati che di quelli esaminati per scegliere la suddivisione migliore 23

24 Per verificare la Stabilità della soluzione ottenuta è possibile: 1. alterare casualmente un certo numero di dati, ripetere l analisi e verificare se e in quale misura il nuovo albero di segmentazione differisce da quello ottenuto nella prima fase 2. suddividere il campione osservato in due o più parti casualmente determinate e confrontare le configurazioni risultanti dall analisi con le stesse opzioni ( se n elevato ). Denominazione dei gruppi formati: in base alle categorie dei predittori che li hanno determinati. E necessario, tuttavia, tener conto del fatto che l ordine di selezione dei predittori non riflette necessariamente la loro importanza nella spiegazione della variabile dipendente Un predittore che non compare nell albero finale può, infatti: a) essere ininfluente nella spiegazione della variabile dipendente, b) potrebbe essere stato respinto dalla selezione di una variabile predittiva ad esso correlata (per ranghi), magari risultata migliore solo di poco al momento della segmentazione. Due predittori fortemente correlati, difficilmente saranno selezionati entrambi nella costruzione dell albero: la scelta dell uno o dell altro determinerà un albero completamente diverso. 24

25 6. IL COSTO DI ERRATA CLASSIFICAZIONE Data una certa regola d(x) di classificazione, costruita sulla base di del campione S di apprendimento (e definita su x), la misura utilizzata per valutare la capacità predittiva dell albero è il costo di errata classificazione La probabilità di classificare erroneamente un caso di classe i nella classe j mediante d è data da: Q( j i) = P d( X ) = j Y = i il costo atteso di errata classificazione dei casi di classe i sarà R (i) = C( j i) Q( j i) j in cui C( j i ) è il costo che si sostiene classificando erroneamente un caso di classe i nelle classe j 25

26 il costo di errata classificazione connesso al generico albero (e quindi al classificatore d ) sarà: R(T) = R( i) π ( i) con π ( i) prob. a priori che un caso venga classificato nella classe i R(T) varierà al variare della complessità dell albero: i a parità di semplicità della rappresentazione ad albero (in termini di numero di foglie) verrà selezionata la regola che consente di allocare correttamente la percentuale più elevata di unità statistiche Si consideri Ω un insieme artificiale (di dimensione non necessariamente finita) di unità statistiche avente le stesse caratteristiche di S il tasso di errata classificazione dovrebbe essere calcolato confrontando la reale classificazione delle osservazioni in Ω con quella prevista da d. Tale procedura non può essere applicata concretamente per cui si deve ricorrere ad una stima di R(T) che chiameremo Rˆ (T) e vi sono vari modi per ottenere tale stima 26

27 a. Stima di risostituzione R ˆr (T) Questa stima viene definita stima interna, cioè basata sulle n unità statistiche usate per costruire l albero Stimiamo Q( j i ) sulla base della frequenza delle osservazioni classificate erroneamente e quindi: Qˆ j i n n ( ) = r j i i in cui n j i è il numero di osservazioni di S appartenenti alla classe i e classificati in j ed n i è il numero di osservazioni di S appartenenti alla classe i La stima del costo atteso di errata classificazione dei casi di classe i sarà Rˆ i = C j i Qˆ j i r ( ) ( ) ( ) E la stima del costo di errata classificazione connesso al generico albero: j R ˆr (T) = i r ˆ R ( i ) π ( i ) r 27

28 Fornisce stime ottimistiche del costo di errata classificazione (lo sottostima) e l impiego di questo criterio per la selezione dell albero porta a scegliere sempre l albero T max Esempio ( i=classe effettiva, j=classe prevista): j=a j=b j=c tot i=a i=b i=c tot ˆ ( ) 10 /100 Q( c a ) = Q b a = ˆ 25 /100. Considerando costi di errata classificazione C( j i ) costanti, il costo atteso di errata classificazione dei casi di classe a sarà: Rˆ ( a ) = 10/ /100 = 35/100 =

29 analogamente: ˆ ( ) 5/87 2/ ( ) R b = + = Rˆ c = 4/32 + 8/32 = e la stima del costo di errata classificazione connesso al generico albero, per : π ( i) costanti: R ˆr (T) = 35/ / /32 = per π (1) = 100/ 219, π (2) = 87 / 219 e π (3) = 32/ Rˆ r ( T ) = + + = b. Stima mediante un campione test ( test sample ) Il campione S viene partizionato in maniera casuale in due sottocampioni S 1 e S 2 di numerosità, rispettivamente, n 1 e n 2, tali che S 1 S 2 = S e S 1 S 2 = (dove indica l insieme vuoto). 29

30 S 1 viene definito campione di apprendimento (learning sample) S 2 viene denominato campione test (testing sample) I due campioni possono considerarsi indipendenti. La regola d viene costruita utilizzando il campione d apprendimento e poi viene testata stimando R(T) sul campione test, per cui la stima del campione test, Rˆ (T), è data da: Stima della prob. di errata classificazione: ( ) 2 2 ts Qˆ j i = n n ts j i i in cui 2 n j i ed 2 n i assumono lo stesso significato precedente ma sono valutate sul campione test Stima del costo atteso di errata classificazione dei casi di classe i sarà Rˆ i = C j i Qˆ j i ts ( ) ( ) ( ) j ts ˆ = ˆ Stima del costo di errata classificazione connesso al generico albero: R ( T ) R ( i) π ( i) ts i ts 30

31 Le stime del tasso di errata classificazione così ottenute sono più affidabili rispetto alle R ˆ r ( T ), visto che usano dati esterni rispetto a quelli impiegati per la costruzione della regola di classificazione. Tuttavia: riduzione della numerosità del campione su cui viene costruito il classificatore d, per cui è auspicabile la sua applicazione solo se il campione S è di numerosità elevata. Generalmente la numerosità di S 2 è pari ad 1/3 della numerosità complessiva del campione. c. Stima mediante cross-validation (V-fold cross-validation) Metodo preferibile alla stima basata sul campione test, qualora la numerosità di S sia bassa. Innanzitutto, si costruisce l albero sulla base degli n elementi di S e quindi la stima del costo atteso di errata classificazione dell albero precedentemente costruito avviene nel seguente modo: il campione iniziale S viene ripartito casualmente in V > 2 sottocampioni S 1, S2,..., S v,..., SV di dimensione il più possibile prossima fra loro ( v) la regola di classificazione d ( x) viene costruita sul campione di apprendimento S - S (v), v = 1,2,,V.; lasciando ogni volta fuori un solo sottoinsieme S (v) da usare per il test di validità. 31

32 Se V è sufficientemente elevato, ogni regola 1/V), che è prossima alla dimensione di S. d (v) (x) viene costruita su un campione di dimensione n(1- Poiché, v, nessun elemento di S v è compreso in S - S v, è possibile stimare il costo di errata classificazione sulla base del campione test: Rˆ T = Rˆ i i v = 1,2,,V. ( v ) ( ) ts i ( v ) ( ) π ( ) ts Ogni classificatore d a R(T) (v) (x), v = 1,2,,V avrà un costo di errata classificazione ˆ v ts R ( ) ( ) T molto prossimo la stima del costo di errata classificazione dell albero T la ottengo facendo la media di tutti i tassi precedentemente ottenuti: 1 V ˆ ˆ ( v) R ( T ) = R ( T ) cv V v= 1 ts 32

MODELLI STATISTICI PER LA PREVISIONE DEL RISCHIO DI INSOLVENZA (O VALUTAZIONE DEL MERITO DI CREDITO)

MODELLI STATISTICI PER LA PREVISIONE DEL RISCHIO DI INSOLVENZA (O VALUTAZIONE DEL MERITO DI CREDITO) MODELLI STATISTICI PER LA PREVISIONE DEL RISCHIO DI INSOLVENZA (O VALUTAZIONE DEL MERITO DI CREDITO) I vari operatori del credito ricevono richieste di finanziamento da potenziali clienti (individui o

Dettagli

DATA MINING PER IL MARKETING

DATA MINING PER IL MARKETING DATA MINING PER IL MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso GLI ALBERI DI CLASSIFICAZIONE Algoritmi di classificazione Zani-Cerioli, Cap. XI CHAID: Chi-square Automatic Interaction

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it LA CLASSIFICAZIONE CAP IX, pp.367-457 Problema generale della scienza (Linneo, ) Analisi discriminante Cluster Analysis

Dettagli

Tecniche di DM: Alberi di decisione ed algoritmi di classificazione

Tecniche di DM: Alberi di decisione ed algoritmi di classificazione Tecniche di DM: Alberi di decisione ed algoritmi di classificazione Vincenzo Antonio Manganaro vincenzomang@virgilio.it, www.statistica.too.it Indice 1 Concetti preliminari: struttura del dataset negli

Dettagli

Analisi dei gruppi (Cluster analysis)

Analisi dei gruppi (Cluster analysis) Capitolo 10 Analisi dei gruppi (Cluster analysis) Partendo da un collettivo multidimensionale, l analisi dei gruppi mira ad assegnarne le unità a categorie non definite a priori, formando dei gruppi di

Dettagli

SISTEMI INFORMATIVI AZIENDALI

SISTEMI INFORMATIVI AZIENDALI SISTEMI INFORMATIVI AZIENDALI Prof. Andrea Borghesan venus.unive.it/borg borg@unive.it Ricevimento: Alla fine di ogni lezione Modalità esame: scritto 1 Data Mining. Introduzione La crescente popolarità

Dettagli

Analisi discriminante

Analisi discriminante Capitolo 6 Analisi discriminante L analisi statistica multivariata comprende un corpo di metodologie statistiche che permettono di analizzare simultaneamente misurazioni riguardanti diverse caratteristiche

Dettagli

Dott.ssa Caterina Gurrieri

Dott.ssa Caterina Gurrieri Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo

Dettagli

Analisi di Mercato. Facoltà di Economia. Analisi sui consumi. Metodo delle inchieste familiari. Metodo delle disponibilità globali

Analisi di Mercato. Facoltà di Economia. Analisi sui consumi. Metodo delle inchieste familiari. Metodo delle disponibilità globali Obiettivi delle aziende Analisi di Mercato Facoltà di Economia francesco mola Analisi sui consumi Conoscere i bisogni e i gusti dei consumatori Valutare la soddisfazione della clientela Lanciare nuovi

Dettagli

modo differenziato i clienti ricadenti nelle differenti classi. Tecnica RFM Questo approccio considera, oltre al valore di fatturato (contemplato

modo differenziato i clienti ricadenti nelle differenti classi. Tecnica RFM Questo approccio considera, oltre al valore di fatturato (contemplato Metodi quantitativi per il targeting Per le piccole e medie imprese il Data Base di Marketing (DBM) è di importanza cruciale nella segmentazione della clientela e individuazione del target di interesse

Dettagli

Data Mining in SAP. Alessandro Ciaramella

Data Mining in SAP. Alessandro Ciaramella UNIVERSITÀ DI PISA Corsi di Laurea Specialistica in Ingegneria Informatica per la Gestione d Azienda e Ingegneria Informatica Data Mining in SAP A cura di: Alessandro Ciaramella La Business Intelligence

Dettagli

Statistica descrittiva univariata

Statistica descrittiva univariata Statistica descrittiva univariata Elementi di statistica 2 1 Tavola di dati Una tavola (o tabella) di dati è l insieme dei caratteri osservati nel corso di un esperimento o di un rilievo. Solitamente si

Dettagli

Elementi di Statistica

Elementi di Statistica Elementi di Statistica Contenuti Contenuti di Statistica nel corso di Data Base Elementi di statistica descrittiva: media, moda, mediana, indici di dispersione Introduzione alle variabili casuali e alle

Dettagli

STUDIO DI SETTORE VG82U

STUDIO DI SETTORE VG82U ALLEGATO 18 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VG82U SERVIZI PUBBLICITARI, RELAZIONI PUBBLICHE E COMUNICAZIONE 862 CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio

Dettagli

Indice-sommario INDICE SOMMARIO CAPITOLO I LE MATRICI DEI DATI E LE ANALISI UNIVARIATE

Indice-sommario INDICE SOMMARIO CAPITOLO I LE MATRICI DEI DATI E LE ANALISI UNIVARIATE VII INDICE SOMMARIO Prefazione... xv CAPITOLO I LE MATRICI DEI DATI E LE ANALISI UNIVARIATE 1. Analisi dei dati e data mining... 1 2. La matrice dei dati «unità pervariabili»... 6 3. Idatiricavatidaun

Dettagli

STUDIO DI SETTORE VG87U

STUDIO DI SETTORE VG87U ALLEGATO 21 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VG87U CONSULENZA FINANZIARIA, AMMINISTRATIVO-GESTIONALE E AGENZIE DI INFORMAZIONI COMMERCIALI CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE

Dettagli

STUDIO DI SETTORE VG39U

STUDIO DI SETTORE VG39U A L L E G AT O 8 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VG39U A G E N Z I E D I M E D I A Z I O N E I M M O B I L I A R E CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio

Dettagli

STUDIO DI SETTORE VG70U

STUDIO DI SETTORE VG70U ALLEGATO 14 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VG70U SERVIZI DI PULIZIA CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio di settore attribuisce ai contribuenti un

Dettagli

Regressione non lineare con un modello neurale feedforward

Regressione non lineare con un modello neurale feedforward Reti Neurali Artificiali per lo studio del mercato Università degli studi di Brescia - Dipartimento di metodi quantitativi Marco Sandri (sandri.marco@gmail.com) Regressione non lineare con un modello neurale

Dettagli

STUDIO DI SETTORE VG82U

STUDIO DI SETTORE VG82U ALLEGATO 18 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VG82U SERVIZI PUBBLICITARI, RELAZIONI PUBBLICHE E COMUNICAZIONE CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio di

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Un breve riepilogo: caratteri, unità statistiche e collettivo UNITA STATISTICA: oggetto dell osservazione

Dettagli

Tecniche di DM: Link analysis e Association discovery

Tecniche di DM: Link analysis e Association discovery Tecniche di DM: Link analysis e Association discovery Vincenzo Antonio Manganaro vincenzomang@virgilio.it, www.statistica.too.it Indice 1 Architettura di un generico algoritmo di DM. 2 2 Regole di associazione:

Dettagli

Sommario. Capitolo 1 Impiego della statistica per la gestione dell azienda 1. Capitolo 2 Disponibilità e produzione delle informazioni statistiche 19

Sommario. Capitolo 1 Impiego della statistica per la gestione dell azienda 1. Capitolo 2 Disponibilità e produzione delle informazioni statistiche 19 Prefazione XI Capitolo 1 Impiego della statistica per la gestione dell azienda 1 1.1 Premessa 1 1.2 Il ruolo della statistica a supporto del processo decisionale del manager 3 1.3 L impiego della statistica

Dettagli

1. Aspetti di Marketing... 3 Obiettivi... 3 Esempi... 4 2. Aspetti Applicativi... 4 Obiettivi... 4. 3. Aspetti Prestazionali... 4

1. Aspetti di Marketing... 3 Obiettivi... 3 Esempi... 4 2. Aspetti Applicativi... 4 Obiettivi... 4. 3. Aspetti Prestazionali... 4 Pagina 2 1. Aspetti di Marketing... 3 Obiettivi... 3 Esempi... 4 2. Aspetti Applicativi... 4 Obiettivi... 4 Esempi... 4 3. Aspetti Prestazionali... 4 Obiettivi... 4 Esempi... 4 4. Gestione del Credito

Dettagli

ALLEGATO 7. Nota Tecnica e Metodologica SK16U

ALLEGATO 7. Nota Tecnica e Metodologica SK16U ALLEGATO 7 Nota Tecnica e Metodologica SK16U NOTA TECNICA E METODOLOGICA 1. CRITERI PER LA COSTRUZIONE DELLO STUDIO DI SETTORE Di seguito vengono esposti i criteri seguiti per la costruzione dello studio

Dettagli

Ricerca Operativa Branch-and-Bound per problemi di Programmazione Lineare Intera

Ricerca Operativa Branch-and-Bound per problemi di Programmazione Lineare Intera Ricerca Operativa Branch-and-Bound per problemi di Programmazione Lineare Intera L. De Giovanni AVVERTENZA: le note presentate di seguito non hanno alcuna pretesa di completezza, né hanno lo scopo di sostituirsi

Dettagli

STUDIO DI SETTORE UG53U

STUDIO DI SETTORE UG53U ALLEGATO 9 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE UG53U ORGANIZZAZIONE DI CONVEGNI ED ATTIVITA DI TRADUZIONI ED INTERPRETARIATO CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'obiettivo dell'applicazione

Dettagli

STUDIO DI SETTORE WK21U

STUDIO DI SETTORE WK21U ALLEGATO 12 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE WK21U ATTIVITÀ DEGLI STUDI ODONTOIATRICI CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio di settore attribuisce ai

Dettagli

STUDIO DI SETTORE VG55U

STUDIO DI SETTORE VG55U ALLEGATO 10 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VG55U SERVIZI DI POMPE FUNEBRI E ATTIVITÀ CONNESSE CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio di settore attribuisce

Dettagli

Statistica. L. Freddi. L. Freddi Statistica

Statistica. L. Freddi. L. Freddi Statistica Statistica L. Freddi Statistica La statistica è un insieme di metodi e tecniche per: raccogliere informazioni su un fenomeno sintetizzare l informazione (elaborare i dati) generalizzare i risultati ottenuti

Dettagli

STUDIO DI SETTORE SG42U

STUDIO DI SETTORE SG42U ALLEGATO 2 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE SG42U NOTA TECNICA E METODOLOGICA CRITERI PER LA COSTRUZIONE DELLO STUDIO DI SETTORE Di seguito vengono esposti i criteri seguiti per la costruzione

Dettagli

La Regressione Lineare

La Regressione Lineare La Regressione Lineare. Cos è l Analisi della Regressione Multipla? L analisi della regressione multipla è una tecnica statistica che può essere impiegata per analizzare la relazione tra una variabile

Dettagli

RICERCHE DI MERCATO. 5.6 Analisi Fattoriale (Componenti Principali)

RICERCHE DI MERCATO. 5.6 Analisi Fattoriale (Componenti Principali) RICERCHE DI MERCATO 5.6 Analisi Fattoriale (Componenti Principali) Prof. L. Neri Dip. di Economia Politica Premessa Come evidenziato in precedenza l approccio di segmentazione per omogeneità prevede la

Dettagli

STUDIO DI SETTORE WK04U

STUDIO DI SETTORE WK04U ALLEGATO 9 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE WK04U ATTIVITÀ DEGLI STUDI LEGALI CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio di settore attribuisce ai contribuenti

Dettagli

Copyright Esselibri S.p.A.

Copyright Esselibri S.p.A. CAPITOLO SETTIMO SEGMENTAZIONE E SCELTA DEI MERCATI OBIETTIVO Sommario: 1. Evoluzione del rapporto delle imprese con il mercato. - 2. La segmentazione del mercato. - 3. La segmentazione del mercato di

Dettagli

STUDIO DI SETTORE TK16U

STUDIO DI SETTORE TK16U ALLEGATO 7 NOTA TECNICA E METODOLOGICA EVOLUZIONE STUDIO DI SETTORE TK16U NOTA TECNICA E METODOLOGICA CRITERI PER LA COSTRUZIONE DELLO STUDIO DI SETTORE L evoluzione dello Studio di Settore ha il fine

Dettagli

Il concetto di correlazione

Il concetto di correlazione SESTA UNITA Il concetto di correlazione Fino a questo momento ci siamo interessati alle varie statistiche che ci consentono di descrivere la distribuzione dei punteggi di una data variabile e di collegare

Dettagli

Selezione avversa, screening e segnalazione

Selezione avversa, screening e segnalazione Selezione avversa, screening e segnalazione Il modello principale agente è uno strumento fondamentale per analizzare le relazioni economiche caratterizzate da problemi di asimmetrie informative un primo

Dettagli

STUDIO DI SETTORE VG91U

STUDIO DI SETTORE VG91U A L L E G AT O 3 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VG91U A T T I V I T À A U S I L I A R I E D E I S E R V I Z I F I N A N Z I A R I E A S S I C U R A T I V I CRITERI PER L EVOLUZIONE DELLO

Dettagli

Tecniche di analisi multivariata

Tecniche di analisi multivariata Tecniche di analisi multivariata Metodi che fanno riferimento ad un modello distributivo assunto per le osservazioni e alla base degli sviluppi inferenziali - tecniche collegate allo studio della dipendenza

Dettagli

EVOLUZIONE STUDIO DI SETTORE TG87U

EVOLUZIONE STUDIO DI SETTORE TG87U ALLEGATO 21 NOTA TECNICA E METODOLOGICA EVOLUZIONE STUDIO DI SETTORE TG87U NOTA TECNICA E METODOLOGICA CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L evoluzione dello Studio di Settore ha il fine di

Dettagli

NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE WK08U

NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE WK08U ALLEGATO 3 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE WK08U ATTIVITÀ DEI DISEGNATORI TECNICI CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio di settore attribuisce ai contribuenti

Dettagli

Reti neurali nel Data Mining, altre tecniche utilizzate nel DM e valutazione dei modelli.

Reti neurali nel Data Mining, altre tecniche utilizzate nel DM e valutazione dei modelli. Reti neurali nel Data Mining, altre tecniche utilizzate nel DM e valutazione dei modelli. Vincenzo Antonio Manganaro vincenzomang@virgilio.it, www.statistica.too.it Indice 1 Utilizzo di reti neurali nel

Dettagli

STUDIO DI SETTORE UG93U

STUDIO DI SETTORE UG93U A L L E G AT O 5 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE UG93U A T T I V I T À D E G L I S T U D I D I D E S I G N CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio di

Dettagli

EVOLUZIONE STUDIO DI SETTORE TG42U

EVOLUZIONE STUDIO DI SETTORE TG42U ALLEGATO 5 NOTA TECNICA E METODOLOGICA EVOLUZIONE STUDIO DI SETTORE TG42U NOTA TECNICA E METODOLOGICA CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L evoluzione dello Studio di Settore ha il fine di

Dettagli

Brugnaro Luca Boscaro Gianni (2009) 1

Brugnaro Luca Boscaro Gianni (2009) 1 STATISTICA PER LE PROFESSIONI SANITARIE - LIVELLO BASE Brugnaro Luca Boscaro Gianni (2009) 1 Perché la statistica Prendere decisioni Bibliografia non soddisfacente Richieste nuove conoscenze Raccolta delle

Dettagli

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2. Analisi multivariata Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Cercare di capire le relazioni

Dettagli

STUDIO DI SETTORE WG39U

STUDIO DI SETTORE WG39U A L L E G AT O 9 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE WG39U A G E N Z I E D I M E D I A Z I O N E I M M O B I L I A R E CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio

Dettagli

La scelta di portafoglio

La scelta di portafoglio La scelta di portafoglio 1 La scelta di portafoglio La scelta di portafoglio: il modo in cui un individuo decide di allocare la propria ricchezza tra più titoli Il mercato dei titoli è un istituzione che

Dettagli

STATISTICA ECONOMICA STATISTICA PER L ECONOMIA

STATISTICA ECONOMICA STATISTICA PER L ECONOMIA STATISTICA ECONOMICA STATISTICA PER L ECONOMIA a.a. 2009-2010 Facoltà di Economia, Università Roma Tre Archivio Statistico delle Imprese Attive (ASIA) L archivio è costituito dalle unità economiche che

Dettagli

STUDIO DI SETTORE SG91U

STUDIO DI SETTORE SG91U ALLEGATO 2 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE SG91U NOTA TECNICA E METODOLOGICA CRITERI PER LA COSTRUZIONE DELLO STUDIO DI SETTORE Di seguito vengono esposti i criteri seguiti per la costruzione

Dettagli

Concetti introduttivi

Concetti introduttivi Indice 1 Concetti introduttivi 3 1.1 Studi sperimentali e studi osservazionali..................... 3 1.2 Concetti iniziali: indipendenza fra eventi..................... 6 1.3 Indipendenza fra variabili

Dettagli

I Modelli della Ricerca Operativa

I Modelli della Ricerca Operativa Capitolo 1 I Modelli della Ricerca Operativa 1.1 L approccio modellistico Il termine modello è di solito usato per indicare una costruzione artificiale realizzata per evidenziare proprietà specifiche di

Dettagli

STUDIO DI SETTORE VK17U

STUDIO DI SETTORE VK17U A L L E G AT O 6 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VK17U P E R I T I I N D U S T R I A L I CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio di settore attribuisce

Dettagli

STUDIO DI SETTORE SG40U

STUDIO DI SETTORE SG40U ALLEGATO 1 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE SG40U NOTA TECNICA E METODOLOGICA CRITERI PER LA COSTRUZIONE DELLO STUDIO DI SETTORE Di seguito vengono esposti i criteri seguiti per la costruzione

Dettagli

STUDIO DI SETTORE WG55U

STUDIO DI SETTORE WG55U ALLEGATO 9 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE WG55U SERVIZI DI POMPE FUNEBRI E ATTIVITÀ CONNESSE CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio di settore attribuisce

Dettagli

LE DETERMINANTI DELLA REDDITIVITÀ DELLE SOCIETA OPERANTI NEL COMPARTO TESSILE ABBIGLIAMENTO IN ITALIA

LE DETERMINANTI DELLA REDDITIVITÀ DELLE SOCIETA OPERANTI NEL COMPARTO TESSILE ABBIGLIAMENTO IN ITALIA LE DETERMINANTI DELLA REDDITIVITÀ DELLE SOCIETA OPERANTI NEL COMPARTO TESSILE ABBIGLIAMENTO IN ITALIA Il metodo CVRP per l analisi delle maggiori società tessili italiane Stefano Cordero di Montezemolo

Dettagli

STUDIO DI SETTORE VG53U

STUDIO DI SETTORE VG53U ALLEGATO 8 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VG53U SERVIZI LINGUISTICI E ORGANIZZAZIONE DI CONVEGNI E FIERE CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio di settore

Dettagli

STUDIO DI SETTORE VM10U

STUDIO DI SETTORE VM10U ALLEGATO 8 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VM10U COMMERCIO DI PARTI E ACCESSORI DI AUTOVEICOLI E MOTOVEICOLI CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio di

Dettagli

4. Matrici e Minimi Quadrati

4. Matrici e Minimi Quadrati & C. Di Natale: Matrici e sistemi di equazioni di lineari Formulazione matriciale del metodo dei minimi quadrati Regressione polinomiale Regressione non lineare Cross-validazione e overfitting Regressione

Dettagli

STUDIO DI SETTORE SG87U

STUDIO DI SETTORE SG87U ALLEGATO 9 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE SG87U NOTA TECNICA E METODOLOGICA CRITERI PER LA COSTRUZIONE DELLO STUDIO DI SETTORE Di seguito vengono esposti i criteri seguiti per la costruzione

Dettagli

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice cap 0 Romane - def_layout 1 12/06/12 07.51 Pagina V Prefazione xiii Capitolo 1 Nozioni introduttive 1 1.1 Introduzione 1 1.2 Cenni storici sullo sviluppo della Statistica 2 1.3 La Statistica nelle scienze

Dettagli

STUDIO DI SETTORE UG41U

STUDIO DI SETTORE UG41U A L L E G AT O 1 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE UG41U R I C E R C H E D I M E R C A T O E S O N D A G G I D I O P I N I O N E CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione

Dettagli

RELAZIONE TRA DUE VARIABILI QUANTITATIVE

RELAZIONE TRA DUE VARIABILI QUANTITATIVE RELAZIONE TRA DUE VARIABILI QUANTITATIVE Quando si considerano due o più caratteri (variabili) si possono esaminare anche il tipo e l'intensità delle relazioni che sussistono tra loro. Nel caso in cui

Dettagli

ISTAT Servizio prezzi

ISTAT Servizio prezzi ISTAT Servizio prezzi Gli indici dei prezzi al consumo: aspetti relativi al sistema dei pesi e alla costruzione del paniere La determinazione del paniere dei prodotti e la metodologia di costruzione dei

Dettagli

STUDIO DI SETTORE VG89U

STUDIO DI SETTORE VG89U ALLEGATO 23 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VG89U SERVIZI DI FOTOCOPIATURA, PREPARAZIONE DI DOCUMENTI E ALTRE ATTIVITÀ DI SUPPORTO CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione

Dettagli

STUDIO DI SETTORE VG34U

STUDIO DI SETTORE VG34U ALLEGATO 5 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VG34U SERVIZI DI ACCONCIATURA CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio di settore attribuisce ai contribuenti

Dettagli

STUDIO DI SETTORE WK20U

STUDIO DI SETTORE WK20U ALLEGATO 5 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE WK20U ATTIVITÀ PROFESSIONALE SVOLTA DA PSICOLOGI CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio di settore attribuisce

Dettagli

IBM SPSS Decision Trees 19

IBM SPSS Decision Trees 19 IBM SPSS Decision Trees 19 Note: Before using this information and the product it supports, read the general information under Notices a pag. 114. This document contains proprietary information of SPSS

Dettagli

STUDIO DI SETTORE VG96U

STUDIO DI SETTORE VG96U ALLEGATO 2 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VG96U ALTRE ATTIVITÀ DI MANUTENZIONE AUTOVEICOLI E DI SOCCORSO STRADALE CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio

Dettagli

STATISTICA INFERENZIALE

STATISTICA INFERENZIALE STATISTICA INFERENZIALE Premessa importante: si ipotizza che il comportamento della popolazione rispetto ad una variabile casuale X viene descritto attraverso una funzione parametrica di probabilità p

Dettagli

STUDIO DI SETTORE VG68U

STUDIO DI SETTORE VG68U ALLEGATO 13 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VG68U TRASPORTO DI MERCI SU STRADA E SERVIZI DI TRASLOCO CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio di settore

Dettagli

STUDIO DI SETTORE UK27U

STUDIO DI SETTORE UK27U A L L E G AT O 2 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE UK27U A T T I V I T À P R O F E S S I O N A L I R E L A T I V E A L L I N F O R M A T I C A CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE

Dettagli

I modelli di scoring. Rischio e valore nelle banche. Andrea Resti Andrea Sironi. Misura, regolamentazione, gestione.

I modelli di scoring. Rischio e valore nelle banche. Andrea Resti Andrea Sironi. Misura, regolamentazione, gestione. Slides tratte da: Andrea Resti Andrea Sironi Rischio e valore nelle banche Misura, regolamentazione, gestione Egea, 2008 AGENDA I modelli di Scoring L analisi discriminante lineare Lo Z-score di Altman

Dettagli

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva Brugnaro Luca Progetto formativo complessivo Obiettivo: incrementare le competenze degli operatori sanitari nelle metodiche

Dettagli

Esercizi di Ricerca Operativa I

Esercizi di Ricerca Operativa I Esercizi di Ricerca Operativa I Dario Bauso, Raffaele Pesenti May 10, 2006 Domande Programmazione lineare intera 1. Gli algoritmi per la programmazione lineare continua possono essere usati per la soluzione

Dettagli

STUDIO DI SETTORE VM09A

STUDIO DI SETTORE VM09A ALLEGATO 6 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VM09A COMMERCIO DI AUTOVEICOLI CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio di settore attribuisce ai contribuenti

Dettagli

NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE WK16U

NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE WK16U ALLEGATO 4 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE WK16U AMMINISTRAZIONE DI CONDOMINI, GESTIONE DI BENI IMMOBILI PER CONTO TERZI E SERVIZI INTEGRATI DI GESTIONE AGLI EDIFICI CRITERI PER L EVOLUZIONE

Dettagli

Presentazione. Risorse Web. Metodi Statistici 1

Presentazione. Risorse Web. Metodi Statistici 1 I-XVI Romane_ 27-10-2004 14:25 Pagina VII Prefazione Risorse Web XI XIII XVII Metodi Statistici 1 Capitolo 1 Tecniche Statistiche 3 1.1 Probabilità, Variabili Casuali e Statistica 3 1.1.1 Introduzione

Dettagli

ALLEGATO 4. Nota Tecnica e Metodologica SG34U

ALLEGATO 4. Nota Tecnica e Metodologica SG34U ALLEGATO 4 Nota Tecnica e Metodologica SG34U 1 NOTA TECNICA E METODOLOGICA 1. CRITERI PER LA COSTRUZIONE DELLO STUDIO DI SETTORE Di seguito vengono esposti i criteri seguiti per la costruzione dello studio

Dettagli

STUDIO DI SETTORE UK24U

STUDIO DI SETTORE UK24U A L L E G AT O 6 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE UK24U C O N S U L E N Z A A G R A R I A F O R N I T A D A A G R O T E C N I C I E P E R I T I A G R A R I CRITERI PER L EVOLUZIONE DELLO STUDIO

Dettagli

CAPITOLO 10. Controllo di qualità. Strumenti per il controllo della qualità e la sua gestione

CAPITOLO 10. Controllo di qualità. Strumenti per il controllo della qualità e la sua gestione CAPITOLO 10 Controllo di qualità Strumenti per il controllo della qualità e la sua gestione STRUMENTI PER IL CONTROLLO E LA GESTIONE DELLA QUALITÀ - DIAGRAMMI CAUSA/EFFETTO - DIAGRAMMI A BARRE - ISTOGRAMMI

Dettagli

1. Richiami di Statistica. Stefano Di Colli

1. Richiami di Statistica. Stefano Di Colli 1. Richiami di Statistica Metodi Statistici per il Credito e la Finanza Stefano Di Colli Dati: Fonti e Tipi I dati sperimentali sono provenienti da un contesto delimitato, definito per rispettare le caratteristiche

Dettagli

STUDIO DI SETTORE WM05U

STUDIO DI SETTORE WM05U A L L E G AT O 15 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE WM05U C O M M E R C I O A L D E T T A G L I O D I A B B I G L I A M E N T O, C A L Z A T U R E, P E L L E T T E R I E E D A C C E S S O R

Dettagli

STUDIO DI SETTORE SG54U

STUDIO DI SETTORE SG54U ALLEGATO 5 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE SG54U NOTA TECNICA E METODOLOGICA CRITERI PER LA COSTRUZIONE DELLO STUDIO DI SETTORE Di seguito vengono esposti i criteri seguiti per la costruzione

Dettagli

STUDIO DI SETTORE VG52U

STUDIO DI SETTORE VG52U ALLEGATO 7 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VG52U CONFEZIONAMENTO DI GENERI ALIMENTARI E NON CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio di settore attribuisce

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva Università del Piemonte Orientale Corsi di Laurea Triennale Corso di Statistica e Biometria Introduzione e Statistica descrittiva Corsi di Laurea Triennale Corso di Statistica e Biometria: Introduzione

Dettagli

STUDIO DI SETTORE VG78U

STUDIO DI SETTORE VG78U ALLEGATO 15 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VG78U ATTIVITÀ DELLE AGENZIE DI VIAGGIO E TURISMO E DEI TOUR OPERATOR CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio

Dettagli

STUDIO DI SETTORE WK18U

STUDIO DI SETTORE WK18U ALLEGATO 11 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE WK18U ATTIVITÀ DEGLI STUDI DI ARCHITETTURA CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio di settore attribuisce

Dettagli

STUDIO DI SETTORE WG34U

STUDIO DI SETTORE WG34U ALLEGATO 5 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE WG34U SERVIZI DI ACCONCIATURA CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione dello studio di settore attribuisce ai contribuenti

Dettagli

STUDIO DI SETTORE VG41U

STUDIO DI SETTORE VG41U A L L E G AT O 1 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VG41U R I C E R C H E D I M E R C A T O E S O N D A G G I D I O P I N I O N E CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'applicazione

Dettagli

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici Test non parametrici Test non parametrici Il test T di Student per uno o per due campioni, il test F di Fisher per l'analisi della varianza, la correlazione, la regressione, insieme ad altri test di statistica

Dettagli

Abbiamo visto due definizioni del valore medio e della deviazione standard di una grandezza casuale, in funzione dalle informazioni disponibili:

Abbiamo visto due definizioni del valore medio e della deviazione standard di una grandezza casuale, in funzione dalle informazioni disponibili: Incertezze di misura Argomenti: classificazione delle incertezze; definizione di incertezza tipo e schemi di calcolo; schemi per il calcolo dell incertezza di grandezze combinate; confronto di misure affette

Dettagli

Capitolo 33: Beni Pubblici

Capitolo 33: Beni Pubblici Capitolo 33: Beni Pubblici 33.1: Introduzione In questo capitolo discutiamo le problematiche connesse alla fornitura privata dei beni pubblici, concludendo per l opportunità dell intervento pubblico in

Dettagli

STUDIO DI SETTORE WM48U

STUDIO DI SETTORE WM48U ALLEGATO 20 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE WM48U COMMERCIO AL DETTAGLIO DI PICCOLI ANIMALI DOMESTICI CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L applicazione dello studio di settore

Dettagli

Design of Experiments

Design of Experiments Design of Experiments Luigi Amedeo Bianchi 1 Introduzione Cominciamo spiegando cosa intendiamo con esperimento, ossia l investigare un processo cambiando i dati in ingresso, osservando i cambiamenti che

Dettagli

Elementi di Statistica descrittiva Parte I

Elementi di Statistica descrittiva Parte I Elementi di Statistica descrittiva Parte I Che cos è la statistica Metodo di studio di caratteri variabili, rilevabili su collettività. La statistica si occupa di caratteri (ossia aspetti osservabili)

Dettagli

STUDIO DI SETTORE VK18U

STUDIO DI SETTORE VK18U ALLEGATO 11 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE VK18U STUDI DI ARCHITETTURA CRITERI PER L EVOLUZIONE DELLO STUDIO DI SETTORE L'obiettivo dell'applicazione dello studio di settore è di attribuire

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it RIPASSO SULLE MATRICI 1 Addizione tra matrici Moltiplicazione Matrice diagonale Matrice identità Matrice trasposta

Dettagli

Analisi statistica di dati biomedici Analysis of biologicalsignals

Analisi statistica di dati biomedici Analysis of biologicalsignals Analisi statistica di dati biomedici Analysis of biologicalsignals II Parte Verifica delle ipotesi (a) Agostino Accardo (accardo@units.it) Master in Ingegneria Clinica LM in Neuroscienze 2013-2014 e segg.

Dettagli