MODELLI STATISTICI PER LA PREVISIONE DEL RISCHIO DI INSOLVENZA (O VALUTAZIONE DEL MERITO DI CREDITO)

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "MODELLI STATISTICI PER LA PREVISIONE DEL RISCHIO DI INSOLVENZA (O VALUTAZIONE DEL MERITO DI CREDITO)"

Transcript

1 MODELLI STATISTICI PER LA PREVISIONE DEL RISCHIO DI INSOLVENZA (O VALUTAZIONE DEL MERITO DI CREDITO) I vari operatori del credito ricevono richieste di finanziamento da potenziali clienti (individui o imprese) ed hanno la necessità di prendere una decisione circa la concessione o il rifiuto del credito. Obiettivo: l istituto di credito ha l esigenza di costruire una regola di classificazione che suddivida il collettivo dei richiedenti il credito in due classi - soggetti che potenzialmente rimborseranno il prestito ( sani ) e soggetti potenzialmente insolventi (insolvenza: incapacità di fronteggiare gli impegni assunti). L impiego di strumenti statistici a supporto del processo decisionale di concessione del credito si sostanzia nell attribuzione di un punteggio (score) ai soggetti che richiedono il credito punteggio che rappresenta le probabilità di rimborso. Sulla base di tale punteggio il soggetto sarà assegnato al gruppo dei potenzialmente sani o al gruppo dei potenzialmente insolventi La valutazione del rischio di insolvenza viene effettuata sulla base di informazioni individuali (le variabili predittive), osservate sia con riferimento ai soggetti sani sia a quelli insolventi, che riguardano caratteristiche socio-demografiche ed economiche con riferimento agli individui o caratteristiche legate allo stato di salute dell azienda (ad es. indici di bilancio). Unità 12 - Corso di Statistica aziendale (prof. M.R. Ferrante) Laurea Specialistica in Economia e Gestione Aziendale - Facoltà di Economia, Polo di Forlì, Università di Bologna

2 Vantaggi dell impiego di una procedura statistica: semplificazione ed automatizzazione oggettività ed omogeneità (o soggettività condivisa) riduzione del rischio di inadempienza e quindi dei contenziosi Concentriamoci sulla previsione del rischio di insolvenza aziendale. Tipologie di insolvenza: finanziaria problemi di liquidità, squilibri fra debiti a breve e a lungo termine, fra mezzi propri e mezzi di terzi. giuridica: il fallimento è la constatazione giuridica dell insolvenza finanziaria e rappresenta lo strumento col quale il legislatore dichiara la crisi aziendale e garantisce i diritti dei terzi. Cause principali interne ed esterne della crisi aziendale: squilibri ed inefficienze strutturali incapacità del management ciclo economico La valutazione della condizione economica, finanziaria e patrimoniale dell impresa può essere importante al fine di diagnosticare precocemente lo stato di crisi 2

3 I vari aspetti che definiscono lo stato di salute dell impresa possono essere valutati attraverso gli indici di bilancio (redditività, liquidità, solvibilità, leverage, dimensione, ecc.) L analisi basata sugli indici di bilancio costituisce l elemento fondamentale dell approccio più recente alla modellazione del rischio di insolvenza. Il contributo dell analisi statistica in questo senso può avere: 1) scopi descrittivi ed esplicativi di come si manifesta e si sviluppa una crisi aziendale; si tenta di risalire alle variabili che maggiormente sono responsabili dell insolvenza e quindi di identificare gli indici di bilancio che meglio possono diagnosticare precocemente stati di crisi 2) scopi predittivi: costruzione di una regola che consenta di assegnare unità nuove ad uno dei gruppi Perchè non si analizzano gli indici singolarmente? Gli indici sono espressione dei vari aspetti dello stato di salute di un azienda, aspetti che sono, ovviamente, interconnessi. Lo studio separato dei vari indici può condurre a difficoltà interpretative laddove indici diversi conducano a conclusioni diverse sullo stato di salute dell azienda. Perchè non si ricorre per costruire un indice sintetico - una media ponderata dei vari indici? Determinazione soggettiva dei pesi Mancata considerazione della correlazione tra indici 3

4 Mediante le tecniche di analisi statistica multivariata è possibile valutare la situazione economicofinanziaria complessiva dell impresa (vari indici) e di sintetizzare tale valutazione in modo da rendere possibile il confronto tra soggetti diversi Allo scopo di diagnosticare precocemente il rischio di insolvenza aziendale o di valutare, in generale, il merito di credito si possono usare le tecniche statistiche di tipo classificatorio. Tra le più frequentemente impiegate: l Analisi Discriminante (Centrale dei bilanci) gli Alberi di Classificazione Per costruire una regola classificatoria, occorre dunque: 1) stabilire la definizione dello stato di crisi, in riferimento: a) allo stato di crisi terminale (fallimento) b) ad uno degli stati di disequilibrio economico, finanziario o patrimoniale che precede il fallimento vero e proprio 2) disporre di dati retrospettivi, relativi ad indici di bilancio, per un gruppo di imprese sane e un gruppo di imprese in stato di crisi (o fallite al tempo corrente) 4

5 GLI ALBERI DI CLASSIFICAZIONE Considerato un campione di n unità statistiche su cui sono state osservate: La variabile dipendente Y (la base) che identifica a priori le classi Le variabili esplicative X=(X 1,X 2,, X s,,x p ) o predittori, impiegate per descrivere le caratteristiche delle classi identificate dalla base Le tecniche di partizione ricorsiva permettono di individuare l appartenenza di ogni unità statistica alle classi definite da Y, mediante suddivisione progressiva del collettivo in gruppi via via più omogenei al loro interno rispetto alla variabile dipendente Y, suddivisione effettuata sulla base di ciascuna X j Ttecniche di partizione ricorsiva (anche denominate di "Segmentazione gerarchica"): AID, CHAID, CART Segmentazione gerarchica (SG): Al primo passo del procedimento l insieme di n unità è suddiviso in due o più sottoinsiemi, definiti dalle modalità di una fra le variabili esplicative X. I passi successivi si realizzano suddividendo ulteriormente i sottoinsiemi ottenuti al passo precedente. 5

6 Ogni gruppo formato ad uno stadio del processo può essere cioè ulteriormente suddiviso negli stadi seguenti, fino a quando tale processo viene portato a termine con riferimento ad una prefissata regola di arresto (Criterio scissorio o top down) La segmentazione migliore, a questo e ad ogni passo successivo: viene individuata sulla base di una regola di ottimalità, che si realizza massimizzando l omogeneità entro/massimizzando l eterogeneità tra i sottoinsiemi, valutate secondo la variabile criterio (base). viene ricercata valutando tutte le segmentazioni possibili per ciascuna variabile esplicativa, e scegliendo la variabile che dà origine alla segmentazione migliore Schema che richiede notevoli potenzialità di calcolo : molti degli algoritmi di SG proposti di recente non erano realizzabili prima dello sviluppo dei calcolatori. 6

7 Un esempio di impiego degli alberi (credit scoring) (Zani, 2000) Informazioni relative a 323 clienti di un istituto di credito americano1, classificati in base alla loro affidabilità nel pagamento delle quote di un prestito elargito (variabile credit ranking, CR): la modalità affidabile è stata attribuita a coloro che hanno rispettato tutte le scadenze del prestito nella categoria non affidabile sono stati inseriti i clienti che non hanno rispettato le scadenze e sono quindi caduti in mora PAGA CREDIT RANKING Affidabile Non affidabile Totale <= sett. ETA > <= mens ETA > Totale Variabili esplicative: periodicità (mensile o settimanale) con la quale viene percepita la retribuzione (PAGA) età del cliente (ETA ). 1 I dati sono tratti dal file credit.sav collocato nella directory di lavoro del modulo AnswerTree del package SPSS. 7

8 I risultati delle tecniche di segmentazione vengono visualizzati attraverso strutture grafiche gerarchiche dette alberi : 8

9 L albero è costituito da un insieme finito di elementi, i nodi. Ogni nodo è un gruppo di unità, si riferisce a diversi stadi del processo di classificazione. Il rettangolo superiore rappresenta la radice (R) in cui è riportata la distribuzione delle freq. relative secondo la variabile CR (affidabile e non affidabile). Il nodo radice è un nodo disomogeneo al suo interno rispetto alla variabile obiettivo CREDIT RANKING perché racchiude tutti gli individui considerati, non classificati attraverso le variabili esplicative. I valori di soglia di una variabile che dividono le unità di un determinato nodo sono chiamati split (o suddivisioni). -- I rami sono le condizioni che hanno determinato la suddivisione. L insieme di tutti i nodi terminali di un albero viene indicato con il simbolo T ~. Le foglie sono i nodi terminali per i quali non si ritiene utile una ulteriore suddivisione. Nell esempio in esame i due sottoalberi sottostanti la radice sono formati distinguendo le due modalità del la variabile PAGA (mensile e settimanale): a sx clienti che percepiscono una retribuzione con cadenza settimanale a dx clienti che vengono retribuiti mensilmente; 9

10 Nell esperienza statunitense (alla quale si riferisce l esempio) una retribuzione settimanale è sintomo di un lavoro instabile, che può ripercuotersi negativamente sulla regolarità dei pagamenti alla banca nel nodo di sx compare una % elevata di clienti non affidabili nel nodo di dx la maggioranza dei clienti risulta affidabile Il valore % nella riga dei totali (riportato fra parentesi) fornisce il peso di un nodo nel livello in cui si trova Nelle foglie, punto di arrivo della rappresentazione: ulteriore classificazione delle unità in base alla variabile ETA utilizzando come split il valore 35 a sinistra ed il valore 25 a destra. La distinzione fra clienti affidabili e non affidabili ottenuta a livello finale è più netta rispetto alla classificazione di primo livello. In sintesi: Fra tutti i clienti che percepiscono una retribuzione settimanale, coloro con età superiore ai 35 anni sono, nella sostanza, affidabili, mentre il 90.51% dei clienti con età inferiore o pari a 35 anni è inaffidabile. 10

11 L ulteriore ripartizione dei clienti con retribuzione mensile individua i clienti con età superiore ai 25 anni che sono quasi totalmente affidabili (99,08%) Per età inferiore ai 25 anni, sempre per i clienti con paga mensile, si verifica una situazione incerta che potrebbe fare pensare alla necessità di una ulteriore variabile esplicativa per ottenere una distinzione più netta (51% vs 49%) Importante: tali considerazioni hanno conseguenze rilevanti in ambito previsivo la regola individuata può essere impiegata per classificare (nei gruppi definiti dalla var. obiettivo) nuove unità statistiche di cui si ignora la categoria di appartenenza (sulla base dei predittori). In base all esperienza, in futuro l istituto di credito sarà: disposto nella concessione di un credito ad un potenziale cliente con retribuzione mensile e con età superiore ai 25 anni più restio verso clienti giovani con retribuzione settimanale, a cui potrebbe chedere maggiori garanzie o non concedere il credito. 11

12 Ambiti economico-aziendali di impiego degli alberi credit scoring per valutare il rischio potenziale di una linea di credito; profiling per costruire i profili dei consumatori, degli utenti, dei clienti; direct marketing e comunicazione per scoprire quali gruppi risponderanno favorevolmente a determinate iniziative promozionali; previsione dello stato di crisi di un azienda qualità per scoprire le cause di difettosità di prodotti e servizi; database marketing per utilizzare appieno le informazioni sulla clientela effettiva e potenziale; Punto in comune con la cluster analysis gerarchica: nello stadio finale entrambe le procedure producono una partizione dell'insieme delle unità statistiche ( similarità con il dendrogramma ) Tuttavia, le differenze sono sostanziali: la SG richiede la conoscenza a priori della classe di appartenenza delle unità; scopo della cluster analysis è invece quello di costruire gruppi di unità statistiche partendo da un insieme indistinto 12

13 la SG viene operata utilizzando una sola variabile (selezionata fra tutte la variabili a disposizione) alla volta (si individua così una gerarchia di variabili), mentre la formazione dei gruppi nella cluster analysis viene fatta usando contemporaneamente tutte le variabili a disposizione la regola di classificazione individuata attraverso gli algoritmi di segmentazione viene usata per prevedere la collocazione di unità statistiche di cui non si conosce la classe di appartenenza Le tecniche di SG sono applicabili qualunque sia la natura della variabile dipendente: - qualitativa alberi di classificazione - quantitativa alberi di regressione (di cui non ci occuperemo) Le variabili esplicative possono essere su qualsiasi scala (se CART) In base al numero di sottoinsiemi che si possono formare ad ogni passo della procedura: Partizioni a due vie: segmentazione binaria Partizioni a un numero >2 vie: segmentazione multipla, o a K vie Negli ultimi tempi sono state proposti molti algoritmi di segmentazione, che si caratterizzano soprattutto per il diverso problema che affrontano, per la scelta dei criteri di analisi, per il modo in cui viene fatta la ricerca della migliore segmentazione (accenneremo a CART) 13

14 Obiettivi di un albero di classificazione 1) Individuazione delle determinanti della variabile dipendente L analisi individua le variabili esplicative che meglio spiegano la variabile dipendente. La segmentazione permette, cioè, di individuare le variabili esplicative rilevanti all interno di sottoinsiemi di unità via via più chiaramente definiti. 2) "Eliminazione" dell'informazione ridondante In subordine, l analisi di segmentazione è in grado di eliminare anche le variabili che ripetono l informazione contenuta in altre e le variabili che non sono rilevanti per spiegare la Y 3) Ricerca di interazioni fra variabili predittive. L interazione è l effetto che una combinazione di modalità ha sulla variabile dipendente e si può scoprire solo analizzando le distribuzioni condizionate (gerarchia delle variabili) 4) Produzione di regole di previsione o di classificazione. Sulla base del campione osservato si crea una regola di previsione del valore della var. dipendente di un nuovo soggetto per il quale si siano osservate le variabili esplicative. 5) Ricerca di relazioni non lineari o non monotone. Poiché alla base degli alberi di classificazione non c'è un modello che lega la var. dipendente alle esplicative, tale relazione può essere di forma qualsiasi. 14

15 LE FASI DI UNA PROCEDURA DI SEGMENTAZIONE 1. Scelta del tipo di segmentazione: binaria o multipla? 2. Dicotomizzazione delle variabili esplicative (suddivisione dello spazio delle variabili esplicative) 3. Scelta del criterio di suddivisione di ogni nodo t nei nodi figli equivale a scegliere una funzione criterio (misura della diversità tra gruppi) 4. Definizione di un criterio d arresto 5. Interpretazione dei risultati 6. Stima del costo di errata classificazione 7. Individuazione di una regola per l assegnazione di una delle J modalità della variabile dipendente ad ogni foglia e costruzione della regola d(x) per la classificazione dei nuovi casi 15

16 1. SEGMENTAZIONE BINARIA O MULTIPLA? La suddivisione multipla consente di suddividere un nodo in s sottoinsiemi, in un unico passo Può rivelarsi più efficiente nella costruzione dell albero poiché potenzialmente consente: un migliore adattamento alle relazioni fra variabili rispetto a quelle binarie (ad es. offre la possibilità di evidenziare relazioni non monotòne, fra la variabile dipendente e i predittori) di costruire alberi meno profondi e più sintetici, quindi più facilmente leggibili ed interpretabili. Tuttavia: Il problema principale della segmentazione multipla è costituito dai tempi di calcolo (il numero delle segmentazioni da esaminare aumenta molto velocemente) Inoltre, si dimostra che una segmentazione a tre modalità corrisponde a due segm. binarie. 2. SUDDIVISIONE DELLO SPAZIO DELLE VARIABILI ESPLICATIVE I criteri di partizione hanno come obiettivo quello di individuare la migliore suddivisione dello spazio X delle variabili esplicative ai fini della previsione della classe j della variabile dipendente è necessario identificare tutte le possibili partizioni fra cui scegliere quella ottimale. 16

17 Le possibili suddivisioni dipendono dalla natura qualitativa o quantitativa dei predittori. Ad es. per suddivisioni binarie: var. quantitativa: la divisione binaria delle unità statistiche avviene individuando un valore che rappresenta la soglia di ripartizione con riferimento a tale soglia si considerano due sottoinsiemi, da un lato quello comprendente tutti i valori inferiori o uguali al valore considerato e dall altro tutti i valori superiori a quello considerato In generale, se nel campione la variabile X s assume n valori distinti, i possibili split connessi a quella variabile saranno pari a n - 1. var. ordinale con m modalità: il numero di suddivisioni possibili sarà pari a m 1. Se, ad esempio, distinguiamo i giudizi riportati da n individui in una prova d esame secondo le modalità insufficiente, sufficiente, buono e ottimo, il numero di possibili split sarà pari a 3: (insufficiente), (sufficiente, buono, ottimo) (insufficiente, sufficiente), (buono, ottimo) (insufficiente, sufficiente, buono), (ottimo). var. nominale con m modalità: m 1 Poiché le modalità sono sconnesse, il numero delle possibili suddivisioni è pari a

18 Ad es., considerando la variabile forma giuridica di n aziende con modalità azienda individuale, società di persone, società di capitale, altro, il numero di possibili partizioni con due classi sarà pari a =7, cioè: (az. individuale, soc. di persone), (soc. di capitale, altro) (az. individuale, soc. di capitale), (soc. di persone, altro) (soc. di persone, soc. di capitale), (az. individuale, altro) (az. individuale, soc. di persone, soc. di capitale), (altro) (az. individuale, soc. di persone, altro), (soc. di capitale) (az. individuale, soc. di capitale, altro), (soc. di persone) (soc. di persone, soc. di capitale, altro), (az. individuale). Si noti che, per un numero elevato di variabili, il numero di possibili partizioni da considerare è molto ampio. 3. FUNZIONE CRITERIO PER LA SEGMENTAZIONE Si considerino n unità statistiche su cui sono state osservate p variabili che denoteremo come esplicative, X = (X 1, X 2, X 3,,X p ), ed una variabile Y, dipendente Obiettivo: ottenere nodi figli più puri dei nodi genitori, rispetto alla Y 18

19 Si ha riduzione dell impurità (disomogeneità) di un nodo se lo stesso viene suddiviso in sottoinsiemi che sono più omogenei al loro interno rispetto al gruppo di partenza. Valutazione della bontà della modalità di segmentazione s di un gruppo genitore, o nodo genitore, t si definisce una misura di IMPURITA Φ(s,t), detta funzione criterio della segmentazione, che misura la omogeneità (rispetto alla Y) all interno di ognuno dei gruppi figli generati dalla suddivisione s del gruppo genitore t. La massimizzazione della riduzione di Φ(s,t), Φ(s,t), sull insieme di tutte le segmentazioni considerate, porta a individuare la suddivisione che genera sottoinsiemi massimamente diversi fra loro, e quindi massimamente omogenei al loro interno. Varie sono le possibili definizioni di Φ(s,t). Un esempio ne è la devianza ENTRO. Data la Dev entro (Y) calcolata in t, tra le possibili suddivisioni di t si sceglie quella che determina la più piccola Dev entro (Y) associata alla suddivisione (equivale a massimizzare la Dev tra (Y) associata alla suddivisione)): Dev entro, t (Y) = Dev entro,s (Y) + Dev tra (Y) Φ(s,t) = Dev entro, t (Y) - Dev entro,s (Y) = Dev tra (Y) =max Ovviamente tale misura è adatta solo se Y è una var. quantitativa. 19

20 4. CRITERI PER L ARRESTO DEL PROCESSO DI SEGMENTAZIONE Se non si definisce una regola di stop, la segmentazione si blocca quando i nodi terminali contengono solo casi appartenenti alla stessa classe della variabile dipendente (eccessiva complessità nell interpretazione dell albero) Fra due regole di arresto si sceglie, ceteris paribus: quella che determina l albero di taglia minore, e quindi più facilmente leggibile quella che permette di distinguere nel modo più efficace possibile unità statistiche appartenenti a classi diverse. le due proprietà sono fra loro difficilmente conciliabili. A fronte di un numero elevato di variabili: l albero risulta, ovviamente, più complesso e quindi meno interpretabile può presentare nodi terminali costruiti sulla base di poche informazioni e ciò rende il risultato poco affidabile Nessuna regola di arresto riesce a garantire la giusta dimensione dell albero per il semplice motivo che non esiste una giusta dimensione 20

21 Tuttavia se le regole di arresto sono allentate, l albero risulta troppo ramificato, se, invece, sono restrittive si preclude la possibilità di individuare segmentazioni, magari rilevanti dal punto di vista esplicativo, che si sarebbero potute verificare ad un passo successivo. Nessun criterio è in grado di fornire da solo la migliore partizione conviene impiegare questi metodi congiuntamente, per cercare di ottenere una soluzione stabile e interpretabile. 1. DIMENSIONE MINIMA DEI GRUPPI per prevenire la formazione di gruppi di numerosità ridotta si impone una soglia sotto la quale la numerosità dei gruppi può non essere sufficiente per garantire l attendibilità delle stime 2. MINIMO DELLA CAPACITA ESPLICATIVA DELLA MIGLIORE SUDDIVISIONE AD OGNI PASSO Tale criterio richiede che la suddivisione contribuisca in modo significativo a spiegare la disomogeneità entro i gruppi riferita alla var. Y -- in caso contrario la procedura si arresta (equivale ad esempio a decremento significativo di impurità ) Ovviamente bisogna tenere conto del fatto che il contributo è direttamente proporzionale al numero di categorie e inversamente proporzionale alla numerosità campionaria 21

22 3. MINIMA DISOMOGENEITA DEL GRUPPO GENITORE muove dal presupposto che un gruppo genitore la cui misura di disomogeneità è inferiore a un certo valore si considera sufficientemente compatto, o puro, e non più divisibile 4. MASSIMO NUMERO DI PASSI DEL PROCESSO equivale a determinare il massimo numero di gruppi finali 5. PRUNING In alternativa alle regole di arresto della segmentazione, Breiman et al. (1984) propongono la procedura di sfoltimento o potatura (in inglese: pruning) di un albero: espansione dell albero fino alla sua dimensione massima, T max, e, con una procedura stepwise a ritroso, nell eliminazione dei rami meno utili: estrazione del sottoalbero ottimale da quello massimo (l argomento sarà approfondito nel seguito) 22

23 5. INTERPRETAZIONE DEI RISULTATI Output dell analisi di segmentazione è un diagramma ad albero su cui è buona norma riportare: - per ogni nodo, corrispondente ad un gruppo formato: il numero di unità e la distribuzione della variabile dipendente - per ogni ramo: le modalità e i predittori che determinano la suddivisione, e il guadagno portato dalla stessa Dall albero si possono, dunque, dedurre: o la numerosità dei nodi o le categorie del predittore in base al quale è stata effettuata la suddivisione o alcuni valori caratteristici della distribuzione di Y nel nodo genitore e nei nodi figli o il valore della funzione adottata per la segmentazione Inoltre si possono ottenere statistiche sintetiche sia dei gruppi creati che di quelli esaminati per scegliere la suddivisione migliore 23

24 Per verificare la Stabilità della soluzione ottenuta è possibile: 1. alterare casualmente un certo numero di dati, ripetere l analisi e verificare se e in quale misura il nuovo albero di segmentazione differisce da quello ottenuto nella prima fase 2. suddividere il campione osservato in due o più parti casualmente determinate e confrontare le configurazioni risultanti dall analisi con le stesse opzioni ( se n elevato ). Denominazione dei gruppi formati: in base alle categorie dei predittori che li hanno determinati. E necessario, tuttavia, tener conto del fatto che l ordine di selezione dei predittori non riflette necessariamente la loro importanza nella spiegazione della variabile dipendente Un predittore che non compare nell albero finale può, infatti: a) essere ininfluente nella spiegazione della variabile dipendente, b) potrebbe essere stato respinto dalla selezione di una variabile predittiva ad esso correlata (per ranghi), magari risultata migliore solo di poco al momento della segmentazione. Due predittori fortemente correlati, difficilmente saranno selezionati entrambi nella costruzione dell albero: la scelta dell uno o dell altro determinerà un albero completamente diverso. 24

25 6. IL COSTO DI ERRATA CLASSIFICAZIONE Data una certa regola d(x) di classificazione, costruita sulla base di del campione S di apprendimento (e definita su x), la misura utilizzata per valutare la capacità predittiva dell albero è il costo di errata classificazione La probabilità di classificare erroneamente un caso di classe i nella classe j mediante d è data da: Q( j i) = P d( X ) = j Y = i il costo atteso di errata classificazione dei casi di classe i sarà R (i) = C( j i) Q( j i) j in cui C( j i ) è il costo che si sostiene classificando erroneamente un caso di classe i nelle classe j 25

26 il costo di errata classificazione connesso al generico albero (e quindi al classificatore d ) sarà: R(T) = R( i) π ( i) con π ( i) prob. a priori che un caso venga classificato nella classe i R(T) varierà al variare della complessità dell albero: i a parità di semplicità della rappresentazione ad albero (in termini di numero di foglie) verrà selezionata la regola che consente di allocare correttamente la percentuale più elevata di unità statistiche Si consideri Ω un insieme artificiale (di dimensione non necessariamente finita) di unità statistiche avente le stesse caratteristiche di S il tasso di errata classificazione dovrebbe essere calcolato confrontando la reale classificazione delle osservazioni in Ω con quella prevista da d. Tale procedura non può essere applicata concretamente per cui si deve ricorrere ad una stima di R(T) che chiameremo Rˆ (T) e vi sono vari modi per ottenere tale stima 26

27 a. Stima di risostituzione R ˆr (T) Questa stima viene definita stima interna, cioè basata sulle n unità statistiche usate per costruire l albero Stimiamo Q( j i ) sulla base della frequenza delle osservazioni classificate erroneamente e quindi: Qˆ j i n n ( ) = r j i i in cui n j i è il numero di osservazioni di S appartenenti alla classe i e classificati in j ed n i è il numero di osservazioni di S appartenenti alla classe i La stima del costo atteso di errata classificazione dei casi di classe i sarà Rˆ i = C j i Qˆ j i r ( ) ( ) ( ) E la stima del costo di errata classificazione connesso al generico albero: j R ˆr (T) = i r ˆ R ( i ) π ( i ) r 27

28 Fornisce stime ottimistiche del costo di errata classificazione (lo sottostima) e l impiego di questo criterio per la selezione dell albero porta a scegliere sempre l albero T max Esempio ( i=classe effettiva, j=classe prevista): j=a j=b j=c tot i=a i=b i=c tot ˆ ( ) 10 /100 Q( c a ) = Q b a = ˆ 25 /100. Considerando costi di errata classificazione C( j i ) costanti, il costo atteso di errata classificazione dei casi di classe a sarà: Rˆ ( a ) = 10/ /100 = 35/100 =

29 analogamente: ˆ ( ) 5/87 2/ ( ) R b = + = Rˆ c = 4/32 + 8/32 = e la stima del costo di errata classificazione connesso al generico albero, per : π ( i) costanti: R ˆr (T) = 35/ / /32 = per π (1) = 100/ 219, π (2) = 87 / 219 e π (3) = 32/ Rˆ r ( T ) = + + = b. Stima mediante un campione test ( test sample ) Il campione S viene partizionato in maniera casuale in due sottocampioni S 1 e S 2 di numerosità, rispettivamente, n 1 e n 2, tali che S 1 S 2 = S e S 1 S 2 = (dove indica l insieme vuoto). 29

30 S 1 viene definito campione di apprendimento (learning sample) S 2 viene denominato campione test (testing sample) I due campioni possono considerarsi indipendenti. La regola d viene costruita utilizzando il campione d apprendimento e poi viene testata stimando R(T) sul campione test, per cui la stima del campione test, Rˆ (T), è data da: Stima della prob. di errata classificazione: ( ) 2 2 ts Qˆ j i = n n ts j i i in cui 2 n j i ed 2 n i assumono lo stesso significato precedente ma sono valutate sul campione test Stima del costo atteso di errata classificazione dei casi di classe i sarà Rˆ i = C j i Qˆ j i ts ( ) ( ) ( ) j ts ˆ = ˆ Stima del costo di errata classificazione connesso al generico albero: R ( T ) R ( i) π ( i) ts i ts 30

31 Le stime del tasso di errata classificazione così ottenute sono più affidabili rispetto alle R ˆ r ( T ), visto che usano dati esterni rispetto a quelli impiegati per la costruzione della regola di classificazione. Tuttavia: riduzione della numerosità del campione su cui viene costruito il classificatore d, per cui è auspicabile la sua applicazione solo se il campione S è di numerosità elevata. Generalmente la numerosità di S 2 è pari ad 1/3 della numerosità complessiva del campione. c. Stima mediante cross-validation (V-fold cross-validation) Metodo preferibile alla stima basata sul campione test, qualora la numerosità di S sia bassa. Innanzitutto, si costruisce l albero sulla base degli n elementi di S e quindi la stima del costo atteso di errata classificazione dell albero precedentemente costruito avviene nel seguente modo: il campione iniziale S viene ripartito casualmente in V > 2 sottocampioni S 1, S2,..., S v,..., SV di dimensione il più possibile prossima fra loro ( v) la regola di classificazione d ( x) viene costruita sul campione di apprendimento S - S (v), v = 1,2,,V.; lasciando ogni volta fuori un solo sottoinsieme S (v) da usare per il test di validità. 31

32 Se V è sufficientemente elevato, ogni regola 1/V), che è prossima alla dimensione di S. d (v) (x) viene costruita su un campione di dimensione n(1- Poiché, v, nessun elemento di S v è compreso in S - S v, è possibile stimare il costo di errata classificazione sulla base del campione test: Rˆ T = Rˆ i i v = 1,2,,V. ( v ) ( ) ts i ( v ) ( ) π ( ) ts Ogni classificatore d a R(T) (v) (x), v = 1,2,,V avrà un costo di errata classificazione ˆ v ts R ( ) ( ) T molto prossimo la stima del costo di errata classificazione dell albero T la ottengo facendo la media di tutti i tassi precedentemente ottenuti: 1 V ˆ ˆ ( v) R ( T ) = R ( T ) cv V v= 1 ts 32

Dott.ssa Caterina Gurrieri

Dott.ssa Caterina Gurrieri Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo

Dettagli

Elementi di Statistica

Elementi di Statistica Elementi di Statistica Contenuti Contenuti di Statistica nel corso di Data Base Elementi di statistica descrittiva: media, moda, mediana, indici di dispersione Introduzione alle variabili casuali e alle

Dettagli

Ricerca Operativa Branch-and-Bound per problemi di Programmazione Lineare Intera

Ricerca Operativa Branch-and-Bound per problemi di Programmazione Lineare Intera Ricerca Operativa Branch-and-Bound per problemi di Programmazione Lineare Intera L. De Giovanni AVVERTENZA: le note presentate di seguito non hanno alcuna pretesa di completezza, né hanno lo scopo di sostituirsi

Dettagli

Analisi statistica di dati biomedici Analysis of biologicalsignals

Analisi statistica di dati biomedici Analysis of biologicalsignals Analisi statistica di dati biomedici Analysis of biologicalsignals II Parte Verifica delle ipotesi (a) Agostino Accardo (accardo@units.it) Master in Ingegneria Clinica LM in Neuroscienze 2013-2014 e segg.

Dettagli

4.2. IL TEST F DI FISHER O ANALISI DELLA VARIANZA (ANOVA)

4.2. IL TEST F DI FISHER O ANALISI DELLA VARIANZA (ANOVA) 4.2. IL TEST F DI FISHER O ANALISI DELLA VARIANZA (ANOVA) L analisi della varianza è un metodo sviluppato da Fisher, che è fondamentale per l interpretazione statistica di molti dati biologici ed è alla

Dettagli

RELAZIONE TRA DUE VARIABILI QUANTITATIVE

RELAZIONE TRA DUE VARIABILI QUANTITATIVE RELAZIONE TRA DUE VARIABILI QUANTITATIVE Quando si considerano due o più caratteri (variabili) si possono esaminare anche il tipo e l'intensità delle relazioni che sussistono tra loro. Nel caso in cui

Dettagli

NOTE METODOLOGICHE PRINCIPALI MARGINI ECONOMICI - SOCIETA INDUSTRIALI, COMMERCIALI E PLURIENNALI

NOTE METODOLOGICHE PRINCIPALI MARGINI ECONOMICI - SOCIETA INDUSTRIALI, COMMERCIALI E PLURIENNALI NOTE METODOLOGICHE PRINCIPALI MARGINI ECONOMICI - SOCIETA INDUSTRIALI, COMMERCIALI E PLURIENNALI Valore aggiunto Valore della produzione - Consumi di materie - Spese generali + Accantonamenti Mol (Valore

Dettagli

Flusso a costo minimo e simplesso su reti

Flusso a costo minimo e simplesso su reti Flusso a costo minimo e simplesso su reti La particolare struttura di alcuni problemi di PL può essere talvolta utilizzata per la progettazione di tecniche risolutive molto più efficienti dell algoritmo

Dettagli

STUDIO DI SETTORE SM43U

STUDIO DI SETTORE SM43U ALLEGATO 3 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE SM43U NOTA TECNICA E METODOLOGICA CRITERI PER LA COSTRUZIONE DELLO STUDIO DI SETTORE Di seguito vengono esposti i criteri seguiti per la costruzione

Dettagli

Compito di SISTEMI E MODELLI. 19 Febbraio 2015

Compito di SISTEMI E MODELLI. 19 Febbraio 2015 Compito di SISTEMI E MODELLI 9 Febbraio 5 Non é ammessa la consultazione di libri o quaderni. Le risposte vanno giustificate. Saranno rilevanti per la valutazione anche l ordine e la chiarezza di esposizione.

Dettagli

Analisi delle Corrispondenze Multiple Prof. Roberto Fantaccione

Analisi delle Corrispondenze Multiple Prof. Roberto Fantaccione Analisi delle Corrispondenze Multiple Prof. Roberto Fantaccione Consideriamo il nostro dataset formato da 468 individui e 1 variabili nominali costituite dalle seguenti modalità : colonna D: Age of client

Dettagli

ANALISI DEI DATI CON SPSS

ANALISI DEI DATI CON SPSS STRUMENTI E METODI PER LE SCIENZE SOCIALI Claudio Barbaranelli ANALISI DEI DATI CON SPSS II. LE ANALISI MULTIVARIATE ISBN 978-88-7916-315-9 Copyright 2006 Via Cervignano 4-20137 Milano Catalogo: www.lededizioni.com

Dettagli

EQUAZIONI E DISEQUAZIONI POLINOMIALI E COLLEGAMENTI CON LA GEOMETRIA ELEMENTARE

EQUAZIONI E DISEQUAZIONI POLINOMIALI E COLLEGAMENTI CON LA GEOMETRIA ELEMENTARE EQUAZIONI E DISEQUAZIONI POLINOMIALI E COLLEGAMENTI CON LA GEOMETRIA ELEMENTARE 1. EQUAZIONI Definizione: un equazione è un uguaglianza tra due espressioni letterali (cioè in cui compaiono numeri, lettere

Dettagli

Accuratezza di uno strumento

Accuratezza di uno strumento Accuratezza di uno strumento Come abbiamo già accennato la volta scora, il risultato della misurazione di una grandezza fisica, qualsiasi sia lo strumento utilizzato, non è mai un valore numerico X univocamente

Dettagli

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA ESERCIZI SVOLTI PER LA PROVA DI STATISTICA Stefania Naddeo (anno accademico 4/5) INDICE PARTE PRIMA: STATISTICA DESCRITTIVA. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE. VALORI CARATTERISTICI

Dettagli

Analisi dei requisiti e casi d uso

Analisi dei requisiti e casi d uso Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello del sistema 4 2.1 Requisiti hardware........................ 4 2.2 Requisiti software.........................

Dettagli

Parte 2. Determinante e matrice inversa

Parte 2. Determinante e matrice inversa Parte. Determinante e matrice inversa A. Savo Appunti del Corso di Geometria 013-14 Indice delle sezioni 1 Determinante di una matrice, 1 Teorema di Cramer (caso particolare), 3 3 Determinante di una matrice

Dettagli

1. Intorni di un punto. Punti di accumulazione.

1. Intorni di un punto. Punti di accumulazione. 1. Intorni di un punto. Punti di accumulazione. 1.1. Intorni circolari. Assumiamo come distanza di due numeri reali x e y il numero non negativo x y (che, come sappiamo, esprime la distanza tra i punti

Dettagli

Capitolo 9: PROPAGAZIONE DEGLI ERRORI

Capitolo 9: PROPAGAZIONE DEGLI ERRORI Capitolo 9: PROPAGAZIOE DEGLI ERRORI 9.1 Propagazione degli errori massimi ella maggior parte dei casi le grandezze fisiche vengono misurate per via indiretta. Il valore della grandezza viene cioè dedotto

Dettagli

UTILIZZO DEI METODI MULTICRITERI O MULTIOBIETTIVI NELL OFFERTA ECONOMICAMENTE PIÙ VANTAGGIOSA. Filippo Romano 1

UTILIZZO DEI METODI MULTICRITERI O MULTIOBIETTIVI NELL OFFERTA ECONOMICAMENTE PIÙ VANTAGGIOSA. Filippo Romano 1 UTILIZZO DEI METODI MULTICRITERI O MULTIOBIETTIVI NELL OFFERTA ECONOMICAMENTE PIÙ VANTAGGIOSA Filippo Romano 1 1. Introduzione 2. Analisi Multicriteri o Multiobiettivi 2.1 Formule per l attribuzione del

Dettagli

RAPPRESENTAZIONE BINARIA DEI NUMERI. Andrea Bobbio Anno Accademico 1996-1997

RAPPRESENTAZIONE BINARIA DEI NUMERI. Andrea Bobbio Anno Accademico 1996-1997 1 RAPPRESENTAZIONE BINARIA DEI NUMERI Andrea Bobbio Anno Accademico 1996-1997 Numeri Binari 2 Sistemi di Numerazione Il valore di un numero può essere espresso con diverse rappresentazioni. non posizionali:

Dettagli

Parte 3. Rango e teorema di Rouché-Capelli

Parte 3. Rango e teorema di Rouché-Capelli Parte 3. Rango e teorema di Rouché-Capelli A. Savo Appunti del Corso di Geometria 203-4 Indice delle sezioni Rango di una matrice, 2 Teorema degli orlati, 3 3 Calcolo con l algoritmo di Gauss, 6 4 Matrici

Dettagli

VC-dimension: Esempio

VC-dimension: Esempio VC-dimension: Esempio Quale è la VC-dimension di. y b = 0 f() = 1 f() = 1 iperpiano 20? VC-dimension: Esempio Quale è la VC-dimension di? banale. Vediamo cosa succede con 2 punti: 21 VC-dimension: Esempio

Dettagli

Minimizzazione di Reti Logiche Combinatorie Multi-livello

Minimizzazione di Reti Logiche Combinatorie Multi-livello Minimizzazione di Reti Logiche Combinatorie Multi-livello Maurizio Palesi Maurizio Palesi 1 Introduzione Obiettivo della sintesi logica: ottimizzazione delle cifre di merito area e prestazioni Prestazioni:

Dettagli

1 n. Intero frazionato. Frazione

1 n. Intero frazionato. Frazione Consideriamo un intero, prendiamo un rettangolo e dividiamolo in sei parti uguali, ciascuna di queste parti rappresenta un sesto del rettangolo, cioè una sola delle sei parti uguali in cui è stato diviso.

Dettagli

GLI INDICI DI BILANCIO PER LE ANALISI FINANZIARIE

GLI INDICI DI BILANCIO PER LE ANALISI FINANZIARIE GLI INDICI DI BILANCIO PER LE ANALISI FINANZIARIE GLI INDICI DI BILANCIO Gli indici sono rapporti tra grandezze economiche, patrimoniali e finanziarie contenute nello stato patrimoniale e nel conto economico

Dettagli

Sistemi di supporto alle decisioni Ing. Valerio Lacagnina

Sistemi di supporto alle decisioni Ing. Valerio Lacagnina Cosa è il DSS L elevato sviluppo dei personal computer, delle reti di calcolatori, dei sistemi database di grandi dimensioni, e la forte espansione di modelli basati sui calcolatori rappresentano gli sviluppi

Dettagli

4. Operazioni elementari per righe e colonne

4. Operazioni elementari per righe e colonne 4. Operazioni elementari per righe e colonne Sia K un campo, e sia A una matrice m n a elementi in K. Una operazione elementare per righe sulla matrice A è una operazione di uno dei seguenti tre tipi:

Dettagli

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi : Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Analisi dei dati quantitativi : Confronto tra due medie Università del Piemonte Orientale Corso di laurea in

Dettagli

Matematica B - a.a 2006/07 p. 1

Matematica B - a.a 2006/07 p. 1 Matematica B - a.a 2006/07 p. 1 Definizione 1. Un sistema lineare di m equazioni in n incognite, in forma normale, è del tipo a 11 x 1 + + a 1n x n = b 1 a 21 x 1 + + a 2n x n = b 2 (1) = a m1 x 1 + +

Dettagli

Business Intelligence. Il data mining in

Business Intelligence. Il data mining in Business Intelligence Il data mining in L'analisi matematica per dedurre schemi e tendenze dai dati storici esistenti. Revenue Management. Previsioni di occupazione. Marketing. Mail diretto a clienti specifici.

Dettagli

EQUAZIONI non LINEARI

EQUAZIONI non LINEARI EQUAZIONI non LINEARI Francesca Pelosi Dipartimento di Matematica, Università di Roma Tor Vergata CALCOLO NUMERICO e PROGRAMMAZIONE http://www.mat.uniroma2.it/ pelosi/ EQUAZIONI non LINEARI p.1/44 EQUAZIONI

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 4. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 4. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 4 Materiale di supporto per le lezioni. Non sostituisce il libro di testo Dipendenza di un carattere QUANTITATIVO da un carattere QUALITATIVO

Dettagli

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della RELAZIONE TRA VARIABILI QUANTITATIVE Lezione 7 a Accade spesso nella ricerca in campo biomedico, così come in altri campi della scienza, di voler studiare come il variare di una o più variabili (variabili

Dettagli

Esercizi Capitolo 5 - Alberi

Esercizi Capitolo 5 - Alberi Esercizi Capitolo 5 - Alberi Alberto Montresor 19 Agosto, 2014 Alcuni degli esercizi che seguono sono associati alle rispettive soluzioni. Se il vostro lettore PDF lo consente, è possibile saltare alle

Dettagli

Dimensione di uno Spazio vettoriale

Dimensione di uno Spazio vettoriale Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione

Dettagli

STATISTICA 1 ESERCITAZIONE 1 CLASSIFICAZIONE DELLE VARIABILI CASUALI

STATISTICA 1 ESERCITAZIONE 1 CLASSIFICAZIONE DELLE VARIABILI CASUALI STATISTICA 1 ESERCITAZIONE 1 Dott. Giuseppe Pandolfo 30 Settembre 2013 Popolazione statistica: insieme degli elementi oggetto dell indagine statistica. Unità statistica: ogni elemento della popolazione

Dettagli

STATISTICA (A-K) a.a. 2007-08 Prof.ssa Mary Fraire Test di STATISTICA DESCRITTIVA Esonero del 2007

STATISTICA (A-K) a.a. 2007-08 Prof.ssa Mary Fraire Test di STATISTICA DESCRITTIVA Esonero del 2007 A STATISTICA (A-K) a.a. 007-08 Prof.ssa Mary Fraire Test di STATISTICA DESCRITTIVA Esonero del 007 STESS N.O. RD 00 GORU N.O. RD 006 ) La distribuzione del numero degli occupati (valori x 000) in una provincia

Dettagli

Quando A e B coincidono una coppia ordinata é determinata anche dalla loro posizione.

Quando A e B coincidono una coppia ordinata é determinata anche dalla loro posizione. Grafi ed Alberi Pag. /26 Grafi ed Alberi In questo capitolo richiameremo i principali concetti di due ADT che ricorreranno puntualmente nel corso della nostra trattazione: i grafi e gli alberi. Naturale

Dettagli

CS. Cinematica dei sistemi

CS. Cinematica dei sistemi CS. Cinematica dei sistemi Dopo aver esaminato la cinematica del punto e del corpo rigido, che sono gli schemi più semplificati con cui si possa rappresentare un corpo, ci occupiamo ora dei sistemi vincolati.

Dettagli

+ / operatori di confronto (espressioni logiche/predicati) / + 5 3 9 = > < Pseudo codice. Pseudo codice

+ / operatori di confronto (espressioni logiche/predicati) / + 5 3 9 = > < Pseudo codice. Pseudo codice Pseudo codice Pseudo codice Paolo Bison Fondamenti di Informatica A.A. 2006/07 Università di Padova linguaggio testuale mix di linguaggio naturale ed elementi linguistici con sintassi ben definita e semantica

Dettagli

Rischio impresa. Rischio di revisione

Rischio impresa. Rischio di revisione Guida alla revisione legale PIANIFICAZIONE del LAVORO di REVISIONE LEGALE dei CONTI Formalizzazione delle attività da svolgere nelle carte di lavoro: determinazione del rischio di revisione, calcolo della

Dettagli

razionali Figura 1. Rappresentazione degli insiemi numerici Numeri reali algebrici trascendenti frazionari decimali finiti

razionali Figura 1. Rappresentazione degli insiemi numerici Numeri reali algebrici trascendenti frazionari decimali finiti 4. Insiemi numerici 4.1 Insiemi numerici Insieme dei numeri naturali = {0,1,,3,,} Insieme dei numeri interi relativi = {..., 3,, 1,0, + 1, +, + 3, } Insieme dei numeri razionali n 1 1 1 1 = : n, m \{0}

Dettagli

Principal Component Analysis (PCA)

Principal Component Analysis (PCA) Principal Component Analysis (PCA) Come evidenziare l informazione contenuta nei dati S. Marsili-Libelli: Calibrazione di Modelli Dinamici pag. Perche PCA? E un semplice metodo non-parametrico per estrarre

Dettagli

Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Processi casuali A.A. 2007-08. Alberto Perotti, Roberto Garello

Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Processi casuali A.A. 2007-08. Alberto Perotti, Roberto Garello Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Processi casuali A.A. 2007-08 Alberto Perotti, Roberto Garello DELEN-DAUIN Processi casuali Sono modelli probabilistici

Dettagli

Diaz - Appunti di Statistica - AA 2001/2002 - edizione 29/11/01 Cap. 3 - Pag. 1 = 1

Diaz - Appunti di Statistica - AA 2001/2002 - edizione 29/11/01 Cap. 3 - Pag. 1 = 1 Diaz - Appunti di Statistica - AA 2001/2002 - edizione 29/11/01 Cap. 3 - Pag. 1 Capitolo 3. L'analisi della varianza. Il problema dei confronti multipli. La soluzione drastica di Bonferroni ed il test

Dettagli

Algoritmo euclideo, massimo comun divisore ed equazioni diofantee

Algoritmo euclideo, massimo comun divisore ed equazioni diofantee Algoritmo euclideo, massimo comun divisore ed equazioni diofantee Se a e b sono numeri interi, si dice che a divide b, in simboli: a b, se e solo se esiste c Z tale che b = ac. Si può subito notare che:

Dettagli

CHECK UP 2012 La competitività dell agroalimentare italiano

CHECK UP 2012 La competitività dell agroalimentare italiano Rapporto annuale ISMEA Rapporto annuale 2012 5. La catena del valore IN SINTESI La catena del valore elaborata dall Ismea ha il fine di quantificare la suddivisione del valore dei beni prodotti dal settore

Dettagli

MINIMI QUADRATI. REGRESSIONE LINEARE

MINIMI QUADRATI. REGRESSIONE LINEARE MINIMI QUADRATI. REGRESSIONE LINEARE Se il coefficiente di correlazione r è prossimo a 1 o a -1 e se il diagramma di dispersione suggerisce una relazione di tipo lineare, ha senso determinare l equazione

Dettagli

Principio contabile internazionale n. 12 Imposte sul reddito

Principio contabile internazionale n. 12 Imposte sul reddito Principio contabile internazionale n. 12 Imposte sul reddito Finalità La finalità del presente Principio è quella di definire il trattamento contabile delle imposte sul reddito. L aspetto principale della

Dettagli

errore I = numero soggetti (I = 4) K = numero livelli tratt. (K = 3) popolazione varianza dovuta ai soggetti trattamento

errore I = numero soggetti (I = 4) K = numero livelli tratt. (K = 3) popolazione varianza dovuta ai soggetti trattamento Analisi della varianza a una via a misure ripetute (Anova con 1 fattore within) modello strutturale dell'analisi della varianza a misure ripetute con 1 fattore: y = μ ik 0 +π i +α k + ik ε ik interazione

Dettagli

La distribuzione Normale. La distribuzione Normale

La distribuzione Normale. La distribuzione Normale La Distribuzione Normale o Gaussiana è la distribuzione più importante ed utilizzata in tutta la statistica La curva delle frequenze della distribuzione Normale ha una forma caratteristica, simile ad una

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Test d ipotesi sul valor medio e test χ 2 di adattamento Prof. Livia De Giovanni statistica@dis.uniroma1.it Esercizio 1 Si supponga che il diametro degli anelli metallici prodotti

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

PRINCIPI BASILARI DI ELETTROTECNICA

PRINCIPI BASILARI DI ELETTROTECNICA PRINCIPI BASILARI DI ELETTROTECNICA Prerequisiti - Impiego di Multipli e Sottomultipli nelle equazioni - Equazioni lineari di primo grado e capacità di ricavare le formule inverse - nozioni base di fisica

Dettagli

Alberi binari. Ilaria Castelli castelli@dii.unisi.it A.A. 2009/2010. Università degli Studi di Siena Dipartimento di Ingegneria dell Informazione

Alberi binari. Ilaria Castelli castelli@dii.unisi.it A.A. 2009/2010. Università degli Studi di Siena Dipartimento di Ingegneria dell Informazione Alberi binari Ilaria Castelli castelli@dii.unisi.it Università degli Studi di Siena Dipartimento di Ingegneria dell Informazione A.A. 2009/2010 I. Castelli Alberi binari, A.A. 2009/2010 1/20 Alberi binari

Dettagli

SCHEDA DI PROGRAMMAZIONE DELLE ATTIVITA EDUCATIVE DIDATTICHE. Disciplina: Matematica Classe: 5A sia A.S. 2014/15 Docente: Rosito Franco

SCHEDA DI PROGRAMMAZIONE DELLE ATTIVITA EDUCATIVE DIDATTICHE. Disciplina: Matematica Classe: 5A sia A.S. 2014/15 Docente: Rosito Franco Disciplina: Matematica Classe: 5A sia A.S. 2014/15 Docente: Rosito Franco ANALISI DI SITUAZIONE - LIVELLO COGNITIVO La classe ha dimostrato fin dal primo momento grande attenzione e interesse verso gli

Dettagli

Principal Component Analysis

Principal Component Analysis Principal Component Analysis Alessandro Rezzani Abstract L articolo descrive una delle tecniche di riduzione della dimensionalità del data set: il metodo dell analisi delle componenti principali (Principal

Dettagli

UN CASO CONCRETO DI VALUTAZIONE DELLA SODDISFAZIONE DEL CLIENTE

UN CASO CONCRETO DI VALUTAZIONE DELLA SODDISFAZIONE DEL CLIENTE Tratto dal corso Ifoa UN CASO CONCRETO DI VALUTAZIONE DELLA SODDISFAZIONE DEL CLIENTE Recentemente, si sono sviluppati numerosi modelli finalizzati a valutare e a controllare il livello di soddisfazione

Dettagli

ALGEBRA: LEZIONI DAL 13 OTTOBRE AL 3 NOVEMBRE

ALGEBRA: LEZIONI DAL 13 OTTOBRE AL 3 NOVEMBRE ALGEBRA: LEZIONI DAL 13 OTTOBRE AL 3 NOVEMBRE 1 DIPENDENZA E INDIPENDENZA LINEARE Se ho alcuni vettori v 1, v 2,, v n in uno spazio vettoriale V, il sottospazio 1 W = v 1,, v n di V da loro generato è

Dettagli

Rappresentazione dei numeri in un calcolatore

Rappresentazione dei numeri in un calcolatore Corso di Calcolatori Elettronici I A.A. 2010-2011 Rappresentazione dei numeri in un calcolatore Lezione 2 Università degli Studi di Napoli Federico II Facoltà di Ingegneria Rappresentazione dei numeri

Dettagli

Esercizi per il corso di Algoritmi e Strutture Dati

Esercizi per il corso di Algoritmi e Strutture Dati 1 Esercizi per il corso di Algoritmi e Strutture Dati Esercizi sulla Tecnica Divide et Impera N.B. Tutti gli algoritmi vanno scritti in pseudocodice (non in Java, né in C++, etc. ). Di tutti gli algoritmi

Dettagli

Il simbolo. è è = = = In simboli: Sia un numero naturale diverso da zero, il radicale. Il radicale. esiste. esiste 0 Il radicale

Il simbolo. è è = = = In simboli: Sia un numero naturale diverso da zero, il radicale. Il radicale. esiste. esiste 0 Il radicale Radicali 1. Radice n-esima Terminologia Il simbolo è detto radicale. Il numero è detto radicando. Il numero è detto indice del radicale. Il numero è detto coefficiente del radicale. Definizione Sia un

Dettagli

Governance e performance nei servizi pubblici locali

Governance e performance nei servizi pubblici locali Governance e performance nei servizi pubblici locali Anna Menozzi Lecce, 26 aprile 2007 Università degli studi del Salento Master PIT 9.4 in Analisi dei mercati e sviluppo locale Modulo M7 Economia dei

Dettagli

MATRICI E DETERMINANTI

MATRICI E DETERMINANTI MATRICI E DETERMINANTI 1. MATRICI Si ha la seguente Definizione 1: Un insieme di numeri, reali o complessi, ordinati secondo righe e colonne è detto matrice di ordine m x n, ove m è il numero delle righe

Dettagli

Rango: Rouchè-Capelli, dimensione e basi di spazi vettoriali.

Rango: Rouchè-Capelli, dimensione e basi di spazi vettoriali. CAPITOLO 7 Rango: Rouchè-Capelli, dimensione e basi di spazi vettoriali. Esercizio 7.1. Determinare il rango delle seguenti matrici al variare del parametro t R. 1 4 2 1 4 2 A 1 = 0 t+1 1 A 2 = 0 t+1 1

Dettagli

RETTE, PIANI, SFERE, CIRCONFERENZE

RETTE, PIANI, SFERE, CIRCONFERENZE RETTE, PIANI, SFERE, CIRCONFERENZE 1. Esercizi Esercizio 1. Dati i punti A(1, 0, 1) e B(, 1, 1) trovare (1) la loro distanza; () il punto medio del segmento AB; (3) la retta AB sia in forma parametrica,

Dettagli

(accuratezza) ovvero (esattezza)

(accuratezza) ovvero (esattezza) Capitolo n 2 2.1 - Misure ed errori In un analisi chimica si misurano dei valori chimico-fisici di svariate grandezze; tuttavia ogni misura comporta sempre una incertezza, dovuta alla presenza non eliminabile

Dettagli

LA CORRELAZIONE LINEARE

LA CORRELAZIONE LINEARE LA CORRELAZIONE LINEARE La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariare. Ad esempio, si può supporre che vi sia una relazione tra l insoddisfazione

Dettagli

CAPITOLO PRIMO IL CONCETTO DI ALGORITMO 1

CAPITOLO PRIMO IL CONCETTO DI ALGORITMO 1 1.1 Che cos è un algoritmo CAPITOLO PRIMO IL CONCETTO DI ALGORITMO 1 Gli algoritmi sono metodi per la soluzione di problemi. Possiamo caratterizzare un problema mediante i dati di cui si dispone all inizio

Dettagli

Esercizi su lineare indipendenza e generatori

Esercizi su lineare indipendenza e generatori Esercizi su lineare indipendenza e generatori Per tutto il seguito, se non specificato esplicitamente K indicherà un campo e V uno spazio vettoriale su K Cose da ricordare Definizione Dei vettori v,,v

Dettagli

Metodi e Strumenti per la Caratterizzazione e la Diagnostica di Trasmettitori Digitali RF ing. Gianfranco Miele g.miele@unicas.it

Metodi e Strumenti per la Caratterizzazione e la Diagnostica di Trasmettitori Digitali RF ing. Gianfranco Miele g.miele@unicas.it Corso di laurea magistrale in Ingegneria delle Telecomunicazioni Metodi e Strumenti per la Caratterizzazione e la Diagnostica di Trasmettitori Digitali RF ing. Gianfranco Miele g.miele@unicas.it Trasmettitore

Dettagli

Analisi di Bilancio per indici

Analisi di Bilancio per indici Analisi di Bilancio per indici L analisi di bilancio è una attività complessa svolta con utilizzazione di tecniche prevalentemente quantitative di elaborazione dei dati, con cui si effettuano indagini

Dettagli

LEZIONE 14. a 1,1 v 1 + a 1,2 v 2 + a 1,3 v 3 + + a 1,n 1 v n 1 + a 1,n v n = w 1

LEZIONE 14. a 1,1 v 1 + a 1,2 v 2 + a 1,3 v 3 + + a 1,n 1 v n 1 + a 1,n v n = w 1 LEZIONE 14 141 Dimensione di uno spazio vettoriale Abbiamo visto come l esistenza di una base in uno spazio vettoriale V su k = R, C, permetta di sostituire a V, che può essere complicato da trattare,

Dettagli

A i è un aperto in E. i=1

A i è un aperto in E. i=1 Proposizione 1. A è aperto se e solo se A c è chiuso. Dimostrazione. = : se x o A c, allora x o A = A o e quindi esiste r > 0 tale che B(x o, r) A; allora x o non può essere di accumulazione per A c. Dunque

Dettagli

Titolo della lezione. Analisi dell associazione tra due caratteri: indipendenza e dipendenza

Titolo della lezione. Analisi dell associazione tra due caratteri: indipendenza e dipendenza Titolo della lezione Analisi dell associazione tra due caratteri: indipendenza e dipendenza Introduzione Analisi univariata, bivariata, multivariata Analizzare le relazioni tra i caratteri, per cercare

Dettagli

Maurizio Vichi Sapienza Università di Roma

Maurizio Vichi Sapienza Università di Roma Percorsi didattici, interdisciplinari ed innovativi per la Statistica Maurizio Vichi Sapienza Università di Roma Presidente Federazione Europea delle Società Nazionali di Statistica Scuola Estiva di Matematica

Dettagli

Consideriamo due polinomi

Consideriamo due polinomi Capitolo 3 Il luogo delle radici Consideriamo due polinomi N(z) = (z z 1 )(z z 2 )... (z z m ) D(z) = (z p 1 )(z p 2 )... (z p n ) della variabile complessa z con m < n. Nelle problematiche connesse al

Dettagli

Da una a più variabili: derivate

Da una a più variabili: derivate Da una a più variabili: derivate ( ) 5 gennaio 2011 Scopo di questo articolo è di evidenziare le analogie e le differenze, relativamente al calcolo differenziale, fra le funzioni di una variabile reale

Dettagli

METODI ITERATIVI PER SISTEMI LINEARI

METODI ITERATIVI PER SISTEMI LINEARI METODI ITERATIVI PER SISTEMI LINEARI LUCIA GASTALDI 1. Metodi iterativi classici Sia A R n n una matrice non singolare e sia b R n. Consideriamo il sistema (1) Ax = b. Un metodo iterativo per la soluzione

Dettagli

Indice generale. Modulo 1 Algebra 2

Indice generale. Modulo 1 Algebra 2 Indice generale Modulo 1 Algebra 2 Capitolo 1 Scomposizione in fattori. Equazioni di grado superiore al primo 1.1 La scomposizione in fattori 2 1.2 Raccoglimento a fattor comune 3 1.3 Raccoglimenti successivi

Dettagli

Il lavoro. 4.1 L attività e l inattività della popolazione

Il lavoro. 4.1 L attività e l inattività della popolazione Capitolo 4 L analisi del territorio nella programmazione degli interventi di sviluppo agricolo capitolo 4 Il lavoro Gli indicatori presentati in questo capitolo riguardano la condizione di occupazione.

Dettagli

Percorsi di matematica per il ripasso e il recupero

Percorsi di matematica per il ripasso e il recupero Giacomo Pagina Giovanna Patri Percorsi di matematica per il ripasso e il recupero 1 per la Scuola secondaria di secondo grado UNITÀ CMPIONE Edizioni del Quadrifoglio à t i n U 1 Insiemi La teoria degli

Dettagli

General Linear Model. Esercizio

General Linear Model. Esercizio Esercizio General Linear Model Una delle molteplici applicazioni del General Linear Model è la Trend Surface Analysis. Questa tecnica cerca di individuare, in un modello di superficie, quale tendenza segue

Dettagli

Il luogo delle radici (ver. 1.0)

Il luogo delle radici (ver. 1.0) Il luogo delle radici (ver. 1.0) 1 Sia dato il sistema in retroazione riportato in Fig. 1.1. Il luogo delle radici è uno strumento mediante il quale è possibile valutare la posizione dei poli della funzione

Dettagli

VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011

VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011 VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011 1 RAPPRESENTARE I DATI: TABELLE E GRAFICI Un insieme di misure è detto serie statistica o serie dei dati 1) Una sua prima elementare elaborazione può

Dettagli

6. Le ricerche di marketing

6. Le ricerche di marketing Università degli Studi di Urbino Carlo Bo Facoltà di Lingue e Letterature Straniere Corso di Laurea in Lingue e Cultura per l Impresa 6. Le ricerche di marketing Prof. Fabio Forlani Urbino, 29/III/2011

Dettagli

METODO DEI MINIMI QUADRATI. Quest articolo discende soprattutto dai lavori di Deming, Press et al. (Numerical Recipes) e Jefferys.

METODO DEI MINIMI QUADRATI. Quest articolo discende soprattutto dai lavori di Deming, Press et al. (Numerical Recipes) e Jefferys. METODO DEI MINIMI QUADRATI GIUSEPPE GIUDICE Sommario Il metodo dei minimi quadrati è trattato in tutti i testi di statistica e di elaborazione dei dati sperimentali, ma non sempre col rigore necessario

Dettagli

Cristian Secchi Pag. 1

Cristian Secchi Pag. 1 CONTROLLI DIGITALI Laurea Magistrale in Ingegneria Meccatronica SISTEMI A TEMPO DISCRETO Ing. Tel. 0522 522235 e-mail: cristian.secchi@unimore.it http://www.dismi.unimo.it/members/csecchi Richiami di Controlli

Dettagli

Il bilancio con dati a scelta. Classe V ITC

Il bilancio con dati a scelta. Classe V ITC Il bilancio con dati a scelta Classe V ITC Il metodo da seguire Premesso che per la costruzione di un bilancio con dati a scelta si possono seguire diversi metodi, tutti ugualmente validi, negli esempi

Dettagli

Logica fuzzy e calcolo delle probabilità: due facce della stessa medaglia?

Logica fuzzy e calcolo delle probabilità: due facce della stessa medaglia? Logica fuzzy e calcolo delle probabilità: due facce della stessa medaglia? Danilo Pelusi 1 Gianpiero Centorame 2 Sunto: Il seguente articolo illustra le possibili analogie e differenze tra il calcolo delle

Dettagli

Risk management come opportunità per un nuovo welfare

Risk management come opportunità per un nuovo welfare Risk management come opportunità per un nuovo welfare Il contesto economico e sociale in cui operano i comitati Uisp condiziona la loro attività mettendoli di fronte a criticità di natura organizzativa,

Dettagli

19. Inclusioni tra spazi L p.

19. Inclusioni tra spazi L p. 19. Inclusioni tra spazi L p. Nel n. 15.1 abbiamo provato (Teorema 15.1.1) che, se la misura µ è finita, allora tra i corispondenti spazi L p (µ) si hanno le seguenti inclusioni: ( ) p, r ]0, + [ : p

Dettagli

Laboratorio di Progettazione Esecutiva dell Architettura 2 Corso di Estimo a.a. 2007-08 Docente Renato Da Re Collaboratore: Barbara Bolognesi

Laboratorio di Progettazione Esecutiva dell Architettura 2 Corso di Estimo a.a. 2007-08 Docente Renato Da Re Collaboratore: Barbara Bolognesi Laboratorio di Progettazione Esecutiva dell Architettura 2 Corso di Estimo a.a. 2007-08 Docente Renato Da Re Collaboratore: Barbara Bolognesi Microeconomia venerdì 29 febbraio 2008 La struttura della lezione

Dettagli

Corso di Informatica Generale (C. L. Economia e Commercio) Ing. Valerio Lacagnina Rappresentazione in virgola mobile

Corso di Informatica Generale (C. L. Economia e Commercio) Ing. Valerio Lacagnina Rappresentazione in virgola mobile Problemi connessi all utilizzo di un numero di bit limitato Abbiamo visto quali sono i vantaggi dell utilizzo della rappresentazione in complemento alla base: corrispondenza biunivoca fra rappresentazione

Dettagli

ANALISI DI BILANCIO LA RICLASSIFICAZIONE FINANZIARIA E FUNZIONALE. Dott. Elbano De Nuccio

ANALISI DI BILANCIO LA RICLASSIFICAZIONE FINANZIARIA E FUNZIONALE. Dott. Elbano De Nuccio ANALISI DI BILANCIO LA RICLASSIFICAZIONE FINANZIARIA E FUNZIONALE Dott. Elbano De Nuccio L analisi di bilancio si propone di formulare un giudizio sull EQUILIBRIO ECONOMICO e FINANZIARIO/PATRIMONIALE della

Dettagli

x 1 + x 2 3x 4 = 0 x1 + x 2 + x 3 = 0 x 1 + x 2 3x 4 = 0.

x 1 + x 2 3x 4 = 0 x1 + x 2 + x 3 = 0 x 1 + x 2 3x 4 = 0. Problema. Sia W il sottospazio dello spazio vettoriale R 4 dato da tutte le soluzioni dell equazione x + x 2 + x = 0. (a. Sia U R 4 il sottospazio dato da tutte le soluzioni dell equazione Si determini

Dettagli

Economia e Finanza delle. Assicurazioni. Introduzione al corso. Mario Parisi. Università di Macerata Facoltà di Economia

Economia e Finanza delle. Assicurazioni. Introduzione al corso. Mario Parisi. Università di Macerata Facoltà di Economia Economia e Finanza delle Assicurazioni Università di Macerata Facoltà di Economia Mario Parisi Introduzione al corso 1 Inquadramento del corso 1996: Gruppo di ricerca sulle metodologie di analisi, sugli

Dettagli

ALLEGATO. DATA SCADENZA Definitivo STATO --- pubblico 1/9. Legenda

ALLEGATO. DATA SCADENZA Definitivo STATO --- pubblico 1/9. Legenda SERVIZI INGEGNERIA DI ALLEGATO C LINEAMENTI METODOLOGICI PER LA VALUTAZIONE ECONOMICO-FINANZIARIA DEGLI OPERATORI ECONOMICI 25 novembre 21 Stato: Bozza, In Approvazione, Documento al documento 1/9 1. PRINCIPI

Dettagli

Albero semantico. Albero che mette in corrispondenza ogni formula con tutte le sue possibili interpretazioni.

Albero semantico. Albero che mette in corrispondenza ogni formula con tutte le sue possibili interpretazioni. Albero semantico Albero che mette in corrispondenza ogni formula con tutte le sue possibili interpretazioni. A differenza dell albero sintattico (che analizza la formula da un punto di vista puramente

Dettagli