Modelli per variabili dipendenti qualitative

Похожие документы

Pro e contro delle RNA

Regressione Logistica: un Modello per Variabili Risposta Categoriali

Le politiche attive del lavoro e il valore della formazione

Regressione non lineare con un modello neurale feedforward

Automazione Industriale (scheduling+mms) scheduling+mms.

STRATEGIA DI TRADING. Turning Points

Capitolo 12 La regressione lineare semplice

Statistical learning Strumenti quantitativi per la gestione

Introduzione alle relazioni multivariate. Introduzione alle relazioni multivariate

LEZIONE n. 5 (a cura di Antonio Di Marco)

Ing. Simone Giovannetti

A.A Obiettivi formativi del CI di Metodologia epidemiologica OBIETTIVO GENERALE

Lezione 2. Il rating. Il rating. Sistemi di rating, il rating esterno

Indice di rischio globale

VC-dimension: Esempio

Il metodo della regressione

Tecniche di riconoscimento statistico

Limited Dependent Variable Models

Econometria. lezione 17. variabili dipendenti binarie. Econometria. lezione 17. AA Paolo Brunori

Parte 4. Progettazione di una simulazione

IL CAMPIONAMENTO NELLA REVISIONE CONTABILE

DECISION MAKING. E un termine generale che si applica ad azioni che le persone svolgono quotidianamente:

Regressione Mario Guarracino Data Mining a.a. 2010/2011

Capitolo 13: L offerta dell impresa e il surplus del produttore

Relazioni tra variabili

Come scrivere una proposta progettuale

CURRICOLO VERTICALE DI TECNOLOGIA

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

Economia del Lavoro 2010

LA LOGISTICA INTEGRATA

Elementi di Telelocalizzazione

Elementi di Psicometria con Laboratorio di SPSS 1

1a Edizione Risorse Comuni

Il controllo dei rischi operativi in concreto: profili di criticità e relazione con gli altri rischi aziendali

Università del Piemonte Orientale. Corsi di laurea triennale di area tecnica. Corso di Statistica Medica. Analisi dei dati in tabelle di contingenza

Principi di analisi causale Lezione 2

La categoria «ES» presenta (di solito) gli stessi comandi

Verifica di ipotesi e intervalli di confidenza nella regressione multipla

Rapporto dal Questionari Insegnanti

Lezione 10: Il problema del consumatore: Preferenze e scelta ottimale

Metodi statistici per le ricerche di mercato

Metodologia epidemiologica e Igiene II

CAPITOLO III CONFRONTI TRA DISTRIBUZIONI

TECNICO SUPERIORE DELLA LOGISTICA INTEGRATA

lezione 18 AA Paolo Brunori

Corso di. Analisi e contabilità dei costi

Corso di Politica Economica

Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla

Lineamenti di econometria 2

Vi ricordate quello che abbiamo visto nelle prime lezioni? LA VALUTAZIONE ECONOMICA E FINANZIARIA DEL PROGETTO. L analisi di sensitività

E naturale chiedersi alcune cose sulla media campionaria x n

Regressione Logistica

Presentazione. Risorse Web. Metodi Statistici 1

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Seconda conferenza diateneo sugli strumenti di valutazione della ricerca Ferrara, 18 maggio 2010

Scheduling della CPU. Sistemi multiprocessori e real time Metodi di valutazione Esempi: Solaris 2 Windows 2000 Linux

TECNICO SUPERIORE DEI TRASPORTI E DELL INTERMODALITÀ

INTRODUZIONE AL RISK MANAGEMENT. Copyright CER.TO. S.r.l. 1

Sistemi Informativi Territoriali. Map Algebra

Regressione logistica

penetration test (ipotesi di sviluppo)

Analisi della performance temporale della rete

Corso di Calcolo Numerico

Tecniche di rilevazione statistica

Parte I. Prima Parte

Programmazione Disciplinare: Calcolo Classe: Quarte - Quinte

Statistica multivariata. Statistica multivariata. Analisi multivariata. Dati multivariati. x 11 x 21. x 12 x 22. x 1m x 2m. x nm. x n2.

SCUOLA PRIMARIA CURRICOLO GEOGRAFIA DELIBERATO ANNO SCOL 2015/2016

Regole associative. Prof. Paolo Giudici

Esposizione ed effetto

Cerved Group S.p.A. Rating Validation 1. CERVED GROUP SpA. Rating Validation

Che cosa e come valutano le prove di matematica e con quali risultati. nell A.S

PROGRAMMAZIONE COMPETENZE CHIAVE DI CITTADINANZA

ANALISI DELLA VARIANZA A PIU CRITERI DI CLASSIFICAZIONE

Page 1. Evoluzione. Intelligenza Artificiale. Algoritmi Genetici. Evoluzione. Evoluzione: nomenclatura. Corrispondenze natura-calcolo

Con il termine Variabile di solito si indica qualcosa che varia, cioè che assume più modi di essere, detti modalità, attributi, valori

Economia del Lavoro 2010

La teoria finanziaria del valore asserisce che il valore di una iniziativa dipende essenzialmente da tre fattori:

Perché si fanno previsioni?

VALORE DELLE MERCI SEQUESTRATE

Introduzione alla metodologia di progettazione europea

Esercizi di Probabilità e Statistica

Analisi di Mercato. Facoltà di Economia. Analisi sui consumi. Metodo delle inchieste familiari. Metodo delle disponibilità globali

Liceo Tecnologico. Indirizzo Logistica e Trasporti. Indicazioni nazionali per Piani di Studi Personalizzati

Elementi di informatica

Applicazioni delle teorie della scelta razionale e della domanda (Frank, Capitolo 5)

LE CARTE DI CONTROLLO (4)

SVM. Veronica Piccialli. Roma 11 gennaio Università degli Studi di Roma Tor Vergata 1 / 14

I Metodi statistici utili nel miglioramento della qualità 27

Corso semestrale di Analisi e Contabilità dei Costi

Elementi di Psicometria con Laboratorio di SPSS 1

Regressione logistica. Strumenti quantitativi per la gestione

Data Mining a.a

Транскрипт:

SEMINARIO GRUPPO TEMATICO METODI e TECNICHE La valutazione degli incentivi industriali: aspetti metodologici Università di Brescia, 17 gennaio 2012 Modelli per variabili dipendenti qualitative Paola Zuccolotto Università di Brescia Centro di Studi e Ricerca Dati Metodi Sistemi

Scopo e agenda Scopo: Dare uno sguardo alle problematiche principali riguardanti la previsione statistica per variabili dipendenti qualitative Agenda: Questioni statistiche fondamentali Approcci e metodi di analisi Valutazione della bontà del modello Contestualizzazione nella valutazione Alcuni problemi specifici

Questioni statistiche fondamentali: la previsione Previsione statistica: X 1, X 2 p predittori E(Y) = (X 1, X 2 X p ) Y qualitativa classificazione quantitativa regressione

Questioni statistiche fondamentali: variabili dipendenti qualitative Variabili qualitative dicotomiche (0-1) E(Y) = si modella la probabilità di osservare il valore 1 = (X 1, X 2 X p ) N.B. La funzione è il modello statistico

Approcci e metodi di analisi A seconda della forma scelta per la funzione abbiamo diversi modelli statistici. In generale possiamo distinguere due approcci fondamentali alla definizione di tradizionale e quello algoritmico.

Approcci e metodi di analisi Approccio tradizionale Consiste nello scegliere per una forma funzionale definita a priori, in genere abbastanza semplice. Esempi: regressione logistica, probit

Approcci e metodi di analisi Esempio con due predittori X 1 e X 2 Esempio con tre predittori X 1, X 2 e X 3 X 2 X 3 X 1 X 1 X 2

Approcci e metodi di analisi Facile interpretabilità del modello Facile stima dei parametri Rigidità della funzione

Approcci e metodi di analisi Approccio algoritmico Consiste meccanismi algoritmici per approssimare. Esempi: reti neurali artificiali, alberi di classificazione, ensemble learning, SVM, algoritmi genetici,

Approcci e metodi di analisi Esempio con due predittori X 1 e X 2 Esempio con tre predittori X 1, X 2 e X 3 X 3 X 2 X 1 X 2 X 1

Approcci e metodi di analisi Elevata flessibilità della funzione Pesantezza computazionale Difficoltà di stima dei parametri Difficoltà di interpretazione del modello (black box)

Valutazione della bontà del modello (goodness of fit) Si definisce una soglia s, quindi per ogni soggetto i- esimo i previsione 0 per il soggetto i- esimo i > s 1 per il soggetto i- esimo previsione effettivi 1 0 1 0

Valutazione della bontà del modello (goodness of fit) effettivi 1 0 previsione 1 n 11 n 10 0 n 01 n 00 Misclassification error rate

Valutazione della bontà del modello (goodness of fit) effettivi 1 0 previsione 1 n 11 n 10 0 n 01 n 00 Misclassification error rate Sensitivity True positive rate

Valutazione della bontà del modello (goodness of fit) effettivi 1 0 previsione 1 n 11 n 10 0 n 01 n 00 Misclassification error rate Sensitivity True positive rate Specificity True negative rate

Valutazione della bontà del modello (goodness of fit) Sensitività e specificità variano al variare della soglia s s = 0 s = 1 effettivi effettivi 1 0 1 0 previsione 1 n 11 n 10 0 0 0 previsione 1 0 0 0 n 01 n 00 Sensitivity = 1 Specificity = 0 Sensitivity = 0 Specificity = 1

Valutazione della bontà del modello (goodness of fit) Sensitività e specificità variano al variare della soglia s Sensitivity - Specificity s

Valutazione della bontà del modello (goodness of fit) Il valore ottimale di s si può scegliere osservando la ROC curve Valori bassi di s Valori elevati di s

Valutazione della bontà del modello (goodness of fit) Il valore ottimale di s si può scegliere osservando la ROC curve Soglia moderata Soglia lasca Soglia stretta

Valutazione della bontà del modello (goodness of fit) La ROC curve può essere utilizzata anche per effettuare una valutazione sintetica globale di goodness of fit. In questo modo risulta possibile valutare la bontà di un predittore e confrontare predittori diversi tra loro.

Valutazione della bontà del modello (goodness of fit) Il predittore migliore (attribuzione esatta delle categorie) Il predittore peggiore (attribuzione casuale delle categorie)

Valutazione della bontà del modello (goodness of fit)

Valutazione della bontà del modello (goodness of fit) Si può anche calcolare un indicatore sintetico Area Under the Curve AUC

Variabili dipendenti qualitative: contestualizzazione nella valutazione politiche economiche Propensity Score Matching: calcola la probabilità di partecipanti aventi probabilità simili. Identificazione delle Variabili Strumentali: calcola la predittori associati con il meccanismo di (auto)selezione ma Treatment Effect Model: modella la probabilità di partecipare

Alcuni problemi specifici Variable selection: Approccio tradizionale: step- wise, penalized regression. Approccio algoritmico: Variable Importance measures, metodi di rule extraction Sbilanciamento tra 0 e 1: Metodi di ricampionamento Spostamento soglia su ROC curve Introduzione funzioni di costo