Albero di decisione binaria

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Albero di decisione binaria"

Transcript

1 Segmentazione Binaria Obiettivo Classificare un collettivo di individui in gruppi (segmentazione), omogenei al loro interno e quanto più possibile differenziati, mediante una successione di divisioni dicotomiche (binaria) I Dati N individui M variabili esplicative variabile dipendente nominale o continua Obiettivo esplicativo spiegare la variabile di risposta sulla base delle variabili esplicative Obiettivo decisionale sfruttare la regola di classificazione ottenuta per classificare nuovi casi Albero di decisione binaria N t s N t t 3 N s s 3 t 4 l t 5 t 6 t 7 l l 3 s 4 nodi intermedi t, t, t 3, t 7 ; nodi terminali t 4, t 5, t 6, t 8, t 9 ; split s, s, s 3, s 4 ; t 8 t 9 l 4 l 5 etichette l, l, l 3, l 4 l 5 ;

2 Fasi di una procedura di segmentazione binaria Un insieme di domande binarie stabilire, per ciascun nodo, l insieme delle divisioni ammissibili Natura del Numero di Numero di split predittore modalità variabile continua N N- variabile binaria variabile ordinale m m- variabile nominale m m-- Un criterio di split definire un criterio per selezionare la migliore divisione di un nodo AID max distanza tra le medie dei gruppi CHAID max valore del Chi- CART max decremento di impurità.. Una regola di arresto definire una regola per dichiarare un nodo come terminale o intermedio numerosità nei nodi test statistici pruning Una regola che assegna ad ogni nodo terminale una delle J classi della variabile di risposta nominale o un valore della variabile di risposta continua Qualità della regola di decisione stimare il rischio di errore di classificazione o di previsione associato

3 CHi-squared Automatic Interaction Detector (CHAID) (Kass - 980) Criterio utilizzato Livello di significatività (p-value) di un test statistico (il chi-quadrato se y è qualitativa o il test F se y è continua) per valutare tutti i valori di un potenziale predittore rispetto alla variabile obiettivo Aggregazione modalità dei predittori Le modalità dei predittori ritenute statisticamente omogenee (simili -> p-value maggiore di una soglia fissata a priori) rispetto alla variabile obiettivo sono aggregate, mentre le altre modalità (eterogenee) sono mantenute separate Selezione del predittore per il primo ramo dell albero Si sceglie il predittore che meglio (p-value inferiore di una soglia fissata a priori) permette la costruzione di nodi contenenti valori omogenei rispetto alla variabile obiettivo Classification And Regression Trees (CART) (Breiman, Friedman, Olshen - 984) Obiettivi Classification Trees Individuare il miglior classificatore di N individui appartenenti a J gruppi che siano internamente omogenei ed esternamente eterogenei (variabile di risposta in classi) Regression Trees Predire una variabile dipendente (continua) attraverso M variabili esplicative (variabile di risposta continua) 3

4 CART il criterio di split Obiettivo Generare nodi figli che siano più puri del nodo genitore Classificazione ad albero Generare nodi figli omogenei ossia con una proporzione minima di individui di classi differenti della variabile di risposta Regressione ad albero Generare nodi figli con varianza della variabile di risposta minore del nodo genitore Misura dell impurità di un nodo Indice di eterogeneità del Gini Indice di entropia Media ponderata delle varianza nei nodi figli Il criterio di split classificazione ad albero Indice di eterogeneità del Gini Max ( i() t ) J = J Classe 00 Classe 00 Classe t i() t ( t) = p ( j t) i nodo t j proporzione di casi della classe j presenti nel nodo t L impurità di un nodo è massima quando le classi sono equidistribuite al suo interno 00 = = = = Min ( i() t ) = 0 L impurità di un nodo è minima quando esso contiene individui appartenenti solo ad una classe Classe 300 Classe 0 Classe t i() t = + + = = 0 4

5 Il criterio di split classificazione ad albero ( t) = p ( j t). Impurità di un nodo indice di eterogeneità del Ginii j. Misura del decremento di impurità di un nodo t p l t s p r ( s t) = i( t) p ( i( t )) p ( i( t )) Δ i, l l r r t l t r 3. Migliore divisione di un nodo t Δi( s*, t) = max Il criterio di split regressione ad albero t l t N t r s N N s l s r var N N l r ( j, t) = s + s l N N r Media ponderata delle varianze della variabile j nei nodi figli generati dal nodo genitore t Migliore divisione di un nodo t min{ var( j,t) } 5

6 Qualità della regola di classificazione classificazione ad albero Stima del Tasso di errata classificazione n.ro individui mal classificati R = n.ro individui nel campione R viene calcolato sullo stesso insieme di dati utilizzato per costruire la regola di classificazione Metodo del campione test N = N base + N test Costruzione della regola di classificazione R test = Occorre definire la proporzione di casi in N test e N base n.ro individui mal classificati nel camp. test N test I vantaggi della segmentazione binaria Facile leggibilità della regola di classificazione Selezione automatica delle variabili maggiormente discriminanti Utilizzo di criteri di selezione non parametrici Gli svantaggi della segmentazione binaria Possibilità di cadere in regole di classificazione semplicistiche Difficoltà computazionali legate al calcolo, in ciascun nodo, dei valori di split per tutte le possibili dicotomizzazioni 6

7 Indagine sugli sbocchi occupazionali dei laureati in Economia e Commercio di Napoli (997) Voto di laurea. Basso (VOT). Alto (VOT) Genere. maschio (MASC). Femmina (FEMM) Residenza. Napoli (RENA). provincia di Napoli (REPR) 3. altre province (REAP) Età attuale. minore di 5 anni (ETA). tra 6 e 30 anni (ETA) 3. tra 3 e 35 (ETA3) 4. oltre 30 anni (ETA4) Diploma. maturità classica (DICL). maturità scientifica (DISC) 3. diploma tecnico (DITN) 4. Magistrale (DIMA) 5. altri diplomi (DIPR) Piano di studi. individuale (PUIN). Aziendale (PIAZ) 3. Generale (PIGE) 4. Quantitativo (PIMA) 5. Pubblico (PIPU) 6. Professionale (PIPR) Anni impiegati per la laurea. 4 anni (ANN). 5-6 anni (ANN)3. >6 anni (ANN3) Tesi di laurea. T-economiche (TEEC). T-giuridiche (TEGI) 3. T-quantitative (TEQU)4. T-storiche soc. e geog. (TESS) 5. T-aziendali (TEAZ) anni +35 anni età 9 voto basso 3 scient. tecn. prof. 9 altra provincia residenza 6 diploma 33 pubb., prof. piano st genere voto alto femmine voto basso voto alto economia aziend tesi voto basso % BC campione base 74.35% 8 voto basso voto alto % BC campione test 69.47% 7

8 ANALISI CONGIUNTA Obiettivo Misurare l importanza della presenza di determinate caratteristiche nella formulazione di un giudizio di preferenza globale riferito ad un prodotto/servizio Individuare la combinazione di caratteristiche che massimizzi la preferenza globale Premessa Ciascun prodotto/servizio è definito da un insieme finito di caratteristiche con un numero limitato di modalità La valutazione globale del prodotto è funzione della valutazione implicita delle singole modalità 8

9 Fasi dell analisi Individuazione delle caratteristiche (fattori) Individuazione delle modalità di ciascuna caratteristica (livelli dei fattori) Scelta della relazione funzionale che lega l importanza di ciascuna modalità alla valutazione di preferenza globale Definizione di un insieme di scenari di prodotto attraverso un piano sperimentale frazionato Raccolta delle valutazioni globali Stima delle utilità parziali Fattori Sperimentali 9

10 Codifica degli scenari S S x x... xk x x... xk... x x... xk p O O O O Sq 0... O O 0... O O SQ p p p Presentazione degli scenari Descrizione verbale Descrizione grafica Modello in miniatura Descrizione multimediale 0

11 Metodi di raccolta dei dati Metodo del trade-off si considerano due fattori per volta l'intervistato deve ordinare i livelli in base alla sua preferenza. - perdita di realismo dovuta alla valutazione isolata degli attributi - operazione lunga e noiosa per l'intervistato il numero di confronti è di solito elevato. Metodo del full profile si considerano tutti gli attributi che rappresentano gli stimoli * si utilizzano piani frazionati per ridurre la complessità il numero di confronti necessari è inferiore di quelli richiesti dal trade-off Raccolta dei punteggi di preferenza globale S S S S q Q y y... y... y g G q Q... q O O Q... q... O... O Q q Q

12 Metodi di Stima Dipende dalla scala di misura delle preferenze Nel caso di scale di misure quantitative (punteggi) minimi quadrati ordinari Nel caso di misure ordinali MONANOVA In entrambi i metodi la preferenza del consumatore è data dalla somma delle utilità parziali b k Modello individuale additivo y Composizione delle utilità parziali q = k b k x qk Y b k > 0 b k < 0 x x x 3 X

13 Caso studio il gusto del caffè Fattori Livello Livello Livello 3 Sapore Mod. Amaro Molto Amaro Aroma Intenso Leggero Corposità Leggera Media Forte Scenario Sapore Aroma Corposità mod. amaro intenso media mod. amaro leggero leggera 3 mod. amaro leggero forte 4 mod. amaro intenso forte 5 mod. amaro intenso leggera 6 molto amaro leggero leggera 7 molto amaro leggero media 8 mod. amaro leggero media 9 molto amaro leggero forte Utilità parziali Importanza dei fattori Standard Importance Utility Error (%Utility Range) Intercetta SAPORE moderatamente amaro SAPORE molto amaro AROMA intenso AROMA lieve CORPOSITA forte CORPOSITA leggera CORPOSITA media

14 ACPR - piano fattoriale λ =.98% * S9 * j7 j57 * j8 * j56 j35 * * j53 * forte * S3 * j37 * S4 * j * j7 j4 * j9 j6 * j3 * j46 j54 *j*3j59 Molto * S7 * j6 **j amaro Aroma leggero j3j*j*0j3 Earoma j4 **j33 Moderatamente* intenso j **j48 amaro S8 * * jj38** j Moderato S *j*6j * j40 ** j5 j5j3** j j4* j8 * S6 * j49 * j5 * leggero * S * j3 * S5 Importanza Fattore Asse Asse Importanza originaria Sapore Aroma Corpo λ =80.87% p h= Range Range ( coord Xh ) ( coord X ) Autovalore Autovalore % % h 4

Tecniche di riconoscimento statistico

Tecniche di riconoscimento statistico On AIR s.r.l. Tecniche di riconoscimento statistico Applicazioni alla lettura automatica di testi (OCR) Parte 9 Alberi di decisione Ennio Ottaviani On AIR srl ennio.ottaviani@onairweb.com http://www.onairweb.com/corsopr

Dettagli

Alberi Decisionali Per l analisi del mancato rinnovo all abbonamento di una rivista

Alberi Decisionali Per l analisi del mancato rinnovo all abbonamento di una rivista Alberi Decisionali Per l analisi del mancato rinnovo all abbonamento di una rivista Il problema L anticipazione del fenomeno degli abbandoni da parte dei propri clienti, rappresenta un elemento fondamentale

Dettagli

CART: Classification And Regression Trees

CART: Classification And Regression Trees CART: Classification And Regression Trees Antonio Manno mannoanto@libero.it, www.statistica.too.it Indice 1 Classificazione e regressione ad albero, CART 1 1.1 Classification trees............................

Dettagli

Scale di Misurazione Lezione 2

Scale di Misurazione Lezione 2 Last updated April 26, 2016 Scale di Misurazione Lezione 2 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura II anno, II semestre Tipi di Variabili 1 Scale di Misurazione 1. Variabile

Dettagli

I fenomeni collettivi sono quei fenomeni il cui studio richiede una pluralità di osservazioni.

I fenomeni collettivi sono quei fenomeni il cui studio richiede una pluralità di osservazioni. Definizione di STATISTICA: La statistica si può definire come un insieme di metodi scientifici finalizzati alla conoscenza quantitativa e qualitativa dei fenomeni collettivi mediante la raccolta, l'ordinamento,

Dettagli

Rappresentazioni Tabellari e Grafiche. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Rappresentazioni Tabellari e Grafiche. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Rappresentazioni Tabellari e Grafiche Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Vocabolario Essenziale Unità Statistica Unità elementare

Dettagli

Imputazione di dati categoriali mancanti: il modello di classificazione ad albero

Imputazione di dati categoriali mancanti: il modello di classificazione ad albero Imputazione di dati categoriali mancanti: il modello di classificazione ad albero Antonio Manno mannoanto@libero.it, www.statistica.too.it Indice 1 Il problema dei dati mancanti 1 2 Principali tecniche

Dettagli

LETTI PER VOI: Figura 1: la struttura ad albero

LETTI PER VOI: Figura 1: la struttura ad albero LETTI PER VOI: " Classification And Regression Trees " a cura di Cinzia Di Novi Università del Piemonte Orientale, Dipartimento di Politiche Pubbliche e Scelte Collettive Classification And Regression

Dettagli

Decision trees. Analisi statistica e matematico-finanziaria II. Alfonso Iodice D Enza iodicede@unicas.it

Decision trees. Analisi statistica e matematico-finanziaria II. Alfonso Iodice D Enza iodicede@unicas.it Decision trees Analisi statistica e matematico-finanziaria II Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino e del Lazio Meridionale Outline Decision trees Decision trees (DT)

Dettagli

Segmentazione e Marketing 121

Segmentazione e Marketing 121 Segmentazione e Marketing 121 Corso di Laurea in Informatica per il Management Università di Bologna Andrea De Marco Segmentazione Cosa Significa? Usiamo la parola "segmentazione" per definire il processo

Dettagli

Livello di misura Scala Nominale Scala Ordinale Scala di Rapporti. Scala Nominale

Livello di misura Scala Nominale Scala Ordinale Scala di Rapporti. Scala Nominale Esercitazione Supponiamo che il collettivo che si vuole studiare sia composto da un gruppo di turisti. La seguente tabella raccoglie l osservazione di alcuni caratteri di interesse. Costo Soggetto Titolo

Dettagli

Segmentazione e Marketing 121. Università di Bologna Andrea De Marco

Segmentazione e Marketing 121. Università di Bologna Andrea De Marco Segmentazione e Marketing 121 Università di Bologna Andrea De Marco Segmentazione Cosa Significa? Usiamo la parola "segmentazione" per definire il processo con cui "raggruppiamo" in insiemi omogenei elementi

Dettagli

Metodi e tecniche di analisi dei dati nella ricerca psico-educativa Parte III

Metodi e tecniche di analisi dei dati nella ricerca psico-educativa Parte III Laboratorio Metodi e tecniche di analisi dei dati nella ricerca psico-educativa Parte III Laura Palmerio Università Tor Vergata A.A. 2005/2006 MISURAZIONE Misurare le variabili Assegnazione di valori numerici

Dettagli

Metodi Statistici Avanzati per le Imprese Arboretti Giancristofaro R., Bonnini S. La Conjoint Analysis

Metodi Statistici Avanzati per le Imprese Arboretti Giancristofaro R., Bonnini S. La Conjoint Analysis La Conjoint Analysis La funzione di utilità del consumatore Utilità: valore che indica il livello di soddisfazione che un consumatore ottiene da un certo bene o da un paniere di beni con date caratteristiche

Dettagli

Analisi della varianza

Analisi della varianza Università degli Studi di Padova Facoltà di Medicina e Chirurgia Facoltà di Medicina e Chirurgia - A.A. 2009-10 Scuole di specializzazione Lezioni comuni Disciplina: Statistica Docente: dott.ssa Egle PERISSINOTTO

Dettagli

Classificazione dei caratteri

Classificazione dei caratteri Classificazione dei caratteri Carattere Qualitativo (Mutabile Statistica): modalità espresse da attributi Genere, Stato civile, Sett. di attività econ., Titolo di studio, Grado militare Carattere Quantitativo

Dettagli

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi

Dettagli

Analisi delle corrispondenze

Analisi delle corrispondenze Analisi delle corrispondenze Obiettivo: analisi delle relazioni tra le modalità di due (o più) caratteri qualitativi Individuazione della struttura dell associazione interna a una tabella di contingenza

Dettagli

DATA MINING PER IL MARKETING

DATA MINING PER IL MARKETING DATA MINING PER IL MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso GLI ALBERI DI CLASSIFICAZIONE Algoritmi di classificazione Zani-Cerioli, Cap. XI CHAID: Chi-square Automatic Interaction

Dettagli

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 15: Metodi non parametrici

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 15: Metodi non parametrici Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 15: Metodi non parametrici 1 Metodi non parametrici Statistica classica La misurazione avviene con

Dettagli

Apprendimento basato sulle istanze

Apprendimento basato sulle istanze Apprendimento basato sulle istanze Apprendimento basato sulle istanze Apprendimento: semplice memorizzazione di tutti gli esempi Classificazione di una nuova istanza x j : reperimento degli

Dettagli

La Statistica: introduzione e approfondimenti

La Statistica: introduzione e approfondimenti La Statistica: introduzione e approfondimenti Definizione di statistica Che cosa è la statistica? La statistica è una disciplina scientifica che trae i suoi risultati dalla raccolta, dall elaborazione

Dettagli

Luigi Santoro. Hyperphar Group S.p.A., MIlano

Luigi Santoro. Hyperphar Group S.p.A., MIlano Come modellare il rischio Luigi Santoro Hyperphar Group S.p.A., MIlano Gli argomenti discussi Le definizioni del termine rischio L utilità di un modello predittivo di rischio Come costruire modelli predittivi

Dettagli

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica Statistica Corso Base (Serale) Dott.ssa Cristina Mollica cristina.mollica@uniroma1.it Caratteri e distribuzioni di frequenza Esercizio 1: Stabilire la tipologia dei seguenti caratteri (Qualitativo Nominale,

Dettagli

Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione

Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze

Dettagli

Esercitazioni di Statistica: ES.1.1

Esercitazioni di Statistica: ES.1.1 Esercitazioni di Statistica: ES.1.1 Le componenti fondamentali dell analisi statistica Unità statistica Oggetto dell osservazione di ogni fenomeno individuale che costituisce il fenomeno collettivo Carattere

Dettagli

Variabili e scale di misura

Variabili e scale di misura Variabili e scale di misura Statistica descrittiva e Analisi multivariata Prof. Giulio Vidotto PSY-NET: Corso di laurea online in Discipline della ricerca psicologico-sociale IL CAMPIONAMENTO Esempio:

Dettagli

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel: UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525 2 LEZIONE Statistica descrittiva STATISTICA DESCRITTIVA Rilevazione dei dati Rappresentazione

Dettagli

Università degli Studi di Napoli. Corso di Laurea in Management per le Imprese Turistiche. STATISTICA per il Turismo. I Lezione

Università degli Studi di Napoli. Corso di Laurea in Management per le Imprese Turistiche. STATISTICA per il Turismo. I Lezione Università degli Studi di Napoli Parthenope Facoltà di ECONOMIA Corso di Laurea in Management per le Imprese Turistiche STATISTICA per il Turismo I Lezione Docente: Sergio Longobardi a.a. a 2010/2011 sergio.longobardi@uniparthenope.it

Dettagli

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI

Dettagli

Contenuti: Capitolo 14 del libro di testo

Contenuti: Capitolo 14 del libro di testo Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4

Dettagli

Statistica descrittiva

Statistica descrittiva Statistica descrittiva Caso di 1 variabile: i dati si presentano in una tabella: Nome soggetto Alabama Dato 11.6.. Per riassumere i dati si costruisce una distribuzione delle frequenze. 1 Si determina

Dettagli

L Analisi Multidimensionale dei Dati

L Analisi Multidimensionale dei Dati L Analisi Multidimensionale dei Dati Analisi Discriminante Una Statistica da vedere Area Clienti intermedi Area Buoni clienti Area Cattivi clienti Classificazione a priori Buoni Intermedi Cattivi TOT.

Dettagli

Psicometria (8CFU) SCALE DI MISURA

Psicometria (8CFU) SCALE DI MISURA SCALE DI MISURA SCALE DI MISURA Esistono diversi livelli di misurazione corrispondenti alle diverse proprietà dei numeri Scala Nominale Scala Ordinale Scala a Intervalli Scala a Rapporti SCALA NOMINALE

Dettagli

Calcolo dell inflazione per differenti tipologie di famiglie milanesi

Calcolo dell inflazione per differenti tipologie di famiglie milanesi Settore Statistica e S.I.T Servizio Statistica Calcolo dell inflazione per differenti tipologie di famiglie milanesi Introduzione L Indagine sui consumi delle famiglie milanesi realizzata dalla Camera

Dettagli

Statistica multivariata 27/09/2016. D.Rodi, 2016

Statistica multivariata 27/09/2016. D.Rodi, 2016 Statistica multivariata 27/09/2016 Metodi Statistici Statistica Descrittiva Studio di uno o più fenomeni osservati sull INTERA popolazione di interesse (rilevazione esaustiva) Descrizione delle caratteristiche

Dettagli

a.a Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno

a.a Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno a.a. 2007-2008 Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno Dott.ssa Daniela Alessi daniela.alessi@med.unipmn.it 1 Argomenti:

Dettagli

Inferenza statistica Donata Rodi 04/10/2016

Inferenza statistica Donata Rodi 04/10/2016 Inferenza statistica Donata Rodi 04/10/2016 Popolazione Campionamento Campione Parametri Inferenza Statistiche µ, ϭ 2 descrittive Stima X, s 2 Quale test? Parametrico o no Scala di misura 1 gruppo 2 gruppi

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Indici di posizione variabilità e forma per caratteri qualitativi Il seguente data set riporta la rilevazione

Dettagli

La matrice delle correlazioni è la seguente:

La matrice delle correlazioni è la seguente: Calcolo delle componenti principali tramite un esempio numerico Questo esempio numerico puó essere utile per chiarire il calcolo delle componenti principali e per introdurre il programma SPAD. IL PROBLEMA

Dettagli

Richiami di probabilità. Decision Theory e Utilità. Richiami di probabilità. assumere certi valori in un insieme x 1, x 2, x n (dominio)

Richiami di probabilità. Decision Theory e Utilità. Richiami di probabilità. assumere certi valori in un insieme x 1, x 2, x n (dominio) 9 lezione Scaletta argomenti: Probabilità Richiami di probabilità Reti Bayesiane Decision Theory e Utilità 1 Richiami di probabilità - La formalizzazione deriva da Boole - Concetto di VARIABILE CASUALE

Dettagli

Analisi della Varianza Fattoriale

Analisi della Varianza Fattoriale Analisi della Varianza Fattoriale AMD Marcello Gallucci marcello.gallucci@unimib.it Ripasso dell ANOVA Lo studio degli effetti di una serie di variabili indipendenti nominale (gruppi) su un variabile dipendente

Dettagli

Data set relativo a 40 titolari di esercizi commerciali. Durata del percorso casa lavoro (in minuti) Numero dipendenti che lavorano nel negozio

Data set relativo a 40 titolari di esercizi commerciali. Durata del percorso casa lavoro (in minuti) Numero dipendenti che lavorano nel negozio ESERCITAZIONE 1: VARIABILI E DISTRIBUZIONI 1.TIPOLOGIA DEI DATI 2. CALCOLO DI FREQUENZE 3. RAPPRESENTAZIONE GRAFICA DI UNA VARIABILE A Roma nel 2006 è stata effettuata un indagine, tramite questionario,

Dettagli

INDICATORI DI TENDENZA CENTRALE

INDICATORI DI TENDENZA CENTRALE Psicometria (8 CFU) Corso di laurea triennale INDICATORI DI TENDENZA CENTRALE Torna alla pri ma pagina INDICATORI DI TENDENZA CENTRALE Consentono di sintetizzare un insieme di misure tramite un unico valore

Dettagli

Il calcolo del VAR operativo mediante la metodologia stocastica parametrica. Simona Cosma

Il calcolo del VAR operativo mediante la metodologia stocastica parametrica. Simona Cosma Il calcolo del VAR operativo mediante la metodologia stocastica parametrica Simona Cosma Contenuti Il VAR operativo: inquadramento concettuale La metodologia attuariale EVT (Extreme Value Theory) Il VAR

Dettagli

STATISTICA NOZIONI DI BASE

STATISTICA NOZIONI DI BASE STATISTICA NOZIONI DI BASE Italo Nofroni Statistica medica - Sapienza - Roma Si definisce statistica la scienza cha ha per oggetto la raccolta, l analisi e l interpretazione dei dati (intensità e/o frequenze)

Dettagli

Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità

Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità 18 Febbraio 2016 1. La probabilità di errore nella trasmissione di una cifra binaria attraverso un certo canale di comunicazione

Dettagli

Prova Pratica di Statistica I+II - Prof. M. Romanazzi

Prova Pratica di Statistica I+II - Prof. M. Romanazzi 1 Università di Venezia - Corso di Statistica I + II (Cb-Ga) Prova Pratica di Statistica I+II - Prof. M. Romanazzi 3 Giugno 2008 Cognome e Nome............................................ N. Matricola............

Dettagli

Analisi della varianza a una via

Analisi della varianza a una via Analisi della varianza a una via Statistica descrittiva e Analisi multivariata Prof. Giulio Vidotto PSY-NET: Corso di laurea online in Discipline della ricerca psicologico-sociale SOMMARIO Modelli statistici

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

Prof. Giulio Vidotto (Università di Padova) Lez Trasformazione delle misure e significanza delle statistiche

Prof. Giulio Vidotto (Università di Padova) Lez Trasformazione delle misure e significanza delle statistiche Trasformazione e Significanza delle Statistiche: Invarianza assoluta Invarianza di riferimento Invarianza di confronto Schemi Riassuntivi Significanza e Trasformazioni delle Statistiche Per cui Data una

Dettagli

RICETTIVITÀ TURISTICA a.a. 2008/09

RICETTIVITÀ TURISTICA a.a. 2008/09 RICETTIVITÀ TURISTICA a.a. 2008/09 PROF. FRANCESCO MARANGON Dipartimento di Scienze Economiche Come è descritto in microeconomia il problema di scelta del Secondo l ottica consequenzialista la scelta tra

Dettagli

Riconoscimento automatico di oggetti (Pattern Recognition)

Riconoscimento automatico di oggetti (Pattern Recognition) Riconoscimento automatico di oggetti (Pattern Recognition) Scopo: definire un sistema per riconoscere automaticamente un oggetto data la descrizione di un oggetto che può appartenere ad una tra N classi

Dettagli

Lab. 2 - Excel. Prof. De Michele e Farina

Lab. 2 - Excel. Prof. De Michele e Farina Lab. 2 - Excel Prof. De Michele e Farina 1 Utilizzo avanzato di un foglio elettronico: - Utilizzo di funzioni Regressioni lineari Istogrammi 2 La funzione somma restituisce la somma dei valori dei propri

Dettagli

Le graduatorie basate su una molteplicità di indicatori. I pericoli della sintesi di variabili disomogenee.

Le graduatorie basate su una molteplicità di indicatori. I pericoli della sintesi di variabili disomogenee. Le graduatorie basate su una molteplicità di indicatori. I pericoli della sintesi di variabili disomogenee. Sovente è necessario stabilire delle graduatorie tra unità statistiche. In azienda il problema

Dettagli

1.1 CLASSIFICAZIONE DI VARIABILI

1.1 CLASSIFICAZIONE DI VARIABILI 1.1 CLASSIFICAZIONE DI VARIABILI Classificare le seguenti variabili in qualitative e quantitative; nel primo caso stabilire se sono nominali o ordinali, nel secondo caso stabilire se sono discrete o continue.

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it ANALISI DELLE CORRISPONDENZE (cap. VII) Problema della riduzione delle dimensioni L ANALISI DELLE COMPONENTI PRINCIPALI

Dettagli

ESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante.

ESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante. ESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante. Test di uguaglianza delle medie di gruppo SELF_EFF COLL_EFF COIN_LAV IMPEGNO SODDISF CAP_IST COLLEGHI Lambda di Wilks

Dettagli

Quiz di verifica Classificazione

Quiz di verifica Classificazione Quiz di verifica Classificazione Strumenti Quantitativi per la gestione Le domande 1 4 si riferiscono al seguente problema: Supponiamo di raccogliere dati per un gruppo di studenti della classe di SQG

Dettagli

Statistica Medica A.A. 2010/2011

Statistica Medica A.A. 2010/2011 Statistica Medica A.A. 2010/2011 COMINCIAMO DALLA FINE RESEARCH COMINCIAMO DALLA FINE COMINCIAMO DALLA FINE COMINCIAMO DALLA FINE COMINCIAMO DALLA FINE COMINCIAMO DALLA FINE Cosa è la statistica Come

Dettagli

Corso di Intelligenza Artificiale A.A. 2016/2017

Corso di Intelligenza Artificiale A.A. 2016/2017 Università degli Studi di Cagliari Corsi di Laurea Magistrale in Ing. Elettronica Corso di Intelligenza rtificiale.. 26/27 Esercizi sui metodi di apprendimento automatico. Si consideri la funzione ooleana

Dettagli

8. ANALISI DELLA COVARIANZA (ANCOVA)

8. ANALISI DELLA COVARIANZA (ANCOVA) 8. ANALISI DELLA COVARIANZA (ANCOVA) L analisi della covarianza è un metodo statistico che risulta dalla combinazione dell analisi di regressione con l analisi della varianza. È utile quando all analisi

Dettagli

I TEST STATISTICI. dott.ssa Gabriella Agrusti

I TEST STATISTICI. dott.ssa Gabriella Agrusti I TEST STATISTICI dott.ssa Gabriella Agrusti Dulcis in fundo.. come scegliere un test statistico in base all ipotesi come stabilire se due variabili sono associate (correlazione di Pearson) come stabilire

Dettagli

NOZIONE DI VARIABILE. Varie accezioni

NOZIONE DI VARIABILE. Varie accezioni NOZIONE DI VARIABILE Varie accezioni - espediente fisico mediante il quale si rileva e si registra lo stato o modalità secondo il/la quale una determinata proprietà (grandezza o attributo) si presenta

Dettagli

INDICATORI DI TENDENZA CENTRALE

INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE Consentono di sintetizzare un insieme di misure tramite un unico valore rappresentativo indice che riassume o descrive i dati e dipende dalla

Dettagli

Variabilità. ..senza variabilità non ci sarebbe la statistica

Variabilità. ..senza variabilità non ci sarebbe la statistica Variabilità..senza variabilità non ci sarebbe la statistica Se tutti votassimo lo stesso partito alle elezioni (=moda), non ci sarebbero i sondaggi, nè le previsioni elettorali il voto politico sarebbe

Dettagli

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale INDICATORI DI TENDENZA CENTRALE Consentono di sintetizzare un insieme di misure tramite un unico valore rappresentativo indice che riassume o descrive i dati e dipende dalla scala di misura dei dati in

Dettagli

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici) Statistica La statistica può essere vista come la scienza che organizza ed analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva:

Dettagli

Analisi della varianza

Analisi della varianza 1. 2. univariata ad un solo fattore tra i soggetti (between subjects) 3. univariata: disegni fattoriali 4. univariata entro i soggetti (within subjects) 5. : disegni fattoriali «misti» L analisi della

Dettagli

Con riferimento ai dati riportati nella seguente tabella, indicare la tipologia dei caratteri rilevati.

Con riferimento ai dati riportati nella seguente tabella, indicare la tipologia dei caratteri rilevati. Corso di Laurea INTERFACOLTÀ - Esercitazione di Statistica n 1 ESERCIZIO 1: Con riferimento ai dati riportati nella seguente tabella, indicare la tipologia dei caratteri rilevati. ESERCIZIO 1 Soluzione:

Dettagli

Machine Learning: apprendimento, generalizzazione e stima dell errore di generalizzazione

Machine Learning: apprendimento, generalizzazione e stima dell errore di generalizzazione Corso di Bioinformatica Machine Learning: apprendimento, generalizzazione e stima dell errore di generalizzazione Giorgio Valentini DI Università degli Studi di Milano 1 Metodi di machine learning I metodi

Dettagli

Modulo di Statistica e Tecnologia (Dott. Giorgio Poletti

Modulo di Statistica e Tecnologia (Dott. Giorgio Poletti Laurea in Scienze dell Educazione Insegnamento di Pedagogia Sperimentale (Prof. Paolo Frignani) Modulo di Statistica e Tecnologia (Dott. Giorgio Poletti giorgio.poletti@unife.it) VARIABILI INDIPENDENTI

Dettagli

VARIETÀ. zona geografica A B C D

VARIETÀ. zona geografica A B C D Anova a 2 vie con repliche (( chiarire che non devono essere esattamente nello stesso numero per ogni cella ovvero per le ripetizioni dei de fattori ma che excel li legge così) Esercizio-esempio 1 Il valore

Dettagli

Modellazione di sistemi ingegneristici (parte 2 di 2)

Modellazione di sistemi ingegneristici (parte 2 di 2) Corso di Teoria dei Sistemi Modellazione di sistemi ingegneristici (parte 2 di 2) Prof. Ing. Daniele Testi DESTeC, Dipartimento di Ingegneria dell Energia, dei Sistemi, del Territorio e delle Costruzioni

Dettagli

Lezione 1: Introduzione. Prof. Massimo Aria

Lezione 1: Introduzione. Prof. Massimo Aria Lezione 1: Introduzione Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Introduzione La Statistica Il termine statistica deriva, nella lingua italiana,

Dettagli

Classificazione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Classificazione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007 Classificazione Introduzione I modelli di classificazione si collocano tra i metodi di apprendimento supervisionato e si rivolgono alla predizione di un attributo target categorico. A partire da un insieme

Dettagli

standardizzazione dei punteggi di un test

standardizzazione dei punteggi di un test DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it standardizzazione dei punteggi di un test serve a dare significato ai punteggi che una persona ottiene ad un test, confrontando la

Dettagli

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione [1/2] Gli indici di variabilità consentono di riassumere le principali caratteristiche di una distribuzione (assieme alle medie) Le

Dettagli

Statistica per le ricerche di mercato

Statistica per le ricerche di mercato Università degli studi della Tuscia Dipartimento di Economia e Impresa Statistica per le ricerche di mercato a.a. 2014/15 Prof.ssa Tiziana Laureti 01. Introduzione al corso 1 Statistica per le ricerche

Dettagli

I modelli lineari generalizzati per la tariffazione nel ramo RCA: applicazione

I modelli lineari generalizzati per la tariffazione nel ramo RCA: applicazione I modelli lineari generalizzati per la tariffazione nel ramo RCA: applicazione Giuseppina Bozzo Giuseppina Bozzo Considerazioni preliminari La costruzione di un GLM è preceduta da alcune importanti fasi:

Dettagli

Copyright Esselibri S.p.A.

Copyright Esselibri S.p.A. 70 3000 500 000 1500 1000 500 A B C D (a) Capitolo Terzo A B C D 500 1000 1500 000 5003000 3500 Fig. 1 - Ortogramma a colonne (a) e ortogramma a nastri (b) 4. MISURE DI ASSOCIAZIONE E DI COGRADUAZIONE

Dettagli

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi) CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON

Dettagli

INDICATORI DI TENDENZA CENTRALE

INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE Consentono di sintetizzare un insieme di misure tramite un unico valore rappresentativo è indice che riassume o descrive i dati e dipende

Dettagli

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill Statistica - metodologie per le scienze economiche e sociali /e S. Borra, A. Di Ciaccio - McGraw Hill Es.. Soluzione degli esercizi del capitolo 4 4. Il sistema d ipotesi è: μ 7, H : μ 7, Essendo 0 : t,

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro

Dettagli

Analisi dell'efficacia. Saverio Bergonzi. dell'intervento

Analisi dell'efficacia. Saverio Bergonzi. dell'intervento Analisi dell'efficacia Saverio Bergonzi dell'intervento obiettivi - evidenziare i cambiamenti nei pazienti sottoposti a trattamento residenziale - individuare i fattori legati ai cambiamenti - costruire

Dettagli

MODELLI DI SVALUTAZIONE

MODELLI DI SVALUTAZIONE Milano, 8 aprile 2014 MODELLI DI SVALUTAZIONE Metodologie e problematiche di applicazione al confidi INDICE Contesto di riferimento ed obiettivo dell intervento Approccio metodologico proposto FASE 1 -

Dettagli

esercitazione1 12/10/2015

esercitazione1 12/10/2015 esercitazione1 12/10/2015 VARIABILE CLASSIFICAZIONE TIPOLOGIA Peso vivo del cavallo Ora della deposizione dell uovo Colore mantello Presenza corna Latte prodotto N. uova prodotte Presenza speroni alle

Dettagli

Cognome e Nome:... Matricola e corso di laurea:...

Cognome e Nome:... Matricola e corso di laurea:... Statistica - corso base Prof. B. Liseo Prova di esame dell 8 gennaio 2014 Cognome e Nome:................................................................... Matricola e corso di laurea:...................................................

Dettagli

Teoria e tecniche dei test. Concetti di base

Teoria e tecniche dei test. Concetti di base Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi

Dettagli

Comprendere i bisogni dei contribuenti e le realtà territoriali da amministrare e controllare.

Comprendere i bisogni dei contribuenti e le realtà territoriali da amministrare e controllare. INDAGINE CONOSCITIVA SUGLI ORGANISMI DELLA FISCALITA E SUL RAPPORTO TRA CONTRIBUENTI E FISCO AUDIZIONE DEL DIRETTORE DELL AGENZIA DELLE ENTRATE SENATO DELLA REPUBBLICA VI COMMISSIONE FINANZE E TESORO Roma

Dettagli

Elementi di Statistica

Elementi di Statistica Università degli Studi di Palermo Dipartimento di Ingegneria Informatica Informatica ed Elementi di Statistica 3 c.f.u. Anno Accademico 2010/2011 Docente: ing. Salvatore Sorce Elementi di Statistica Statistica

Dettagli

Segmentazione e posizionamento

Segmentazione e posizionamento Segmentazione e posizionamento Le scelte fondamentali del marketing La dimensione strategica del marketing costituisce un area di intersezione-integrazione con la funzione di pianificazione strategica.

Dettagli

Segmentazione e posizionamento

Segmentazione e posizionamento Segmentazione e posizionamento Obiettivi della lezione La segmentazione e la definizione del mercato obiettivo Il posizionamento competitivo Perché segmentare il mercato? Per suddividere il mercato di

Dettagli

Elementi di statistica medica

Elementi di statistica medica DEFINIZIONE DI STATISTICA Elementi di statistica medica Introduzione Analisi quantitativa dei fenomeni collettivi allo scopo di descriverli e di individuare leggi e modelli che, classificando le loro variazioni,

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A) Prova scritta di STATISTICA CDL Biotecnologie (Programma di Massimo Cristallo - A) 1. Un associazione di consumatori, allo scopo di esaminare la qualità di tre diverse marche di batterie per automobili,

Dettagli

Indici di variabilità ed eterogeneità

Indici di variabilità ed eterogeneità Indici di variabilità ed eterogeneità Corso di STATISTICA Prof. Roberta Siciliano Ordinario di Statistica, Università di apoli Federico II Professore supplente, Università della Basilicata a.a. 011/01

Dettagli

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari"

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in Scienze e Tecnologie Alimentari Levine, Krehbiel, Berenson Statistica Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari" Unità Integrata Organizzativa

Dettagli

Grandezze fisiche e loro misura

Grandezze fisiche e loro misura Grandezze fisiche e loro misura Cos è la fisica? e di che cosa si occupa? - Scienza sperimentale che studia i fenomeni naturali suscettibili di sperimentazione e caratterizzati da entità o grandezze misurabili.

Dettagli