Cenni sulla cluster analysis

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Cenni sulla cluster analysis"

Transcript

1 Cenni sulla cluster analysis

2 Distanze Dato un insieme E, una funzione d: E X E -> R + che ha le seguenti tre proprietà: d(x i, x j ) = 0 x i = x j d(x i, x j ) = d(x j, x i ) d(x i, x j ) d(x j, x h ) + d(x h, x j ) (disuguaglianza triangolare) è una distanza. Se vale d(x i, x j ) max {d(x j, x h ); d(x h, x j )} per ogni terna si ha una distanza ultrametrica. Ogni ultrametrica èuna distanza, ma non sempre èvero il contrario.

3 Indici di diversità Proprietà(meno forti di quelle delle distanze): 1) Δ(x i, x j ) 0 2) x i = x j Δ(x i, x j ) = 0 ATT.! Non sempre è vero il contrario 3) Δ(x i, x j ) = Δ(x j, x i ) Se nella 2) vale si hanno gli indici di distanza (che non sono distanze) Se si suppone valida la disuguaglianza triangolare si hanno le distanze.

4 La cluster analysis Linneo: Tutta la nostra conoscenza dipende dal modo con il quale distinguiamo il simile dal dissimile I limiti dei generi non possono essere individuati a priori. Finalità: svariate. Tra le tante: INDIVIDUARE OMOGENEITA TRA LE UNITA STATISTICHE

5 Tipologie di impiego (1/3) A Esistono dei gruppi (definizione assiomatica di gruppo omogeneo in funzione di una matrice di distanze o di similarità e di una o piùsogli prefissate) Se ne accerta l esistenza rispetto a: - Indicatori prescelti (variabili e/o mutabili) - Algoritmo di clustering

6 Tipologie di impiego (2/3) B Non esistono dei gruppi Analisi tipologica (ricerca di gruppi omogenei indipendentemente dalla loro esistenza e senza porsi problemi di conformitàa modelli teorici)

7 Tipologie di impiego (3/3) Sia per Ache per B: Scelta (soggettiva) di variabili e mutabili Scelta dell algoritmo, con preferenza per i metodi aggregativi, pur se teoricamente più deboli) NON ESISTONO VARIABILI SPIEGATE

8 Metodi di clustering Gerarchici Algoritmi scissori (top-down) - Superiorità teorica - Limiti di applicabilità Algoritmi aggregativi (bottom-up) - Di facile applicazione -Spesso influenzati dalla scelta iniziale Per tutti i metodi gerarchici: l assegnazione di un oggetto a un cluster è irrevocabile. Non gerarchici Solo di tipo aggregativo. Generano un unica partizione, tramite successive allocazioni (e ri-allocazioni) degli oggetti fino a giungere a una partizione c.d. «ottima»(sulla base di un criterio predefinito). L assegnazione di un oggetto a un cluster NON è irrevocabile.

9 Metodi aggregativi Validi, in genere, per una qualsiasi matrice di distanze o di similarità. Metodo del legame singolo (nearest neighbour) Metodo del legame medio Metodo del legame completo (furthest neighbour)

10 Metodi aggregativi Si basano tutti su un criterio di distanza minima. 1 Definire la distanza 2 Inizialmente, ogni unitàfa gruppo a sé 3 Fusioni successive tra le unitàcon distanza minore, fino a giungere ad un solo gruppo 4. Individuazione soggettivadel numero ottimale di gruppi

11 Legame singolo

12 Legame medio Nel calcolo della matrice delle distanze, si sostituisce la modalitàrelativa a ciascuna variabile con la media delle modalitàdel gruppo.

13 Legame completo Si basa su un criterio di distanza massima. Si considera come distanza il massimo delle distanze, anzichéil minimo come nel legame singolo.

14 Metodo del centroide Si applica solo a variabili quantitative. Per ogni gruppo (anche se formato solo da n = 1 oggetti) si calcola il baricentro; la distanza tra i gruppi ècalcolata come distanza tra i baricentri.

15 Quante distanze da calcolare? N Distanze da calcolare N Distanze da calcolare * * Cioècirca lo stesso numero di funzioni da calcolare per la prima suddivisione per n = 25 se si utilizza uno dei piùnoti algoritmi scissori (Cavalli-Sforza)

16 Metodi non gerarchici Aggregazioni dinamiche Si fissano (a caso) g centri provvisori. K-means Si assumono come centri provvisori i primi k individui. Si allocano via via le n-k unitàe ad ogni assegnazione si ricalcola subito il centroide del gruppo che si è modificato. In tal modo si accelera il miglioramento della classificazione. Il processo si arresta quando la differenza tra DW t-1 -DW t è minore di una soglia prefissata.

17 L algoritmo potrebbe convergere ad un ottimo locale (e non globale). Per ovviare a tale problema si può ripetere l analisi partendo da altri nuclei iniziali, cercando i gruppi stabili.

18 Dendrogramma

19 Per approfondire Fraire, M., Rizzi, A. Analisi dei dati per il data mining, Carocci, 2011, capp. 2 e 4 Terzi, S. La Cluster analysis, disponibile on line all indirizzo: host.uniroma3.it/facolta/economia/db/materiali/insegna menti/185_903.pdf

Statistica per l Impresa

Statistica per l Impresa Statistica per l Impresa a.a. 207/208 Tecniche di Analisi Multidimensionale Analisi dei Gruppi 2 maggio 208 Indice Analisi dei Gruppi: Introduzione Misure di distanza e indici di similarità 3. Metodi gerarchici

Dettagli

Intelligenza Artificiale. Clustering. Francesco Uliana. 14 gennaio 2011

Intelligenza Artificiale. Clustering. Francesco Uliana. 14 gennaio 2011 Intelligenza Artificiale Clustering Francesco Uliana 14 gennaio 2011 Definizione Il Clustering o analisi dei cluster (dal termine inglese cluster analysis) è un insieme di tecniche di analisi multivariata

Dettagli

Metodi di classificazione. Loredana Cerbara

Metodi di classificazione. Loredana Cerbara Loredana Cerbara I metodi di classificazione, anche detti in inglese cluster analysis, attengono alla categoria dei metodi esplorativi. Esistono centinaia di metodi di classificazione dei dati ed hanno

Dettagli

SDE Marco Riani

SDE Marco Riani SDE 2017 Marco Riani mriani@unipr.it http://www.riani.it LA CLASSIFICAZIONE Problema generale della scienza (Linneo, ) Analisi discriminante Cluster Analysis (analisi dei gruppi) ANALISI DISCRIMINANTE

Dettagli

I modelli di analisi statistica multidimensionale dei dati: La Cluster Analysis Gerarchica

I modelli di analisi statistica multidimensionale dei dati: La Cluster Analysis Gerarchica Titolo della lezione: I modelli di analisi statistica multidimensionale dei dati: La Cluster Analysis Gerarchica Obiettivi dell unità didattica Comprendere l insieme delle procedure che si prefiggono di

Dettagli

Le Ricerche di Marketing rappresentano il necessario presupposto per la definizione di vincenti strategie di mercato, poiché forniscono il supporto

Le Ricerche di Marketing rappresentano il necessario presupposto per la definizione di vincenti strategie di mercato, poiché forniscono il supporto Le Ricerche di Marketing rappresentano il necessario presupposto per la definizione di vincenti strategie di mercato, poiché forniscono il supporto di dati affidabili e accurati alle decisioni manageriali

Dettagli

I metodi di Classificazione automatica

I metodi di Classificazione automatica L Analisi Multidimensionale dei Dati Una Statistica da vedere I metodi di Classificazione automatica Matrici e metodi Strategia di AMD Anal Discrimin Segmentazione SI Per riga SI Matrice strutturata NO

Dettagli

Obiettivo: assegnazione di osservazioni a gruppi di unità statistiche non definiti a priori e tali che:

Obiettivo: assegnazione di osservazioni a gruppi di unità statistiche non definiti a priori e tali che: Cluster Analysis Obiettivo: assegnazione di osservazioni a gruppi di unità statistiche non definiti a priori e tali che: le unità appartenenti ad uno di essi sono il più possibile omogenee i gruppi sono

Dettagli

Riconoscimento e recupero dell informazione per bioinformatica

Riconoscimento e recupero dell informazione per bioinformatica Riconoscimento e recupero dell informazione per bioinformatica Clustering: validazione Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Definizione

Dettagli

Riconoscimento e recupero dell informazione per bioinformatica. Clustering: validazione. Manuele Bicego

Riconoscimento e recupero dell informazione per bioinformatica. Clustering: validazione. Manuele Bicego Riconoscimento e recupero dell informazione per bioinformatica Clustering: validazione Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Definizione

Dettagli

Statistica per l Impresa

Statistica per l Impresa Statistica per l Impresa a.a. 2017/2018 Tecniche di Analisi Multidimensionale Analisi dei Gruppi 9 maggio 2018 Indice Analisi dei Gruppi: Introduzione Misure di distanza e indici di similarità Metodi gerarchici

Dettagli

APPUNTI DI CLUSTER ANALYSIS (Paola Vicard)

APPUNTI DI CLUSTER ANALYSIS (Paola Vicard) APPUNTI DI CLUSTER ANALYSIS (Paola Vicard) Obiettivi della cluster analysis La cluster analysis è una delle principali tecniche di analisi statistica multivariata per raggruppare le unità osservate in

Dettagli

Statistica per l Impresa

Statistica per l Impresa Statistica per l Impresa a.a. 2017/2018 Tecniche di Analisi Multidimensionale Analisi dei Gruppi 23 aprile 2018 Indice 1. Analisi dei Gruppi: Introduzione 2. Misure di distanza e indici di similarità 3.

Dettagli

Cluster Analysis. La Cluster Analysis è il processo attraverso il quale vengono individuati raggruppamenti dei dati. per modellare!

Cluster Analysis. La Cluster Analysis è il processo attraverso il quale vengono individuati raggruppamenti dei dati. per modellare! La Cluster Analysis è il processo attraverso il quale vengono individuati raggruppamenti dei dati. Le tecniche di cluster analysis vengono usate per esplorare i dati e non per modellare! La cluster analysis

Dettagli

TECNICHE DI CLASSIFICAZIONE

TECNICHE DI CLASSIFICAZIONE TECNICHE DI CLASSIFICAZIONE La tecnica di classificazione più conosciuta è la cluster analysis, che ha l obiettivo di identificare gruppi di soggetti (o oggetti) omogenei al loro interno ed eterogenei

Dettagli

ANALISI DEI CLUSTER. In questo documento presentiamo alcune opzioni analitiche della procedura di analisi de cluster di

ANALISI DEI CLUSTER. In questo documento presentiamo alcune opzioni analitiche della procedura di analisi de cluster di ANALISI DEI CLUSTER In questo documento presentiamo alcune opzioni analitiche della procedura di analisi de cluster di SPSS che non sono state incluse nel testo pubblicato. Si tratta di opzioni che, pur

Dettagli

Prova scritta di ASM - Modulo Analisi Esplorativa del

Prova scritta di ASM - Modulo Analisi Esplorativa del Cognome:... Nome:... Matricola:......... Prova scritta di ASM - Modulo Analisi Esplorativa del 14.02.2017 La durata della prova è di 90 minuti. Si svolgano gli esercizi A e B riportando il risultato dove

Dettagli

Misura della performance di ciascun modello: tasso di errore sul test set

Misura della performance di ciascun modello: tasso di errore sul test set Confronto fra modelli di apprendimento supervisionato Dati due modelli supervisionati M 1 e M costruiti con lo stesso training set Misura della performance di ciascun modello: tasso di errore sul test

Dettagli

Clustering. Clustering

Clustering. Clustering 1/40 Clustering Iuri Frosio frosio@dsi.unimi.it Approfondimenti in A.K. Jan, M. N. Murty, P. J. Flynn, Data clustering: a review, ACM Computing Surveys, Vol. 31, No. 3, September 1999, ref. pp. 265-290,

Dettagli

Introduzione all analisi di arrays: clustering.

Introduzione all analisi di arrays: clustering. Statistica per la Ricerca Sperimentale Introduzione all analisi di arrays: clustering. Lezione 2-14 Marzo 2006 Stefano Moretti Dipartimento di Matematica, Università di Genova e Unità di Epidemiologia

Dettagli

Corso di Laurea di Scienze biomolecolari e ambientali Laurea magistrale

Corso di Laurea di Scienze biomolecolari e ambientali Laurea magistrale UNIVERSITA DEGLI STUDI DI PERUGIA Dipartimento di Chimica, Biologia e Biotecnologie Via Elce di Sotto, 06123 Perugia Corso di Laurea di Scienze biomolecolari e ambientali Laurea magistrale Corso di ANALISI

Dettagli

5. Analisi dei Gruppi (Cluster Analysis)

5. Analisi dei Gruppi (Cluster Analysis) 5. Analisi dei Gruppi (Cluster Analysis) Cosa è l analisi dei gruppi? Viene utilizzata per classificare rispondenti in gruppi omogenei detti clusters. Esamina relazioni di interdipendenza: nessuna distinzione

Dettagli

Cluster Analysis Distanze ed estrazioni Marco Perugini Milano-Bicocca

Cluster Analysis Distanze ed estrazioni Marco Perugini Milano-Bicocca Cluster Analysis Distanze ed estrazioni M Q Marco Perugini Milano-Bicocca 1 Scopi Lo scopo dell analisi dei Clusters è di raggruppare casi od oggetti sulla base delle loro similarità in una serie di caratteristiche

Dettagli

Strategie risolutive e algoritmi per problemi di partizionamento ottimo di grafi

Strategie risolutive e algoritmi per problemi di partizionamento ottimo di grafi Strategie risolutive e algoritmi per problemi di partizionamento ottimo di grafi Natascia Piroso 12 luglio 2007 Natascia Piroso Partizionamento ottimo di grafi 12 luglio 2007 1 / 17 Definizione Dato un

Dettagli

Maria Brigida Ferraro + Luca Tardella

Maria Brigida Ferraro + Luca Tardella Cluster Maria Brigida Ferraro + Luca Tardella e-mail: mariabrigida.ferraro@uniroma1.it, ferraromb@gmail.com Lezione #3: Cluster Obiettivi del modulo Cluster 1 Introduzione ai problemi di classificazione

Dettagli

Statistica per le ricerche di mercato

Statistica per le ricerche di mercato Statistica per le ricerche di mercato A.A. 2012/13 Dr. Luca Secondi 15. Tecniche di analisi statistica multivariata per la segmentazione del mercato Cluster Analysis 1 Cluster analysis La cluster analysis

Dettagli

Misure di diversità tra unità statistiche. Loredana Cerbara

Misure di diversità tra unità statistiche. Loredana Cerbara Misure di diversità tra unità statistiche Loredana Cerbara LA DISTANZA IN STATISTICA In statistica la distanza ha un significato diverso da quello che si può intuire in altre discipline, dove, peraltro,

Dettagli

Riconoscimento e recupero dell informazione per bioinformatica

Riconoscimento e recupero dell informazione per bioinformatica Riconoscimento e recupero dell informazione per bioinformatica Clustering: introduzione Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Una definizione

Dettagli

Esercizi di preparazione per il primo esonero

Esercizi di preparazione per il primo esonero Esercizi di preparazione per il primo esonero Metodi Statistici per il Marketing a.a. 2017/2018 Esercizio Cluster Su un campione di 5 clienti di una libreria sono stati rilevati gli acquisti per alcune

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it LA CLASSIFICAZIONE CAP IX, pp.367-457 Problema generale della scienza (Linneo, ) Analisi discriminante Cluster Analysis

Dettagli

Data Science A.A. 2018/2019

Data Science A.A. 2018/2019 Corso di Laurea Magistrale in Economia Data Science A.A. 2018/2019 Lez. 5 Data Mining Data Science 2018/2019 1 Data Mining Processo di esplorazione e analisi di un insieme di dati, generalmente di grandi

Dettagli

Algoritmi greedy. Gli algoritmi che risolvono problemi di ottimizzazione devono in genere operare una sequenza di scelte per arrivare alla soluzione

Algoritmi greedy. Gli algoritmi che risolvono problemi di ottimizzazione devono in genere operare una sequenza di scelte per arrivare alla soluzione Algoritmi greedy Gli algoritmi che risolvono problemi di ottimizzazione devono in genere operare una sequenza di scelte per arrivare alla soluzione Gli algoritmi greedy sono algoritmi basati sull idea

Dettagli

Regole associative Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Regole associative Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007 Regole associative Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 26/27 Introduzione Le regole associative si collocano tra i metodi di apprendimento non supervisionato e sono volte

Dettagli

Le Tecniche di Data Mining

Le Tecniche di Data Mining Cluster Analysis Le Tecniche di Data Mining Le rinciali tecniche di data mining che vedremo sono: Ø Ø Cluster Analysis Alberi Decisionali Cluster Analysis La Cluster Analysis è una tecnica di data mining

Dettagli

Algoritmi greedy. Gli algoritmi che risolvono problemi di ottimizzazione devono in genere operare una sequenza di scelte per arrivare alla soluzione

Algoritmi greedy. Gli algoritmi che risolvono problemi di ottimizzazione devono in genere operare una sequenza di scelte per arrivare alla soluzione Algoritmi greedy Gli algoritmi che risolvono problemi di ottimizzazione devono in genere operare una sequenza di scelte per arrivare alla soluzione Gli algoritmi greedy sono algoritmi basati sull idea

Dettagli

Tesina Intelligenza Artificiale Maria Serena Ciaburri s A.A

Tesina Intelligenza Artificiale Maria Serena Ciaburri s A.A Tesina Intelligenza Artificiale Maria Serena Ciaburri s231745 A.A. 2016-2017 Lo scopo di questa tesina è quello di clusterizzare con l algoritmo K-Means i dati presenti nel dataset MNIST e di calcolare

Dettagli

I modelli lineari generalizzati per la tariffazione nel ramo RCA: applicazione

I modelli lineari generalizzati per la tariffazione nel ramo RCA: applicazione I modelli lineari generalizzati per la tariffazione nel ramo RCA: applicazione Giuseppina Bozzo Giuseppina Bozzo Considerazioni preliminari La costruzione di un GLM è preceduta da alcune importanti fasi:

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

Che cosa è la statistica oggi?

Che cosa è la statistica oggi? Metodologie Statistiche a supporto delle decisioni aziendali: Revenue/Yield Management Prof. Massimo Aria Ricercatore in Statistica Sociale Una breve premessa: Che cosa è la statistica oggi? 1 Statistica

Dettagli

Per definire gli obiettivi e le modalità di una strategia commerciale, una azienda deve essere in grado di:

Per definire gli obiettivi e le modalità di una strategia commerciale, una azienda deve essere in grado di: LA SEGMENTAZIONE DEL MERCATO Per definire gli obiettivi e le modalità di una strategia commerciale, una azienda deve essere in grado di: 1) valutare le caratteristiche, i bisogni e i comportamenti probabili

Dettagli

Statistica multivariata 27/09/2016. D.Rodi, 2016

Statistica multivariata 27/09/2016. D.Rodi, 2016 Statistica multivariata 27/09/2016 Metodi Statistici Statistica Descrittiva Studio di uno o più fenomeni osservati sull INTERA popolazione di interesse (rilevazione esaustiva) Descrizione delle caratteristiche

Dettagli

26. Le aree funzionali

26. Le aree funzionali 26. Le aree funzionali Le funzioni aziendali sono composte da gruppi di operazioni omogenee attraverso le quali il sistema-azienda attua il proprio oggetto e persegue specifici obiettivi. Le aree funzionali

Dettagli

Ricerca di outlier. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna

Ricerca di outlier. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Ricerca di outlier Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Ricerca di Anomalie/Outlier Cosa sono gli outlier? L insieme di dati che sono considerevolmente differenti dalla

Dettagli

La valutazione di adeguatezza nel servizio di consulenza. Seminario Tecnico Milano, 18 novembre 2010

La valutazione di adeguatezza nel servizio di consulenza. Seminario Tecnico Milano, 18 novembre 2010 La valutazione di adeguatezza nel servizio di consulenza Seminario Tecnico Milano, 18 novembre 2010 1 La valutazione di adeguatezza come processo La valutazione di adeguatezza è uno degli elementi che

Dettagli

Ingegneria della Conoscenza e Sistemi Esperti Lezione 2: Apprendimento non supervisionato

Ingegneria della Conoscenza e Sistemi Esperti Lezione 2: Apprendimento non supervisionato Ingegneria della Conoscenza e Sistemi Esperti Lezione 2: Apprendimento non supervisionato Dipartimento di Elettronica e Informazione Politecnico di Milano Apprendimento non supervisionato Dati un insieme

Dettagli

C.da Di Dio - Villaggio S. Agata Messina Italy P.I c.f AMBIENTE STATISTICO. Release /03/2018.

C.da Di Dio - Villaggio S. Agata Messina Italy P.I c.f AMBIENTE STATISTICO. Release /03/2018. AMBIENTE STATISTICO SOFTWARE PER L ANALISI STATISTICA DI DATI PROVENIENTI DAL MONITORAGGIO AMBIENTALE Release 4.0 20/03/2018 Manuale d uso Ambiente Statistico è un software sviluppato nell ambito del Progetto

Dettagli

Matematica e Consulenza: un connubio perfetto. Mirco Patriarca Università di Pavia, Marzo 2018

Matematica e Consulenza: un connubio perfetto. Mirco Patriarca Università di Pavia, Marzo 2018 Matematica e Consulenza: un connubio perfetto Mirco Patriarca Università di Pavia, Marzo 2018 AGENDA La mia storia Cosa vuol dire essere un consulente «Data is the new Oil» Esempi di progetto Geo-localization

Dettagli

MODELLI DI SVALUTAZIONE

MODELLI DI SVALUTAZIONE Milano, 8 aprile 2014 MODELLI DI SVALUTAZIONE Metodologie e problematiche di applicazione al confidi INDICE Contesto di riferimento ed obiettivo dell intervento Approccio metodologico proposto FASE 1 -

Dettagli

Clustering Mario Guarracino Data Mining a.a. 2010/2011

Clustering Mario Guarracino Data Mining a.a. 2010/2011 Clustering Introduzione Il raggruppamento di popolazioni di oggetti (unità statistiche) in base alle loro caratteristiche (variabili) è da sempre oggetto di studio: classificazione delle specie animali,

Dettagli

ATTIVITÀ IN CAMPO SISMICO RECENTI STUDI E SVILUPPI FUTURI

ATTIVITÀ IN CAMPO SISMICO RECENTI STUDI E SVILUPPI FUTURI ATTIVITÀ IN CAMPO SISMICO RECENTI STUDI E SVILUPPI FUTURI Attività in campo sismico. CLASSIFICAZIONE DELLA PERICOLOSITÀ SISMICA DEL TERRITORIO NAZIONALE ATTRAVERSO PARAMETRI STATISTICI Obiettivi Restituire

Dettagli

Metodi Statistici per il Management

Metodi Statistici per il Management Metodi Statistici per il Management Statistica Multivariata II Simone Borra - Roberto Rocci Analisi in Componenti Principali Input: J variabili quantitative rilevate su n unità. Output Rappresentazione

Dettagli

Metodi Statistici per il Management

Metodi Statistici per il Management Metodi Statistici per il Management Statistica Multivariata II Simone Borra - Roberto Rocci Analisi in Componenti Principali Input: J variabili quantitative rilevate su n unità. Output Rappresentazione

Dettagli

LA CASSIFICAZIONE AUTOMATICA PER UNO STUDIO DEL SISTEMA DEI TRASPORTI

LA CASSIFICAZIONE AUTOMATICA PER UNO STUDIO DEL SISTEMA DEI TRASPORTI _ LA CLASSIFICAZIONE AUTOMATICA PER UNO STUDIO DEL SISTEMA DEI TRASPORTI Rosaria Lombardo LA CASSIFICAZIONE AUTOMATICA CLASSIFICAZIONE E CLUSTERING 1. Introduzione L analisi dei gruppi, o cluster analysis,

Dettagli

Appunti sulla segmentazione dei mercati

Appunti sulla segmentazione dei mercati Appunti sulla segmentazione dei mercati Il mercato non si presenta come una realtà omogenea e univoca, ma è un'entità composita, costituita da singoli soggetti, ciascuno con proprie caratteristiche e mosso

Dettagli

Riconoscimento e recupero dell informazione per bioinformatica

Riconoscimento e recupero dell informazione per bioinformatica Riconoscimento e recupero dell informazione per bioinformatica Clustering: metodologie Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Tassonomia

Dettagli

I metodi quantitativi nelle indagini di Insider Trading

I metodi quantitativi nelle indagini di Insider Trading I metodi quantitativi nelle indagini di Insider Trading XXIV Convegno Annuale AMASES Padenghe sul Garda, 9 Settembre 2000 1 Market Abuse: Insider Trading Definizione: Abuso sul mercato di Informazioni:

Dettagli

ANALISI DEL QUADRO DEMOGRAFICO DELL ASL DI BERGAMO. A cura dell Osservatorio Socio-Sanitario Direzione Sociale ASL di Bergamo

ANALISI DEL QUADRO DEMOGRAFICO DELL ASL DI BERGAMO. A cura dell Osservatorio Socio-Sanitario Direzione Sociale ASL di Bergamo ANALISI DEL QUADRO DEMOGRAFICO DELL ASL DI BERGAMO A cura dell Osservatorio Socio-Sanitario Direzione Sociale ASL di Bergamo Indice delle tavole Note sintetiche a commento dei principali fenomeni osservati...

Dettagli

L ELABORATORE ELETTRONICO

L ELABORATORE ELETTRONICO L ELABORATORE ELETTRONICO Il calcolatore elettronico è uno strumento in grado di eseguire insiemi di azioni ( mosse ) elementari le azioni vengono eseguite su dati in ingresso (input) per produrre uno

Dettagli

Pattern recognition. III Parte. Intelligenza Artificiale - Pattern Recognition 3

Pattern recognition. III Parte. Intelligenza Artificiale - Pattern Recognition 3 Pattern recognition III Parte 1 QUANTIZZAZIONE VETTORIALE Si può pensare come un algoritmo derivato da K-MEANS e da ISODATA. 1.All inizio tutti i vettori sono attribuiti ad un unico cluster. Si calcola

Dettagli

Cluster Analysis (2 parte)

Cluster Analysis (2 parte) Cluster Analysis (2 parte) Esempio 2 Data set: Nel data set Dieta (Dieta.txt, Dieta.sav) sono contenute informazioni sul consumo medio dei principali alimenti in 16 paesi Europei. Paese Cereali (Ce) Riso

Dettagli

Sergio Bolasco MULTIDIMENSIONALE. Metodi, strategie e criteri d'interpretazione DEI DATI. nez1à. .arocc1 ISIVO

Sergio Bolasco MULTIDIMENSIONALE. Metodi, strategie e criteri d'interpretazione DEI DATI. nez1à. .arocc1 ISIVO ANALISI Sergio Bolasco MULTIDIMENSIONALE Metodi, strategie e criteri d'interpretazione DEI DATI nez1à ISIVO.arocc1 Sergio Bolasco \.'. Analisi multidimensionale dei dati Metodi, strategie e criteri d'interpretazione

Dettagli

Esercitazione di Statistica Indici di associazione

Esercitazione di Statistica Indici di associazione Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza

Dettagli

Statistica per l impresa

Statistica per l impresa Statistica per l impresa Obiettivi Il corso si propone di fornire i principali strumenti per l analisi di dati statistici in ambito aziendale. A partire dalle caratteristiche dell informazione statistica

Dettagli

REGISTRO DELLE LEZIONI

REGISTRO DELLE LEZIONI UNIVERSITÀ DEGLI STUDI DI GENOVA Dipartimento di Matematica Corso di laurea in Statistica matematica e trattamento informatico dei dati REGISTRO DELLE LEZIONI dell INSEGNAMENTO o MODULO UFFICIALE Nome:

Dettagli

I Componenti del processo decisionale 7

I Componenti del processo decisionale 7 Indice Introduzione 1 I Componenti del processo decisionale 7 1 Business intelligence 9 1.1 Decisioni efficaci e tempestive........ 9 1.2 Dati, informazioni e conoscenza....... 12 1.3 Ruolo dei modelli

Dettagli

ANALISI DEI DATI PER IL MARKETING 2014

ANALISI DEI DATI PER IL MARKETING 2014 ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it MISURE DI DISTANZA E SIMILARITA 1 SCOPI DEL CALCOLO Problema: misurare la diversità (ovvero la rassomiglianza) tra

Dettagli

A. Ferrari Informatica

A. Ferrari Informatica Informatica procedure e funzioni procedure o dichiarazione e definizione o definizione del comportamento della funzione o utilizzo di parametri formali o prototipo (solo dichiarazione) o esecuzione o esecuzione

Dettagli

Sistemi di Elaborazione dell Informazione 170. Caso Non Separabile

Sistemi di Elaborazione dell Informazione 170. Caso Non Separabile Sistemi di Elaborazione dell Informazione 170 Caso Non Separabile La soluzione vista in precedenza per esempi non-linearmente separabili non garantisce usualmente buone prestazioni perchè un iperpiano

Dettagli

L ELABORATORE ELETTRONICO!

L ELABORATORE ELETTRONICO! L ELABORATORE ELETTRONICO! Il calcolatore elettronico è uno strumento in grado di eseguire insiemi di azioni ( mosse ) elementari le azioni vengono eseguite su oggetti (dati) per produrre altri oggetti

Dettagli

REGISTRO DELLE LEZIONI

REGISTRO DELLE LEZIONI UNIVERSITÀ DEGLI STUDI DI GENOVA Dipartimento di Matematica Corso di laurea in Statistica matematica e trattamento informatico dei dati REGISTRO DELLE LEZIONI dell INSEGNAMENTO o MODULO UFFICIALE Nome:

Dettagli

LA TOMOGRAFIA SISMICA PER LO STUDIO DI CAVITÀ ANTROPICHE. DATI SINTETICI E SPERIMENTALI.

LA TOMOGRAFIA SISMICA PER LO STUDIO DI CAVITÀ ANTROPICHE. DATI SINTETICI E SPERIMENTALI. Laureanda: Alessandra Carollo Relatore: Prof. Raffaele Martorana Correlatrice: Dott.ssa Patrizia Capizzi LA TOMOGRAFIA SISMICA PER LO STUDIO DI CAVITÀ ANTROPICHE. DATI SINTETICI E SPERIMENTALI. La presenza

Dettagli

L insider Trading e il Valore dell Informazione Privilegiata

L insider Trading e il Valore dell Informazione Privilegiata L insider Trading e il Valore dell Informazione Privilegiata A cura di Workshop di Finanza Matematica Market Abuse: Insider Trading Definizione: Abuso sul mercato di Informazioni: -Private(Non Public)

Dettagli

concetto di attività Il controllo di gestione Sinonimo di aggregato di operazioni di gestione elementari tecnicamente omogenee

concetto di attività Il controllo di gestione Sinonimo di aggregato di operazioni di gestione elementari tecnicamente omogenee Il controllo di gestione concetto di Sinonimo di aggregato di operazioni di gestione elementari tecnicamente omogenee Rinvio al modello Teorico di Porter (catena del Valore) analisi delle che creano valore

Dettagli

Data mining: attività di scoperta di informazione latente all interno di un certo insieme di dati (tipicamente molto grande) Information retrieval

Data mining: attività di scoperta di informazione latente all interno di un certo insieme di dati (tipicamente molto grande) Information retrieval Filippo Geraci Data mining: attività di scoperta di informazione latente all interno di un certo insieme di dati (tipicamente molto grande) Information retrieval (IR): insieme delle tecnologie utilizzate

Dettagli

Le graduatorie basate su una molteplicità di indicatori. I pericoli della sintesi di variabili disomogenee.

Le graduatorie basate su una molteplicità di indicatori. I pericoli della sintesi di variabili disomogenee. Le graduatorie basate su una molteplicità di indicatori. I pericoli della sintesi di variabili disomogenee. Sovente è necessario stabilire delle graduatorie tra unità statistiche. In azienda il problema

Dettagli

La regressione lineare. Rappresentazione analitica delle distribuzioni

La regressione lineare. Rappresentazione analitica delle distribuzioni La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Modello analitico per l analisi dei rischi

Modello analitico per l analisi dei rischi Safety & Security Magazine Safety & Security - Informazioni e Indicazioni Pratiche per la Sicurezza Fisica e Logica https://www.safetysecuritymagazine.com Modello analitico per l analisi dei rischi Date

Dettagli

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Fondamenti di Informatica Ester Zumpano Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Lezione 5 Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di

Dettagli

Elaboratore Elettronico

Elaboratore Elettronico L ELABORATORE ELETTRONICO Il calcolatore elettronico è uno strumento in grado di eseguire insiemi di azioni ( mosse ) elementari le azioni vengono eseguite su oggetti (dati)) per produrre rre altri oggetti

Dettagli

Analisi esplorativa di dati multidimensionali

Analisi esplorativa di dati multidimensionali io e Luigi Fabbris Analisi esplorativa di dati multidimensionali 'CENTRO " G. ASTENGO» cleup editore INVENTARIO 2B6 c., INDICE DEI CONTENUTI -~ Cap. 1 L'analisi dei dati nella ricerca sociale pag. I 1.1.

Dettagli

Grafi e Funzioni di Costo ESERCIZI

Grafi e Funzioni di Costo ESERCIZI Grafi e Funzioni di Costo ESERCIZI Esercizio1 Si determini la matrice di incidenza archi-percorsi ed i costi di percorso per la rete di trasporto rappresentata in figura. 1 4 2 3 5 Ramo Costo Ramo Costo

Dettagli

Proposta sistema elettorale per elezioni parlamentari

Proposta sistema elettorale per elezioni parlamentari Circolo PD Parigi Data: 11 Agosto 2013 Edizione: 2.0 Proposta sistema elettorale per elezioni parlamentari Questo documento illustra la proposta di un nuovo sistema elettorale pensato per l elezione legislativa

Dettagli

Misure della diseguaglianza

Misure della diseguaglianza Misure della diseguaglianza La quantificazione dell'ineguaglianza dei redditi è uno degli obiettivi principali che si pongono gli studi della distribuzione quantitativa del reddito. Il primo passo dell

Dettagli

LA PIANIFICAZIONE SANITARIA. Processo dinamico di previsione di risorse e dei servizi richiesti per raggiungere obiettivi secondo priorità stabilite

LA PIANIFICAZIONE SANITARIA. Processo dinamico di previsione di risorse e dei servizi richiesti per raggiungere obiettivi secondo priorità stabilite LA PIANIFICAZIONE SANITARIA Processo dinamico di previsione di risorse e dei servizi richiesti per raggiungere obiettivi secondo priorità stabilite Società PIANIFICAZIONE STRATEGICA Individuare la mission

Dettagli

Prova finale del 6 giugno 2011

Prova finale del 6 giugno 2011 Prova finale del 6 giugno 2011 Esercizio A, da svolgere con carta e penna Si consideri la seguente matrice dei dati relativa a 3 unità statistiche e 3 variabili, X 1 e X 2 quantitative, X 3 dicotomica.

Dettagli

Indice. Prefazione. Capitolo 1 Introduzione al data warehousing 1

Indice. Prefazione. Capitolo 1 Introduzione al data warehousing 1 Indice Prefazione XI Capitolo 1 Introduzione al data warehousing 1 1.1 I sistemi di supporto alle decisioni 2 1.2 Il data warehousing 3 1.3 Architetture per il data warehousing 6 1.3.1 Architettura a un

Dettagli

Corso di Laurea in Ingegneria Gestionale. Anno Accademico Algoritmo K-means per problemi di Clustering. Stefano Lucidi

Corso di Laurea in Ingegneria Gestionale. Anno Accademico Algoritmo K-means per problemi di Clustering. Stefano Lucidi Corso di Laurea in Ingegneria Gestionale Anno Accademico 2012 2013 Algoritmo K-means per problemi di Clustering Stefano Lucidi Dipartimento di Informatica e Sistemistica A. Ruberti Università di Roma La

Dettagli

Introduzione. La teoria economica: oggetto e metodo

Introduzione. La teoria economica: oggetto e metodo Introduzione La teoria economica: oggetto e metodo Introduzione al corso Orario delle lezioni Lunedì 12.00-14.00 Martedi 10.00 12.00 Mercoledì 10.00-12.00 Ricevimento - Venerdì 11.00 Lezione 1: l economia

Dettagli

Definizione dei gruppi sociali e loro descrizione

Definizione dei gruppi sociali e loro descrizione 17 MAGGIO 2017 Definizione dei gruppi sociali e loro descrizione Presentata nel Rapporto annuale 2017, la suddivisione delle famiglie in gruppi è stata condotta sulla base di una metodologia statistica

Dettagli

Procedure e funzioni A. Ferrari

Procedure e funzioni A. Ferrari Procedure e funzioni A. Ferrari Procedura Una procedura può essere rappresentata come una macchina in grado di eseguire un certo compito quando attivata. In un primo tempo la macchina deve essere costruita:

Dettagli

Analisi dell associazione tra due caratteri

Analisi dell associazione tra due caratteri Analisi dell associazione tra due caratteri Non ci accontentiamo di analizzare il singolo fenomeno, considerato indipendentemente da altri fenomeni Ci interessano le relazioni che possono esistere tra

Dettagli

I metodi Electre. La scelta fra le alternative: i metodi Electre. Perché introdurre l incompletezza? I metodi Electre: elementi comuni

I metodi Electre. La scelta fra le alternative: i metodi Electre. Perché introdurre l incompletezza? I metodi Electre: elementi comuni I metodi Electre La scelta fra le alternative: i metodi Electre Electre = ELimination Et Choix Traduisant la REalité scopo: mettere a punto un metodo decisionale il più aderente possibile alla realtà rifiutano

Dettagli

Bosi (a cura di), Corso di scienza delle finanze, il Mulino, 2012 Capitolo I, lezione 1 Il problema e alcune premesse

Bosi (a cura di), Corso di scienza delle finanze, il Mulino, 2012 Capitolo I, lezione 1 Il problema e alcune premesse Il problema e alcune premesse La costruzione della grande frontiera delle utilità e l ottimo l paretiano La scienza delle finanze studia le entrate e le uscite pubbliche con un approccio normativo e positivo

Dettagli

Metodologie di Clustering

Metodologie di Clustering Metodologie di Clustering Nota preliminare Esistono moltissimi algoritmi di clustering Questi algoritmi possono essere analizzati da svariati punti di vista La suddivisione principale tuttavia è quella

Dettagli

Cluster Analysis 1/40. Cluster Analysis. c 11 giugno 2005 Luca La Rocca

Cluster Analysis 1/40. Cluster Analysis. c 11 giugno 2005 Luca La Rocca Cluster Analysis 1/40 Cluster Analysis Cluster Analysis 1/40 Cluster Analysis è un insieme di tecniche esplorative che mirano a raggruppare le unità statistiche di una popolazione sulla base della loro

Dettagli

Operazioni sulle immagini digitali

Operazioni sulle immagini digitali Operazioni sulle immagini digitali Categorie di operatori L istogramma dei livelli di grigio Trasformazioni puntuali Equalizzazione Operazioni su immagini digitali I tipi di operazioni che si possono realizzare

Dettagli

Cluster Analysis: Metodi non gerarchici

Cluster Analysis: Metodi non gerarchici Cluster Analysis: Metodi non gerarchici Analisi Esplorativa Aldo Solari 1 / 37 1 Cluster Analysis 2 Metodo delle K-medie 2 / 37 Outline 1 Cluster Analysis 2 Metodo delle K-medie 3 / 37 Perchè raggruppare

Dettagli

MODELLI DI ASSEGNAZIONE PER LE RETI STRADALI

MODELLI DI ASSEGNAZIONE PER LE RETI STRADALI MODELLI DI ASSEGNAZIONE PER LE RETI STRADALI CORSO DI PROGETTAZIONE DEI SISTEMI DI TRASPORTO - I MODELLI DI ASSEGNAZIONE L ASSEGNAZIONE DELLA DOMANDA AD UNA RETE DI TRASPORTO CONSISTE NEL CALCOLARE I FLUSSI

Dettagli