Cenni sulla cluster analysis
|
|
- Lazzaro Massaro
- 5 anni fa
- Visualizzazioni
Transcript
1 Cenni sulla cluster analysis
2 Distanze Dato un insieme E, una funzione d: E X E -> R + che ha le seguenti tre proprietà: d(x i, x j ) = 0 x i = x j d(x i, x j ) = d(x j, x i ) d(x i, x j ) d(x j, x h ) + d(x h, x j ) (disuguaglianza triangolare) è una distanza. Se vale d(x i, x j ) max {d(x j, x h ); d(x h, x j )} per ogni terna si ha una distanza ultrametrica. Ogni ultrametrica èuna distanza, ma non sempre èvero il contrario.
3 Indici di diversità Proprietà(meno forti di quelle delle distanze): 1) Δ(x i, x j ) 0 2) x i = x j Δ(x i, x j ) = 0 ATT.! Non sempre è vero il contrario 3) Δ(x i, x j ) = Δ(x j, x i ) Se nella 2) vale si hanno gli indici di distanza (che non sono distanze) Se si suppone valida la disuguaglianza triangolare si hanno le distanze.
4 La cluster analysis Linneo: Tutta la nostra conoscenza dipende dal modo con il quale distinguiamo il simile dal dissimile I limiti dei generi non possono essere individuati a priori. Finalità: svariate. Tra le tante: INDIVIDUARE OMOGENEITA TRA LE UNITA STATISTICHE
5 Tipologie di impiego (1/3) A Esistono dei gruppi (definizione assiomatica di gruppo omogeneo in funzione di una matrice di distanze o di similarità e di una o piùsogli prefissate) Se ne accerta l esistenza rispetto a: - Indicatori prescelti (variabili e/o mutabili) - Algoritmo di clustering
6 Tipologie di impiego (2/3) B Non esistono dei gruppi Analisi tipologica (ricerca di gruppi omogenei indipendentemente dalla loro esistenza e senza porsi problemi di conformitàa modelli teorici)
7 Tipologie di impiego (3/3) Sia per Ache per B: Scelta (soggettiva) di variabili e mutabili Scelta dell algoritmo, con preferenza per i metodi aggregativi, pur se teoricamente più deboli) NON ESISTONO VARIABILI SPIEGATE
8 Metodi di clustering Gerarchici Algoritmi scissori (top-down) - Superiorità teorica - Limiti di applicabilità Algoritmi aggregativi (bottom-up) - Di facile applicazione -Spesso influenzati dalla scelta iniziale Per tutti i metodi gerarchici: l assegnazione di un oggetto a un cluster è irrevocabile. Non gerarchici Solo di tipo aggregativo. Generano un unica partizione, tramite successive allocazioni (e ri-allocazioni) degli oggetti fino a giungere a una partizione c.d. «ottima»(sulla base di un criterio predefinito). L assegnazione di un oggetto a un cluster NON è irrevocabile.
9 Metodi aggregativi Validi, in genere, per una qualsiasi matrice di distanze o di similarità. Metodo del legame singolo (nearest neighbour) Metodo del legame medio Metodo del legame completo (furthest neighbour)
10 Metodi aggregativi Si basano tutti su un criterio di distanza minima. 1 Definire la distanza 2 Inizialmente, ogni unitàfa gruppo a sé 3 Fusioni successive tra le unitàcon distanza minore, fino a giungere ad un solo gruppo 4. Individuazione soggettivadel numero ottimale di gruppi
11 Legame singolo
12 Legame medio Nel calcolo della matrice delle distanze, si sostituisce la modalitàrelativa a ciascuna variabile con la media delle modalitàdel gruppo.
13 Legame completo Si basa su un criterio di distanza massima. Si considera come distanza il massimo delle distanze, anzichéil minimo come nel legame singolo.
14 Metodo del centroide Si applica solo a variabili quantitative. Per ogni gruppo (anche se formato solo da n = 1 oggetti) si calcola il baricentro; la distanza tra i gruppi ècalcolata come distanza tra i baricentri.
15 Quante distanze da calcolare? N Distanze da calcolare N Distanze da calcolare * * Cioècirca lo stesso numero di funzioni da calcolare per la prima suddivisione per n = 25 se si utilizza uno dei piùnoti algoritmi scissori (Cavalli-Sforza)
16 Metodi non gerarchici Aggregazioni dinamiche Si fissano (a caso) g centri provvisori. K-means Si assumono come centri provvisori i primi k individui. Si allocano via via le n-k unitàe ad ogni assegnazione si ricalcola subito il centroide del gruppo che si è modificato. In tal modo si accelera il miglioramento della classificazione. Il processo si arresta quando la differenza tra DW t-1 -DW t è minore di una soglia prefissata.
17 L algoritmo potrebbe convergere ad un ottimo locale (e non globale). Per ovviare a tale problema si può ripetere l analisi partendo da altri nuclei iniziali, cercando i gruppi stabili.
18 Dendrogramma
19 Per approfondire Fraire, M., Rizzi, A. Analisi dei dati per il data mining, Carocci, 2011, capp. 2 e 4 Terzi, S. La Cluster analysis, disponibile on line all indirizzo: host.uniroma3.it/facolta/economia/db/materiali/insegna menti/185_903.pdf
Statistica per l Impresa
Statistica per l Impresa a.a. 207/208 Tecniche di Analisi Multidimensionale Analisi dei Gruppi 2 maggio 208 Indice Analisi dei Gruppi: Introduzione Misure di distanza e indici di similarità 3. Metodi gerarchici
DettagliIntelligenza Artificiale. Clustering. Francesco Uliana. 14 gennaio 2011
Intelligenza Artificiale Clustering Francesco Uliana 14 gennaio 2011 Definizione Il Clustering o analisi dei cluster (dal termine inglese cluster analysis) è un insieme di tecniche di analisi multivariata
DettagliMetodi di classificazione. Loredana Cerbara
Loredana Cerbara I metodi di classificazione, anche detti in inglese cluster analysis, attengono alla categoria dei metodi esplorativi. Esistono centinaia di metodi di classificazione dei dati ed hanno
DettagliSDE Marco Riani
SDE 2017 Marco Riani mriani@unipr.it http://www.riani.it LA CLASSIFICAZIONE Problema generale della scienza (Linneo, ) Analisi discriminante Cluster Analysis (analisi dei gruppi) ANALISI DISCRIMINANTE
DettagliI modelli di analisi statistica multidimensionale dei dati: La Cluster Analysis Gerarchica
Titolo della lezione: I modelli di analisi statistica multidimensionale dei dati: La Cluster Analysis Gerarchica Obiettivi dell unità didattica Comprendere l insieme delle procedure che si prefiggono di
DettagliLe Ricerche di Marketing rappresentano il necessario presupposto per la definizione di vincenti strategie di mercato, poiché forniscono il supporto
Le Ricerche di Marketing rappresentano il necessario presupposto per la definizione di vincenti strategie di mercato, poiché forniscono il supporto di dati affidabili e accurati alle decisioni manageriali
DettagliI metodi di Classificazione automatica
L Analisi Multidimensionale dei Dati Una Statistica da vedere I metodi di Classificazione automatica Matrici e metodi Strategia di AMD Anal Discrimin Segmentazione SI Per riga SI Matrice strutturata NO
DettagliObiettivo: assegnazione di osservazioni a gruppi di unità statistiche non definiti a priori e tali che:
Cluster Analysis Obiettivo: assegnazione di osservazioni a gruppi di unità statistiche non definiti a priori e tali che: le unità appartenenti ad uno di essi sono il più possibile omogenee i gruppi sono
DettagliRiconoscimento e recupero dell informazione per bioinformatica
Riconoscimento e recupero dell informazione per bioinformatica Clustering: validazione Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Definizione
DettagliRiconoscimento e recupero dell informazione per bioinformatica. Clustering: validazione. Manuele Bicego
Riconoscimento e recupero dell informazione per bioinformatica Clustering: validazione Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Definizione
DettagliStatistica per l Impresa
Statistica per l Impresa a.a. 2017/2018 Tecniche di Analisi Multidimensionale Analisi dei Gruppi 9 maggio 2018 Indice Analisi dei Gruppi: Introduzione Misure di distanza e indici di similarità Metodi gerarchici
DettagliAPPUNTI DI CLUSTER ANALYSIS (Paola Vicard)
APPUNTI DI CLUSTER ANALYSIS (Paola Vicard) Obiettivi della cluster analysis La cluster analysis è una delle principali tecniche di analisi statistica multivariata per raggruppare le unità osservate in
DettagliStatistica per l Impresa
Statistica per l Impresa a.a. 2017/2018 Tecniche di Analisi Multidimensionale Analisi dei Gruppi 23 aprile 2018 Indice 1. Analisi dei Gruppi: Introduzione 2. Misure di distanza e indici di similarità 3.
DettagliCluster Analysis. La Cluster Analysis è il processo attraverso il quale vengono individuati raggruppamenti dei dati. per modellare!
La Cluster Analysis è il processo attraverso il quale vengono individuati raggruppamenti dei dati. Le tecniche di cluster analysis vengono usate per esplorare i dati e non per modellare! La cluster analysis
DettagliTECNICHE DI CLASSIFICAZIONE
TECNICHE DI CLASSIFICAZIONE La tecnica di classificazione più conosciuta è la cluster analysis, che ha l obiettivo di identificare gruppi di soggetti (o oggetti) omogenei al loro interno ed eterogenei
DettagliANALISI DEI CLUSTER. In questo documento presentiamo alcune opzioni analitiche della procedura di analisi de cluster di
ANALISI DEI CLUSTER In questo documento presentiamo alcune opzioni analitiche della procedura di analisi de cluster di SPSS che non sono state incluse nel testo pubblicato. Si tratta di opzioni che, pur
DettagliProva scritta di ASM - Modulo Analisi Esplorativa del
Cognome:... Nome:... Matricola:......... Prova scritta di ASM - Modulo Analisi Esplorativa del 14.02.2017 La durata della prova è di 90 minuti. Si svolgano gli esercizi A e B riportando il risultato dove
DettagliMisura della performance di ciascun modello: tasso di errore sul test set
Confronto fra modelli di apprendimento supervisionato Dati due modelli supervisionati M 1 e M costruiti con lo stesso training set Misura della performance di ciascun modello: tasso di errore sul test
DettagliClustering. Clustering
1/40 Clustering Iuri Frosio frosio@dsi.unimi.it Approfondimenti in A.K. Jan, M. N. Murty, P. J. Flynn, Data clustering: a review, ACM Computing Surveys, Vol. 31, No. 3, September 1999, ref. pp. 265-290,
DettagliIntroduzione all analisi di arrays: clustering.
Statistica per la Ricerca Sperimentale Introduzione all analisi di arrays: clustering. Lezione 2-14 Marzo 2006 Stefano Moretti Dipartimento di Matematica, Università di Genova e Unità di Epidemiologia
DettagliCorso di Laurea di Scienze biomolecolari e ambientali Laurea magistrale
UNIVERSITA DEGLI STUDI DI PERUGIA Dipartimento di Chimica, Biologia e Biotecnologie Via Elce di Sotto, 06123 Perugia Corso di Laurea di Scienze biomolecolari e ambientali Laurea magistrale Corso di ANALISI
Dettagli5. Analisi dei Gruppi (Cluster Analysis)
5. Analisi dei Gruppi (Cluster Analysis) Cosa è l analisi dei gruppi? Viene utilizzata per classificare rispondenti in gruppi omogenei detti clusters. Esamina relazioni di interdipendenza: nessuna distinzione
DettagliCluster Analysis Distanze ed estrazioni Marco Perugini Milano-Bicocca
Cluster Analysis Distanze ed estrazioni M Q Marco Perugini Milano-Bicocca 1 Scopi Lo scopo dell analisi dei Clusters è di raggruppare casi od oggetti sulla base delle loro similarità in una serie di caratteristiche
DettagliStrategie risolutive e algoritmi per problemi di partizionamento ottimo di grafi
Strategie risolutive e algoritmi per problemi di partizionamento ottimo di grafi Natascia Piroso 12 luglio 2007 Natascia Piroso Partizionamento ottimo di grafi 12 luglio 2007 1 / 17 Definizione Dato un
DettagliMaria Brigida Ferraro + Luca Tardella
Cluster Maria Brigida Ferraro + Luca Tardella e-mail: mariabrigida.ferraro@uniroma1.it, ferraromb@gmail.com Lezione #3: Cluster Obiettivi del modulo Cluster 1 Introduzione ai problemi di classificazione
DettagliStatistica per le ricerche di mercato
Statistica per le ricerche di mercato A.A. 2012/13 Dr. Luca Secondi 15. Tecniche di analisi statistica multivariata per la segmentazione del mercato Cluster Analysis 1 Cluster analysis La cluster analysis
DettagliMisure di diversità tra unità statistiche. Loredana Cerbara
Misure di diversità tra unità statistiche Loredana Cerbara LA DISTANZA IN STATISTICA In statistica la distanza ha un significato diverso da quello che si può intuire in altre discipline, dove, peraltro,
DettagliRiconoscimento e recupero dell informazione per bioinformatica
Riconoscimento e recupero dell informazione per bioinformatica Clustering: introduzione Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Una definizione
DettagliEsercizi di preparazione per il primo esonero
Esercizi di preparazione per il primo esonero Metodi Statistici per il Marketing a.a. 2017/2018 Esercizio Cluster Su un campione di 5 clienti di una libreria sono stati rilevati gli acquisti per alcune
DettagliANALISI DEI DATI PER IL MARKETING 2014
ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it LA CLASSIFICAZIONE CAP IX, pp.367-457 Problema generale della scienza (Linneo, ) Analisi discriminante Cluster Analysis
DettagliData Science A.A. 2018/2019
Corso di Laurea Magistrale in Economia Data Science A.A. 2018/2019 Lez. 5 Data Mining Data Science 2018/2019 1 Data Mining Processo di esplorazione e analisi di un insieme di dati, generalmente di grandi
DettagliAlgoritmi greedy. Gli algoritmi che risolvono problemi di ottimizzazione devono in genere operare una sequenza di scelte per arrivare alla soluzione
Algoritmi greedy Gli algoritmi che risolvono problemi di ottimizzazione devono in genere operare una sequenza di scelte per arrivare alla soluzione Gli algoritmi greedy sono algoritmi basati sull idea
DettagliRegole associative Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007
Regole associative Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 26/27 Introduzione Le regole associative si collocano tra i metodi di apprendimento non supervisionato e sono volte
DettagliLe Tecniche di Data Mining
Cluster Analysis Le Tecniche di Data Mining Le rinciali tecniche di data mining che vedremo sono: Ø Ø Cluster Analysis Alberi Decisionali Cluster Analysis La Cluster Analysis è una tecnica di data mining
DettagliAlgoritmi greedy. Gli algoritmi che risolvono problemi di ottimizzazione devono in genere operare una sequenza di scelte per arrivare alla soluzione
Algoritmi greedy Gli algoritmi che risolvono problemi di ottimizzazione devono in genere operare una sequenza di scelte per arrivare alla soluzione Gli algoritmi greedy sono algoritmi basati sull idea
DettagliTesina Intelligenza Artificiale Maria Serena Ciaburri s A.A
Tesina Intelligenza Artificiale Maria Serena Ciaburri s231745 A.A. 2016-2017 Lo scopo di questa tesina è quello di clusterizzare con l algoritmo K-Means i dati presenti nel dataset MNIST e di calcolare
DettagliI modelli lineari generalizzati per la tariffazione nel ramo RCA: applicazione
I modelli lineari generalizzati per la tariffazione nel ramo RCA: applicazione Giuseppina Bozzo Giuseppina Bozzo Considerazioni preliminari La costruzione di un GLM è preceduta da alcune importanti fasi:
DettagliREGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
DettagliChe cosa è la statistica oggi?
Metodologie Statistiche a supporto delle decisioni aziendali: Revenue/Yield Management Prof. Massimo Aria Ricercatore in Statistica Sociale Una breve premessa: Che cosa è la statistica oggi? 1 Statistica
DettagliPer definire gli obiettivi e le modalità di una strategia commerciale, una azienda deve essere in grado di:
LA SEGMENTAZIONE DEL MERCATO Per definire gli obiettivi e le modalità di una strategia commerciale, una azienda deve essere in grado di: 1) valutare le caratteristiche, i bisogni e i comportamenti probabili
DettagliStatistica multivariata 27/09/2016. D.Rodi, 2016
Statistica multivariata 27/09/2016 Metodi Statistici Statistica Descrittiva Studio di uno o più fenomeni osservati sull INTERA popolazione di interesse (rilevazione esaustiva) Descrizione delle caratteristiche
Dettagli26. Le aree funzionali
26. Le aree funzionali Le funzioni aziendali sono composte da gruppi di operazioni omogenee attraverso le quali il sistema-azienda attua il proprio oggetto e persegue specifici obiettivi. Le aree funzionali
DettagliRicerca di outlier. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna
Ricerca di outlier Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Ricerca di Anomalie/Outlier Cosa sono gli outlier? L insieme di dati che sono considerevolmente differenti dalla
DettagliLa valutazione di adeguatezza nel servizio di consulenza. Seminario Tecnico Milano, 18 novembre 2010
La valutazione di adeguatezza nel servizio di consulenza Seminario Tecnico Milano, 18 novembre 2010 1 La valutazione di adeguatezza come processo La valutazione di adeguatezza è uno degli elementi che
DettagliIngegneria della Conoscenza e Sistemi Esperti Lezione 2: Apprendimento non supervisionato
Ingegneria della Conoscenza e Sistemi Esperti Lezione 2: Apprendimento non supervisionato Dipartimento di Elettronica e Informazione Politecnico di Milano Apprendimento non supervisionato Dati un insieme
DettagliC.da Di Dio - Villaggio S. Agata Messina Italy P.I c.f AMBIENTE STATISTICO. Release /03/2018.
AMBIENTE STATISTICO SOFTWARE PER L ANALISI STATISTICA DI DATI PROVENIENTI DAL MONITORAGGIO AMBIENTALE Release 4.0 20/03/2018 Manuale d uso Ambiente Statistico è un software sviluppato nell ambito del Progetto
DettagliMatematica e Consulenza: un connubio perfetto. Mirco Patriarca Università di Pavia, Marzo 2018
Matematica e Consulenza: un connubio perfetto Mirco Patriarca Università di Pavia, Marzo 2018 AGENDA La mia storia Cosa vuol dire essere un consulente «Data is the new Oil» Esempi di progetto Geo-localization
DettagliMODELLI DI SVALUTAZIONE
Milano, 8 aprile 2014 MODELLI DI SVALUTAZIONE Metodologie e problematiche di applicazione al confidi INDICE Contesto di riferimento ed obiettivo dell intervento Approccio metodologico proposto FASE 1 -
DettagliClustering Mario Guarracino Data Mining a.a. 2010/2011
Clustering Introduzione Il raggruppamento di popolazioni di oggetti (unità statistiche) in base alle loro caratteristiche (variabili) è da sempre oggetto di studio: classificazione delle specie animali,
DettagliATTIVITÀ IN CAMPO SISMICO RECENTI STUDI E SVILUPPI FUTURI
ATTIVITÀ IN CAMPO SISMICO RECENTI STUDI E SVILUPPI FUTURI Attività in campo sismico. CLASSIFICAZIONE DELLA PERICOLOSITÀ SISMICA DEL TERRITORIO NAZIONALE ATTRAVERSO PARAMETRI STATISTICI Obiettivi Restituire
DettagliMetodi Statistici per il Management
Metodi Statistici per il Management Statistica Multivariata II Simone Borra - Roberto Rocci Analisi in Componenti Principali Input: J variabili quantitative rilevate su n unità. Output Rappresentazione
DettagliMetodi Statistici per il Management
Metodi Statistici per il Management Statistica Multivariata II Simone Borra - Roberto Rocci Analisi in Componenti Principali Input: J variabili quantitative rilevate su n unità. Output Rappresentazione
DettagliLA CASSIFICAZIONE AUTOMATICA PER UNO STUDIO DEL SISTEMA DEI TRASPORTI
_ LA CLASSIFICAZIONE AUTOMATICA PER UNO STUDIO DEL SISTEMA DEI TRASPORTI Rosaria Lombardo LA CASSIFICAZIONE AUTOMATICA CLASSIFICAZIONE E CLUSTERING 1. Introduzione L analisi dei gruppi, o cluster analysis,
DettagliAppunti sulla segmentazione dei mercati
Appunti sulla segmentazione dei mercati Il mercato non si presenta come una realtà omogenea e univoca, ma è un'entità composita, costituita da singoli soggetti, ciascuno con proprie caratteristiche e mosso
DettagliRiconoscimento e recupero dell informazione per bioinformatica
Riconoscimento e recupero dell informazione per bioinformatica Clustering: metodologie Manuele Bicego Corso di Laurea in Bioinformatica Dipartimento di Informatica - Università di Verona Sommario Tassonomia
DettagliI metodi quantitativi nelle indagini di Insider Trading
I metodi quantitativi nelle indagini di Insider Trading XXIV Convegno Annuale AMASES Padenghe sul Garda, 9 Settembre 2000 1 Market Abuse: Insider Trading Definizione: Abuso sul mercato di Informazioni:
DettagliANALISI DEL QUADRO DEMOGRAFICO DELL ASL DI BERGAMO. A cura dell Osservatorio Socio-Sanitario Direzione Sociale ASL di Bergamo
ANALISI DEL QUADRO DEMOGRAFICO DELL ASL DI BERGAMO A cura dell Osservatorio Socio-Sanitario Direzione Sociale ASL di Bergamo Indice delle tavole Note sintetiche a commento dei principali fenomeni osservati...
DettagliL ELABORATORE ELETTRONICO
L ELABORATORE ELETTRONICO Il calcolatore elettronico è uno strumento in grado di eseguire insiemi di azioni ( mosse ) elementari le azioni vengono eseguite su dati in ingresso (input) per produrre uno
DettagliPattern recognition. III Parte. Intelligenza Artificiale - Pattern Recognition 3
Pattern recognition III Parte 1 QUANTIZZAZIONE VETTORIALE Si può pensare come un algoritmo derivato da K-MEANS e da ISODATA. 1.All inizio tutti i vettori sono attribuiti ad un unico cluster. Si calcola
DettagliCluster Analysis (2 parte)
Cluster Analysis (2 parte) Esempio 2 Data set: Nel data set Dieta (Dieta.txt, Dieta.sav) sono contenute informazioni sul consumo medio dei principali alimenti in 16 paesi Europei. Paese Cereali (Ce) Riso
DettagliSergio Bolasco MULTIDIMENSIONALE. Metodi, strategie e criteri d'interpretazione DEI DATI. nez1à. .arocc1 ISIVO
ANALISI Sergio Bolasco MULTIDIMENSIONALE Metodi, strategie e criteri d'interpretazione DEI DATI nez1à ISIVO.arocc1 Sergio Bolasco \.'. Analisi multidimensionale dei dati Metodi, strategie e criteri d'interpretazione
DettagliEsercitazione di Statistica Indici di associazione
Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza
DettagliStatistica per l impresa
Statistica per l impresa Obiettivi Il corso si propone di fornire i principali strumenti per l analisi di dati statistici in ambito aziendale. A partire dalle caratteristiche dell informazione statistica
DettagliREGISTRO DELLE LEZIONI
UNIVERSITÀ DEGLI STUDI DI GENOVA Dipartimento di Matematica Corso di laurea in Statistica matematica e trattamento informatico dei dati REGISTRO DELLE LEZIONI dell INSEGNAMENTO o MODULO UFFICIALE Nome:
DettagliI Componenti del processo decisionale 7
Indice Introduzione 1 I Componenti del processo decisionale 7 1 Business intelligence 9 1.1 Decisioni efficaci e tempestive........ 9 1.2 Dati, informazioni e conoscenza....... 12 1.3 Ruolo dei modelli
DettagliANALISI DEI DATI PER IL MARKETING 2014
ANALISI DEI DATI PER IL MARKETING 2014 Marco Riani mriani@unipr.it http://www.riani.it MISURE DI DISTANZA E SIMILARITA 1 SCOPI DEL CALCOLO Problema: misurare la diversità (ovvero la rassomiglianza) tra
DettagliA. Ferrari Informatica
Informatica procedure e funzioni procedure o dichiarazione e definizione o definizione del comportamento della funzione o utilizzo di parametri formali o prototipo (solo dichiarazione) o esecuzione o esecuzione
DettagliSistemi di Elaborazione dell Informazione 170. Caso Non Separabile
Sistemi di Elaborazione dell Informazione 170 Caso Non Separabile La soluzione vista in precedenza per esempi non-linearmente separabili non garantisce usualmente buone prestazioni perchè un iperpiano
DettagliL ELABORATORE ELETTRONICO!
L ELABORATORE ELETTRONICO! Il calcolatore elettronico è uno strumento in grado di eseguire insiemi di azioni ( mosse ) elementari le azioni vengono eseguite su oggetti (dati) per produrre altri oggetti
DettagliREGISTRO DELLE LEZIONI
UNIVERSITÀ DEGLI STUDI DI GENOVA Dipartimento di Matematica Corso di laurea in Statistica matematica e trattamento informatico dei dati REGISTRO DELLE LEZIONI dell INSEGNAMENTO o MODULO UFFICIALE Nome:
DettagliLA TOMOGRAFIA SISMICA PER LO STUDIO DI CAVITÀ ANTROPICHE. DATI SINTETICI E SPERIMENTALI.
Laureanda: Alessandra Carollo Relatore: Prof. Raffaele Martorana Correlatrice: Dott.ssa Patrizia Capizzi LA TOMOGRAFIA SISMICA PER LO STUDIO DI CAVITÀ ANTROPICHE. DATI SINTETICI E SPERIMENTALI. La presenza
DettagliL insider Trading e il Valore dell Informazione Privilegiata
L insider Trading e il Valore dell Informazione Privilegiata A cura di Workshop di Finanza Matematica Market Abuse: Insider Trading Definizione: Abuso sul mercato di Informazioni: -Private(Non Public)
Dettagliconcetto di attività Il controllo di gestione Sinonimo di aggregato di operazioni di gestione elementari tecnicamente omogenee
Il controllo di gestione concetto di Sinonimo di aggregato di operazioni di gestione elementari tecnicamente omogenee Rinvio al modello Teorico di Porter (catena del Valore) analisi delle che creano valore
DettagliData mining: attività di scoperta di informazione latente all interno di un certo insieme di dati (tipicamente molto grande) Information retrieval
Filippo Geraci Data mining: attività di scoperta di informazione latente all interno di un certo insieme di dati (tipicamente molto grande) Information retrieval (IR): insieme delle tecnologie utilizzate
DettagliLe graduatorie basate su una molteplicità di indicatori. I pericoli della sintesi di variabili disomogenee.
Le graduatorie basate su una molteplicità di indicatori. I pericoli della sintesi di variabili disomogenee. Sovente è necessario stabilire delle graduatorie tra unità statistiche. In azienda il problema
DettagliLa regressione lineare. Rappresentazione analitica delle distribuzioni
La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliModello analitico per l analisi dei rischi
Safety & Security Magazine Safety & Security - Informazioni e Indicazioni Pratiche per la Sicurezza Fisica e Logica https://www.safetysecuritymagazine.com Modello analitico per l analisi dei rischi Date
DettagliProgrammazione con Foglio di Calcolo Cenni di Statistica Descrittiva
Fondamenti di Informatica Ester Zumpano Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Lezione 5 Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di
DettagliElaboratore Elettronico
L ELABORATORE ELETTRONICO Il calcolatore elettronico è uno strumento in grado di eseguire insiemi di azioni ( mosse ) elementari le azioni vengono eseguite su oggetti (dati)) per produrre rre altri oggetti
DettagliAnalisi esplorativa di dati multidimensionali
io e Luigi Fabbris Analisi esplorativa di dati multidimensionali 'CENTRO " G. ASTENGO» cleup editore INVENTARIO 2B6 c., INDICE DEI CONTENUTI -~ Cap. 1 L'analisi dei dati nella ricerca sociale pag. I 1.1.
DettagliGrafi e Funzioni di Costo ESERCIZI
Grafi e Funzioni di Costo ESERCIZI Esercizio1 Si determini la matrice di incidenza archi-percorsi ed i costi di percorso per la rete di trasporto rappresentata in figura. 1 4 2 3 5 Ramo Costo Ramo Costo
DettagliProposta sistema elettorale per elezioni parlamentari
Circolo PD Parigi Data: 11 Agosto 2013 Edizione: 2.0 Proposta sistema elettorale per elezioni parlamentari Questo documento illustra la proposta di un nuovo sistema elettorale pensato per l elezione legislativa
DettagliMisure della diseguaglianza
Misure della diseguaglianza La quantificazione dell'ineguaglianza dei redditi è uno degli obiettivi principali che si pongono gli studi della distribuzione quantitativa del reddito. Il primo passo dell
DettagliLA PIANIFICAZIONE SANITARIA. Processo dinamico di previsione di risorse e dei servizi richiesti per raggiungere obiettivi secondo priorità stabilite
LA PIANIFICAZIONE SANITARIA Processo dinamico di previsione di risorse e dei servizi richiesti per raggiungere obiettivi secondo priorità stabilite Società PIANIFICAZIONE STRATEGICA Individuare la mission
DettagliProva finale del 6 giugno 2011
Prova finale del 6 giugno 2011 Esercizio A, da svolgere con carta e penna Si consideri la seguente matrice dei dati relativa a 3 unità statistiche e 3 variabili, X 1 e X 2 quantitative, X 3 dicotomica.
DettagliIndice. Prefazione. Capitolo 1 Introduzione al data warehousing 1
Indice Prefazione XI Capitolo 1 Introduzione al data warehousing 1 1.1 I sistemi di supporto alle decisioni 2 1.2 Il data warehousing 3 1.3 Architetture per il data warehousing 6 1.3.1 Architettura a un
DettagliCorso di Laurea in Ingegneria Gestionale. Anno Accademico Algoritmo K-means per problemi di Clustering. Stefano Lucidi
Corso di Laurea in Ingegneria Gestionale Anno Accademico 2012 2013 Algoritmo K-means per problemi di Clustering Stefano Lucidi Dipartimento di Informatica e Sistemistica A. Ruberti Università di Roma La
DettagliIntroduzione. La teoria economica: oggetto e metodo
Introduzione La teoria economica: oggetto e metodo Introduzione al corso Orario delle lezioni Lunedì 12.00-14.00 Martedi 10.00 12.00 Mercoledì 10.00-12.00 Ricevimento - Venerdì 11.00 Lezione 1: l economia
DettagliDefinizione dei gruppi sociali e loro descrizione
17 MAGGIO 2017 Definizione dei gruppi sociali e loro descrizione Presentata nel Rapporto annuale 2017, la suddivisione delle famiglie in gruppi è stata condotta sulla base di una metodologia statistica
DettagliProcedure e funzioni A. Ferrari
Procedure e funzioni A. Ferrari Procedura Una procedura può essere rappresentata come una macchina in grado di eseguire un certo compito quando attivata. In un primo tempo la macchina deve essere costruita:
DettagliAnalisi dell associazione tra due caratteri
Analisi dell associazione tra due caratteri Non ci accontentiamo di analizzare il singolo fenomeno, considerato indipendentemente da altri fenomeni Ci interessano le relazioni che possono esistere tra
DettagliI metodi Electre. La scelta fra le alternative: i metodi Electre. Perché introdurre l incompletezza? I metodi Electre: elementi comuni
I metodi Electre La scelta fra le alternative: i metodi Electre Electre = ELimination Et Choix Traduisant la REalité scopo: mettere a punto un metodo decisionale il più aderente possibile alla realtà rifiutano
DettagliBosi (a cura di), Corso di scienza delle finanze, il Mulino, 2012 Capitolo I, lezione 1 Il problema e alcune premesse
Il problema e alcune premesse La costruzione della grande frontiera delle utilità e l ottimo l paretiano La scienza delle finanze studia le entrate e le uscite pubbliche con un approccio normativo e positivo
DettagliMetodologie di Clustering
Metodologie di Clustering Nota preliminare Esistono moltissimi algoritmi di clustering Questi algoritmi possono essere analizzati da svariati punti di vista La suddivisione principale tuttavia è quella
DettagliCluster Analysis 1/40. Cluster Analysis. c 11 giugno 2005 Luca La Rocca
Cluster Analysis 1/40 Cluster Analysis Cluster Analysis 1/40 Cluster Analysis è un insieme di tecniche esplorative che mirano a raggruppare le unità statistiche di una popolazione sulla base della loro
DettagliOperazioni sulle immagini digitali
Operazioni sulle immagini digitali Categorie di operatori L istogramma dei livelli di grigio Trasformazioni puntuali Equalizzazione Operazioni su immagini digitali I tipi di operazioni che si possono realizzare
DettagliCluster Analysis: Metodi non gerarchici
Cluster Analysis: Metodi non gerarchici Analisi Esplorativa Aldo Solari 1 / 37 1 Cluster Analysis 2 Metodo delle K-medie 2 / 37 Outline 1 Cluster Analysis 2 Metodo delle K-medie 3 / 37 Perchè raggruppare
DettagliMODELLI DI ASSEGNAZIONE PER LE RETI STRADALI
MODELLI DI ASSEGNAZIONE PER LE RETI STRADALI CORSO DI PROGETTAZIONE DEI SISTEMI DI TRASPORTO - I MODELLI DI ASSEGNAZIONE L ASSEGNAZIONE DELLA DOMANDA AD UNA RETE DI TRASPORTO CONSISTE NEL CALCOLARE I FLUSSI
Dettagli