Apprendimento Non Supervisionato. Unsupervised Learning

Documenti analoghi
Apprendimento Automatico: Apprendimento Non Supervisionato

Ottimizzazione Combinatoria

ESERCITAZIONE DEL 3 MARZO 2005

ESPERIMENTO CASUALE. P(X) è la funzione di probabilità secondo la quale ad ogni numero reale di X si assegna una misura di probabilità.

Economia del turismo

Sommario. Corso di Statistica Facoltà di Economia. Le Variabili Casuali o Variabili Aleatorie. Lezione n 16. Francesco Mola. Variabili Casuali (cont

Approcci algoritmici. Capitolo Approccio sequenziale. y = y (che collegano il modello di trasporto a quello di

Sommario. Facoltà di Economia E E2 E 5 E 4. S x1. Le Variabili Casuali o Variabili Aleatorie. francesco mola. Lezione n 13.

ESERCITAZIONE DEL 10 MARZO 2005

Sessione live #1 Settimana #2 dal 10 al 16 marzo. Statistica descrittiva: Indici di posizione, dispersione e forma Istogramma frequenze, box plot

Sistemi Intelligenti Reinforcement Learning: Evaluative Feedback

Condizioni di equilibrio TD nelle reazioni chimiche

Algoritmi e Strutture di Dati

Esercitazione I : Determinazione dei pesi

Sviluppo dell algoritmo per l allineamento dello spettrometro magnetico di PAMELA

RICONOSCIMENTO DI FORME. Metodi non supervisionati e clustering Capitolo 7

Esercizi numerici Parte A

r v i i P = m i i dt (M r cm ) = Mv r r i = d avendo definito il concetto di centro di massa (CM) del sistema ( M = m i r r r cm

Una rendita è una somma di capitali pagabili (o esigibili) a determinate scadenze, fissate secondo intervalli regolari di tempo.

Approfondimento Altri tipi di test di significatività del coefficiente di correlazione di Pearson

Risultati esame scritto Fisica 2-29/09/2014 orali: alle ore presso aula O

IL Potenziale elettrostatico

I vettori. Grandezze scalari e grandezze vettoriali

Il campo B è uscente. Fisica Generale per Architettura - G. Cantatore 1

Introduzione. al Pattern Recognition

* PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE *

Prova di verifica parziale N Dic 2008

Support Vector Machines. Macchine a vettori di supporto

Laboratorio: Metodi quantitativi per il calcolo del VaR. Aldo Nassigh Financial Risk Management A.A. 2011/12 Lezione 4

Calcolo del lavoro compiuto dalle forze elementari

MACCHINA ELEMENTARE CON UN SOLO AVVOLGIMENTO

Algebra vettoriale: un breve formulario. E r

Modelli decisionali su grafi - Problemi di Localizzazione

Leggi di Biot-Savart e di Ampère. Fisica II - CdL Chimica

PROPRIETÀ DEL CAMPO ELETTROSTATICO (PARTE 2) G. Pugliese 1

Fisica II - Ingegneria Biomedica - A.A. 2017/ Appello del 16/1/2018

Economia del turismo. Prof.ssa Carla Massidda

Metodi di integrazione numerica

Figura 1 Geometria attuale. Figura 2 Sezione trapezia

Predimensionamento reti chiuse

Predimensionamento reti chiuse

VALUTAZIONE DEL LIVELLO DI SERVIZIO DI UNA INTERSEZIONE A QUATTRO BRACCI SEMAFORIZZATA CON PRECEDENTE FASATURA DEL CICLO SEMAFORICO

Corrente elettrica. Conduttore in equilibrio. Condutture in cui è mantenuta una differenza di potenziale (ddp) E=0 V=cost

CPM: Calcolo del Cammino Critico

Reti in fibra ottica. Prima Esercitazione Lunghezze d onda e potenze

Leggi di Biot-Savart e di Ampère. Fisica II - CdL Chimica

Potenziali e campi di dipoli elettrici e magnetici

Soluzione del compito del 5 settembre 2012

Corso di Infrastrutture Idrauliche II

TECNICHE DI INFORMATION RETRIEVAL APPLICATE ALLA BIOINFORMATICA: UN CASO DI STUDIO BASATO SULLA INTEGRAZIONE DI TECNOLOGIE OPEN SOURCE

Elementi di Calcolo delle Probabilità

Elementi di Calcolo delle Probabilità

Il campo elettrico è conservativo. L A1B = F i l r

Formule principali per il calcolo delle caratteristiche geometriche

Modello del Gruppo d Acquisto

Fisica Generale A. Terzo principio della dinamica. Scuola di Ingegneria e Architettura UNIBO Cesena Anno Accademico Maurizio Piccinini

Workshop MatFinTN 2012


Economia del turismo

Claudio Biancalana

Guido Corbò Note di elettromagnetismo. Forza di Lorentz su un circuito arbitrario e correnti indotte

Appello del 18/07/2005 di Microonde I

Metodologie informatiche per la chimica

Esercitazioni di elettromagnetismo applicato

Elementi di Calcolo delle Probabilità

Corso di Fondamenti di Telecomunicazioni

Dimensionamento di un impianto di evaporazione a triplo effetto

Studi di funzione. flx.lt fi. Esercizi svolti e commentati. ftxo. E fin Y : Ye = Yo = fko. Xotfu. lxollx. xo )

I NUOVI CONTROLLI STATISTICI/ANDAMENTALI SUI DATI DI FLUSSO ANTIRICICLAGGIO

Elemento Trave nel piano

Sistemi Intelligenti Stimatori e sistemi lineari - III

7. METODO DELLE FORZE IMPOSTAZIONE GENERALE INFLUENZA DEGLI SPOSTAMENTI DEI VINCOLI

Si considerino le rette:

Matematica Computazionale(6cfu) Ottimizzazione(8cfu)

Nota metodologica. 1. Finalità e principali caratteristiche dell indagine

Introduzione ai Modelli di Durata: Alcuni Modelli Parametrici

y. E' semplicemente la media calcolata mettendo

RISPOSTA IN FREQUENZA DI UN AMPLIFICATORE

Università degli Studi di Milano. Facoltà di Scienze Matematiche Fisiche e Naturali

ESPERIMENTO CASUALE. S Spazio campionario : è l insieme di eventi necessari e incompatibili che si presentano come risultati dell ESPERIMENTO CASUALE.

1 - SCELTA TIPOLOGICA DELLE OPERE DI FONDAZIONE

Elementi di statistica

Esercitazione sulle Basi di di Definizione

RAPPRESENTAZIONE DI MISURE. carta millimetrata

Architettura degli Elaboratori. Classe 3 Prof.ssa Anselmo. Appello del 17 Luglio Attenzione:

Rilevati sui terreni molli

Realizzazione di FSM sincrone. Sommario. Introduzione. Sommario. M. Favalli

Specifica calcolo soddisfazione discenti

ELEMENTI DI STATISTICA

Integrazione numerica dell equazione del moto per un sistema lineare viscoso a un grado di libertà. Prof. Adolfo Santini - Dinamica delle Strutture 1

CONDUZIONE NON STAZIONARIA

ESERCITAZIONE 8. Esercitazioni del corso FONDAMENTI DI PROCESSI CHIMICI Prof. Gianpiero Groppi

COMPARATORI. Comparatore invertente

C 2. Quesiti: 1) Calcolare tutte le correnti in figura. 2) Verificare la conservazione delle potenze complesse.

Controllo di Azionamenti Elettrici. Lezione n 12. Controllo ad orientamento di campo degli azionamenti con motore in corrente alternata

Seconda prova in itinere: 01/04/2005 (Parte a)

Lo schema seguente spiega come passare da una equazione all altra e al grafico della circonferenza. Svolgere i calcoli.

Dinamica dei sistemi di punti materiali

Meccanica Dinamica del corpo rigido

SOLUZIONI PER IL CONTROLLO DEL RISCALDAMENTO GLOBALE

Transcript:

Appendmento Non Supevsonato Unsupevsed Leanng

Supevsone nell Appendmento (aano, otondo, lasse= ) (gallo, lungo, lasse= ) (gallo, otondo, lasse= ) oloe foma (gallo, lungo, lasse= ) (aano, otondo) (gallo, otondo) (gallo, otondo) (gallo, lungo) algotmo d appendmento supevsonato oloe algotmo d appendmento non supevsonato.... foma

Clusteng Suddvde esemp non ethettat n sottonsem dsgunt (luste), tal he: Gl esemp n uno stesso guppo sono molto sml Gl esemp n gupp dves sono molto dffeent Sope nuove ategoe n modo non supevsonato (a po non vengono fonte ethette pe le ategoe)

Clusteng: un esempo................

Tp d Clusteng Clusteng geaho (heahal lusteng) Fomano luste teatvamente utlzzando luste peedentemente osttut Clusteng pattvo (pattonal lusteng) Cea una sola patzone degl esemp n luste mnmzzando una eta funzone d osto

Clusteng Geaho Costuse una tassonoma geaha ad albeo a pate da un nseme d esemp non ethettat anmale vetebato pese ettle anfbo mammf. nvetebato veme nsetto ostaeo L applazone osva d un algotmo d lusteng può podue un lusteng geaho Dstnguamo due tp d lusteng geaho: Agglomeatvo (bottom-up) Dvsvo (top-down)

Clusteng Pattvo I metod d lusteng pattvo ottengono una sngola patzone de dat, nvee d una stuttua d lusteng (es. albeo d lusteng) Rhedono d spefae l numeo d luste k desdeat Il numeo d luste k può essee detemnato automatamente geneando espltamente lusteng pe dves valo d k e seglendo l mglo sultato seondo la funzone d valutazone del lusteng

Clusteng Geaho Agglomeatvo Assume l esstenza d una funzone d smlatà pe detemnae la smlatà d due stanze Algotmo: Pat on un luste pe ogn stanza Fnhé non è un solo luste: Detemna due luste e j pù sml Sosttus e j on un sngolo luste j La stoa d fusone osttuse un albeo bnao o geaha d lusteng (dendogamma)

Methe pe detemnae la dstanza Nota: se la dstanza è nomalzzata ta 0 e 1, la smlatà sm(, y) è data da 1-d(, y) Dstanza euldea (noma L 2 ): Noma L 1 : Cosne Smlaty (tasfomata n una dstanza sottaendo da 1): 2 1 2 ) ( ), ( m y y L = = = = m y y L 1 1 ), ( = = = = m m m y y y y 1 2 1 2 1 1 1

Msuae la Smlatà ta Cluste Nel lusteng geaho agglomeatvo, utlzzamo una funzone d smlatà he detemna la smlatà ta due stanze: sm(, y) Come alolae la smlatà d due luste e j sapendo ome alolae la smlatà ta due stanze ne due luste? Sngle Lnk: Smlatà de due memb pù sml Complete Lnk: Smlatà de due memb meno sml Goup Aveage: Smlatà meda ta memb

Sngle Lnk Agglomeatve Clusteng Utlzzamo la smlatà massma ta oppe d stanze: sm(, j ) = ma, y j sm(, y) A ausa d un effetto onatenamento, può esttue luste lungh e fn Adeguato n et domn, ome l agguppamento d sole

Esempo d Sngle Lnk

Complete Lnk Agglomeatve Clusteng Basato sulla mnma smlatà ta oppe d stanze: sm(, j ) = mn, y j sm(, y) Cea luste pù sfe, nomalmente pefebl

Esempo d Complete Lnk

Calolae la Smlatà ta Cluste Dopo ave fuso luste e j, la smlatà del lusteng ottenuto spetto a un alto luste abtao k può essee alolata ome segue: Sngle Lnk: sm (( j ), k ) = ma( sm(, k ), sm( j, k )) Complete Lnk: sm (( j ), k ) = mn( sm(, k ), sm( j, k ))

Goup Aveage Agglomeatve Clusteng Pe detemnae la smlatà ta e j usa la smlatà meda su tutte le oppe nell unone d e j. Compomesso ta sngle e omplete lnk. Se s voglono luste pù sfe e nett, s deve detemnae la smlatà meda ta oppe odnate d stanze ne due luste (nvee he ta oppe d stanze nell unone) = ) ( : ) ( ), ( 1) ( 1 ), ( j j y y j j j y sm sm

Clusteng Pattvo S deve fone l numeo desdeato d luste k S selgono k stanze a aso, una pe luste, hamate sem (seeds) S fomano k luste nzal sulla base de sem Itea, alloando tutte le stanze su dves luste pe mgloae l lusteng omplessvo C s fema quando l lusteng onvege o dopo un numeo pefssato d teazon

k-means Assume stanze a valo eal I luste sono basat su entod o meda de punt n un luste : µ() = 1 Le stanze vengono assegnate a luste sulla base della dstanza spetto a entod de luste attual

Algotmo k-means k-means(dstanza d, nseme delle stanze X) Selezona k stanze a aso {s 1, s 2,, s k } X ome sem. Fnhé lusteng non onvege o s aggunge teo d stop: Pe ogn stanza X: Assegna al luste j tale he d(, s j ) è mnmale Aggona sem al entode d ogn luste, ovveo pe ogn luste j : s j = µ( j )

k-means: Esempo (k=2) Segl sem Rassegna luste Calola entod Rassegna luste Calola entod Rassegna luste Convegenza!

Obettvo d k-means L obettvo d k-means è d mnmzzae la somma del quadato della dstanza d asun punto n X spetto al entode del luste u è assegnato: k = 1 d (, µ ) 2 Così ome pe gl algotm genet, tovae l mnmo globale è un poblema NP-had E gaantto he l algotmo k-means onvega a un mnmo loale

Selta de Sem I sultat possono vaae notevolmente sulla base della selezone de sem Alun sem possono potae a un basso tasso d onvegenza o a onvegee su lusteng subottmal S possono selezonae buon sem usando eusthe o ome sultato d un alto metodo

Tet Clusteng I metod d lusteng possono essee applat a doument d testo n modo semple Tpamente, s appesenta un doumento medante vetto TF*IDF (tem fequeny*nvese doument fequeny) nomalzzat e s utlzza la smlatà del oseno Applazon: Duante la fase d eupeo de doument d un sstema d Infomaton Reteval (IR), s possono fone doument nello stesso luste d quello nzalmente eupeato pe aumentae la eall del sstema I sultat d un sstema d IR possono essee pesentat pe gupp Poduzone automatzzata d tassonome geahhe d doument pe sop d nagazone (stle Yahoo & DMOZ).

Had vs. Soft Clusteng Tpamente l lusteng assume he ogn stanza sa assegnata a un solo luste Questo non pemette d espmee l netezza guado l appatenenza d un stanza a pù luste Il soft lusteng fonse una dstbuzone d pobabltà pe ogn stanza spetto all appatenenza a asun luste Le pobabltà d appatenenza d ogn stanza su tutt luste devono sommae a 1

Fuzzy Clusteng Appoo d soft lusteng S defnse un gado d appatenenza u () dell stanza all -esmo luste, tale he: = 1 u ( ) = 1 dove k è l numeo d luste In fuzzy k-means, l entode d un luste è alolato ome la meda d tutt punt, asuno pesato spetto al suo gado d appatenenza a m è l esponente d fuzzyness (es. m=2) k m u ( ) X µ ( ) =, m > 1 m u ( ) X

Fuzzy k-means Defnamo l gado d appatenenza d a : u ( ) L algotmo è smle a k-means: = k j= 1 d(, d(, Fuzzy k-means(dstanza d, nseme delle stanze X) Inzalzza oeffent u () pe ogn {1,, k} e X (asualmente o sulla base d un applazone d k-means) Fnhé non s aggunge teo d stop: Calola entod pe ogn luste Aggona oeffent u () d d essee nel luste 1 j ) ) 2 m1

Poblem nell Appendmento Non Supevsonato Come valutae l lusteng? Valutazone ntena: Sepaazone netta de luste (ad es., l obettvo d k-means) Cospondenza on un modello pobablsto de dat Valutazone estena Confonta luste on ethette d lasse note su dat d benhmak Clusteng sovapponbl Metod sem-supevsonat S utlzzano poh esemp annotat a mano e moltssm esemp non annotat