KNOWLEDGE DATA DISCOVERY

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "KNOWLEDGE DATA DISCOVERY"

Transcript

1 KNOWLEDGE DATA DISCOVERY Corso di Bionforma;ca Corso di Laurea in Scienze Biologiche Prof. R. Oliveto - A.A. 2011/2012

2 Introduzione L informazione è un bene a valore crescente, necessario per pianificare e controllare akvità produkve: Cos;tuisce la materia prima che viene trasformata dai sistemi informa;vi Come è noto ai Web navigator l equazione da# = informazione non è sempre correpa Spesso la disponibilità di troppi da; rende arduo, se non impossibile, estrarre informazioni significa;ve Sistemi per l estrazione, l analisi e l organizzazione automa;ca di queste enormi moli di da; possono fornire un supporto nei processi decisionali umani Sistemi di Supporto alle Decisioni (DSS)

3 Sistemi di Supporto alle Decisioni Nascono a seguito dell enorme accumulo di da; registrato nell ul;mo ventennio in forma elepronica, e dalla pressante richiesta di u;lizzo di tali da; per scopi che superano quelli lega; all elaborazione giornaliera Aiutano il decisore umano sia nelle decisioni opera;ve, sia nelle decisioni strategiche, a più lungo termine ed a più ampio respiro

4 Applicazioni L u;lizzo dei DSS non è ristrepo in ambito aziendale e d impresa Spazia dall area medico- epidemiologica a quella demografica, dalle scienze naturali alla didakca CaraPeris;ca comune ai diversi ambi; è la necessità di strumen; di archiviazione e di interrogazione, per openere, dall enorme quan;tà di da; contenu; nei database o resi disponibili da Internet Informazioni di sintesi che permepano la valutazione di un fenomeno La scoperta di correlazioni significa;ve L acquisizione di conoscenza u;le a stabilire una strategia decisionale

5 Un po di storia (1) La funzione svolta dalle basi di da; in ambito aziendale è stata, fino a tempi recen;, quella di memorizzare da; operazionali, ossia da; genera; da operazioni, in genere di carapere amministra;vo, svolte all interno dei processi ges;onali (ges;one acquis;, ges;one vendite, fapurazione) TuPavia, per ogni azienda, è fondamentale poter disporre in maniera rapida e completa delle informazioni necessarie al processo decisionale: le indicazioni strategiche sono estrapolate dalla mole dei da; operazionali, apraverso un procedimento di selezione e sintesi progressiva

6 Un po di storia (2) L aumento esponenziale del volume dei da; operazionali ha reso il calcolatore l unico supporto adapo al processo decisionale Il ruolo delle basi di da; è sensibilmente cambiato, dalla fine degli anni `80, con la nascita dei DSS Nasce il data warehouse: una raccolta di da; integrata, subject oriented, variabile nel tempo e non vola#le di supporto ai processi decisionali

7 Integrazione Data Warehouse (1) Nel data warehouse confluiscono da; provenien; da più sistemi transazionali e da fon; esterne L obiekvo dell integrazione viene raggiunto mediante l u;lizzo di metodi di codifica uniformi Orientamento al sogge>o I da; vengono archivia; per poter essere facilmente reperi; ed analizza; dagli uten; Non si mira a minimizzare la ridondanza, ma piuposto a fornire da; che abbiano una strupura in grado di favorire la produzione di informazioni

8 Data Warehouse (2) Variabilità nel tempo Nel DW sono contenute informazioni rela;ve alle aree di interesse che colgono la situazione rela;va ad un dato fenomeno in un determinato intervallo temporale (generalmente antecedente all interrogazione) Non vola#lità Non modificabilità dei da; contenu; nel DW, che consente accessi in sola lepura Semplicità di progepazione: non si ricorre a strumen; complessi per ges;re l integrità referenziale o per bloccare record cui possono accedere più uten; in fase di aggiornamento

9 Sistema informa;vo vs. DSS Un sistema informa#vo converte da; in informazioni, ed ha lo scopo di collezionare, trasformare e distribuire informazione (e.g., search engine) Un sistema di supporto alle decisioni è un sistema informa;vo intelligente che aiuta l utente a prendere decisioni, senza sos;tuirsi ad esso

10 Vantaggi dei DSS Il DSS, apraverso procedure interabve, fornisce al decisore: la disponibilità di tupe le informazioni necessarie per la comprensione del problema la possibilità di esplorare i da; secondo diversi pun; di vista, in base alle esigenze dello stesso utente la possibilità di valutare gli scenari conseguen; alle scelte compiute I DSS si adapano al trapamento di problemi strupura; o semistrupura;, per i quali non è possibile fornire una soluzione algoritmica

11 Problema;che Tra le problema;che da affrontare per la realizzazione di un sistema di supporto alle decisioni ricordiamo la necessità di... ges;re grandi moli di da; accedere a diverse fon; di da; su piapaforme eterogenee garan;re l accesso a più uten; con compi; differenzia; per interrogazioni, analisi in tempo reale e simulazioni ges;re versioni storiche dei da;

12 ObieKvi di un DSS PermePere l estrazione di informazione da grandi database, in tempi brevi ed in modo flessibile, per supportare e migliorare il processo decisionale Necessità di separare i da; genera; dalle operazioni di ges;one (opera#onal database) dai da; u;li ai processi decisionali (data warehouse) Data warehouse con;ene un sopoinsieme dei da; mantenu; nell opera;onal database, okmizzato per analisi focalizzate ai processi decisionali Nell opera;onal database e nel data warehouse i da; sono memorizza; a livelli diversi di aggregazione Capacità di analisi dei da; contenu; nel data warehouse in tempo reale e da diversi pun; di vista

13 Riassumendo... Pertanto, il DW con;ene i da; necessari ai processi decisionali L opera;onal database è aggiornato costantemente: deve fotografare l istante corrente Il DW con;ene i da; aggrega; in par;colari istan; di tempo (es. da; sekmanali, mensili, trimestrali) Nel DW, i da; che provengono dall opera;onal database devono essere integra; con i da; rela;vi all ambiente esterno (che condizionano il processo decisionale) Il DW è una sorta di storico che raccoglie istantanee significa;ve dell opera;onal database, o meglio è una collezione di metodi, tecnologie e strumen; di ausilio al knowledge worker (amministratore, gestore, analista, dirigente) per condurre analisi dei da; finalizzate all apuazione di processi decisionali e al miglioramento del patrimonio informa;vo

14 Knowledge Data Discovery (1) Il processo KDD prevede in input da; grezzi e fornisce in output informazioni u;li openute apraverso diverse fasi

15 Knowledge Data Discovery (2) Gli stadi che caraperizzano un processo KDD sono sta; iden;fica; da Fayyad, Piatetsky- Shapiro, Smyth e Uthurusamy (1996) Nell elencare e descrivere le fasi del KDD, tale ricerca ha posto par;colare accento sulla fase di Data Mining (DM), cioè sulle tecniche per l esplorazione e lo studio dei da; Il DM è ritenuta la fase più importante dell intero processo KDD e tale importanza rende sempre più difficile, soprapupo in termini pra;ci, dis;nguere il processo KDD dal DM

16 Selezione I da; grezzi (raw data) vengono segmenta; e seleziona; secondo criteri predefini;, per pervenire ad un sopoinsieme di da; che rappresentano i target data o da; obiekvo Il database operazionale può contenere informazioni inu;li per il problema specifico Esempio: se l obiekvo è lo studio delle associazioni tra i prodok di una catena di supermerca;, non ha senso conservare i da; rela;vi alla professione dei clien;; tali da; potrebbero invece fornire informazioni d interesse rela;ve al comportamento di determinate fasce di clien;, per effepuare un analisi discriminante

17 Pre- processing Spesso, pur avendo a disposizione i da; obiekvo non è conveniente, né necessario, analizzarne l intero contenuto Occorre prima campionare le tabelle e, successivamente, effepuare un analisi su base campionaria Fa inoltre parte dello stadio di preprocessing la fase di pulizia dei da;, o data cleaning, che prevede l eliminazione dei possibili errori e la definizione dei meccanismi di comportamento in caso di da; mancan;

18 Trasformazione dei da; Dopo il preprocessing, i da;, per essere u;lizzabili, devono essere trasforma; Si possono effepuare conversioni di ;po o definizioni di nuovi da; openu; apraverso l uso di operazioni matema;che e logiche sulle variabili Inoltre, quando i da; provengono da fon; diverse, è necessario codificarli omogeneamente, per garan;rne la consistenza

19 Data Mining Ai da; trasforma; vengono applicate tecniche per l estrazione di informazione non banale I ;pi di da; a disposizione e gli obiekvi da raggiungere indicano implicitamente il ;po di algoritmo DM da scegliere Il processo KDD è: InteraBvo, presuppone infak un dialogo costante tra l utente e il sonware u;lizzato Itera#vo, nel senso che la fase di DM può prevedere un ulteriore trasformazione dei da; originali o un ulteriore pulizia dei da;, ovvero una riesecuzione delle fasi preliminari

20 Interpretazione e valutazione Il DM crea dei papern, ovvero dei modelli, che possono cos;tuire un valido supporto alle decisioni Non è sufficiente, tupavia, interpretare i risulta; openu;, ma occorre u;lizzarli per validare i modelli (da; e algoritmi) È dunque possibile, alla luce di risulta; non perfepamente soddisfacen;, intervenire (in maniera sia adakva sia perfekva) su una o più fasi del processo KDD

21 Regole derivate Le relazioni scoperte sono valide se valgono, con un grado di certezza prefissato, anche su da; diversi da quelli usa; per la scoperta delle stesse Individuare un grado di certezza è essenziale per stabilire quanta fiducia si può riporre nel sistema e nella relazione estrapa Le relazioni scoperte devono essere nuove almeno per il sistema, devono cioè aumentare la conoscenza necessaria ad affrontare il problema decisionale Le relazioni dovrebbero potenzialmente condurre a delle azioni u#li Per esempio, la scoperta di una dipendenza fra ar;coli acquista; da uno stesso cliente in un supermercato potrebbe akvare opportune strategie di marke;ng I papern devono essere comprensibili agli uten; per facilitare una migliore conoscenza dei fak coinvol; Poiché è difficile misurare la comprensibilità di un papern spesso si ricorre a misure surrogate di semplicità sintakca/seman;ca

22 Esempio di DM Mancato pagamento Pagamento avvenuto regolarmente 10 Prestito Stipendio

23 Esempio di DM Mancato pagamento Pagamento avvenuto regolarmente 10 Prestito IF Stipendio < 10 THEN Mancato Pagamento Stipendio

24 Tecniche di DM (1) La scelta del par;colare algoritmo di data mining dipende dall obiekvo da raggiungere e dal ;po di da; da analizzare Regole di associazione Classificazione Clustering Similarity search

25 Tecniche di DM (1) Le tecniche di analisi delle associazioni consentono di individuare regole nelle occorrenze concomitan; di due o più even; Le tecniche di clustering e le re; neurali non supervisionate consentono il raggruppamento di da;, cioè l individuazione di gruppi omogenei, che presentano delle regolarità al loro interno, in grado di caraperizzarli e differenziarli dagli altri gruppi Le re# neurali supervisionate, le support vector machine e gli alberi di decisione consentono di effepuare operazioni di classificazione, fanno cioè uso della conoscenza acquisita in fase di addestramento per classificare nuovi oggek o prevedere nuovi even; Le tecniche di similarity search consentono, data un base di da; di sequenze temporali o oggek, di determinare sequenze/oggek simili ad una sequenza/oggepo data/o, o tupe le coppie di sequenze/oggek simili

26 Applicazioni del DM (1) Indagini di mercato (Database Marke#ng): applicazione di tecniche di clustering per individuare gruppi omogenei in termini di comportamento d acquisto e di caraperis;che sociodemografiche; l individuazione delle diverse ;pologie di clien;......permepe di effepuare campagne di marke;ng mirate e di valutarne gli effek...permepe di openere indicazioni su come modificare la propria offerta...rende possibile monitorare nel tempo l evoluzione della propria clientela e l emergenza di nuove ;pologie Analisi testuale (Text Mining): applicazione di tecniche di clustering per individuare gruppi omogenei di documen; in termini di argomento trapato; consente di accedere più velocemente all argomento di interesse e di individuarne i legami con argomen; correla;

27 Applicazioni del DM (2) Analisi del paniere (Basket Analysis): applicazione di tecniche di individuazione di associazioni a da; di vendita per conoscere quali prodok vengono acquista; congiuntamente Consente di migliorare l offerta dei prodok (disposizione sugli scaffali) e di incrementare le vendite di par;colari prodok tramite offerte su generi associa; Technology Watch (Compe##ve Intelligence): applicazione di tecniche di clustering a banche da; di ;po tecnicoscien;fico al fine di individuare i gruppi tema;ci principali, le loro relazioni, l evoluzione temporale, le persone o le aziende coinvolte

28 CLUSTERING ANALYSIS Knowledge Data Discovery Prof. R. Oliveto - A.A. 2011/2012

29 Cos è la clustering analysis Clustering: l azione che mira a raggruppare oggek simili in insiemi In generale, un problema di clustering consiste nel trovare il par;zionamento okmo dei da; in K cluster (esclusivi)

30 Perchè è u;le in Bionforma;ca Ecologia delle piante e degli animali E usata per descrivere e effepurare comparazioni spaziali e temporali di comunità di organismi in ambien; eterogenei. Trascri>omica E usata per costruire gruppi di geni con papern espressivi collega; (coexpressed genes). Spesso tali gruppi contengono proteine dipenden; dal punto di vista funzionale, quali enzimi per uno specifico sen;ero metabolico. Analisi delle sequenze E usata per raggruppare sequenze omologhe in famiglie di geni. ConcePo fondamentale in bioinforma;ca, e biologia evolu;va in generale. Huma Gene#c Clustering La somiglianza tra data gene;ci è usata per clusterizzare e quindi inferire strupure delle popolazioni.

31 Esempio (1) DNA Chips/Microarrays Consentono di misurare il levello espressivo di un numero elva;ssimo di geni all interno di diversi condizioni/campioni sperimentali Il campionamento può essere effepuato considerando Diversi istan; temporali Diverse condizioni ambientali Diversi organismi Tessu; sani e affek da cancro Diversi individui

32 Esempio (2) Microarray data (gene expression data) sono rappresenta; apraverso una matrice, dove Ciascun gene corrisponde ad una riga Ciascuna condizione sperimentale corrisponde ad una colonna Il generico elemento (i,j) della matrice rappresenta il livello espressivo del gene i nella condizione sperimentale j Generalemente è un numero reale che rappresenta il logoritmo del valore dell mrna del gene sopo par;colari condizioni sperimentali

33 Clustering (1) Un problema di clustering può essere visto come una classificazione non supervisionata A tal proposito il clustering è appropriato quando non c è alcuna conoscenza dei da; Assenza di label: necessario classificare i dati Exp. e1 e2 e3 e4 L g ? g2? Genes g3? g4? g5? Exp. Genes g1 g2 g3 g4 g5 L e1 0.76? e2 3.2? e3? e4-0.45? Il clustering è una metodologia di analisi dei da; molto usato al fine di verificare ipotesi intui;ve rela;ve a grandi basi di da; effepuare un pre- processing dei da; per prepararli ad analisi successive (e.g., iden;ficazione di geni predipori per la classificazione di tumori) iden;ficare biomarker (i.e., indicatore di uno stato biologico)

34 Clustering (2) Il clustering è soggettivo Le label sono determinate da un umano I Simpson Impiegati Donne Maschi Il clustering dipende da una misura di somiglianza (relational criterion) che sarà espresso attraverso una funzione di distanza 7

35 Il clustering può essere effepuato su ogni ;po di da; Geni, campioni, ;me points in una ;me series, etc. Gli algoritmi di clustering traperanno tuk gli input come un set di n numeri o come un vepore n- dimensionale Il clustering consente di esplorare da; in maniera efficace La visualizzazione dei da; può aiutare a controllare la qualità dei da; Clustering (3) Si basa sull assunzione Guilt by associa#on Geni che hanno simili papern espressivi possono indicare una relazione biologica

36 Il Clustering e la Biologia In trascri>omica, il clustering è usato per costruire gruppi di geni con papern espressivi (osserva; in diversi esperimen;) tra loro collega; (co- expressed genes) Nell analisi delle sequenze, il clustering è usato per raggruppare sequenze omologhe in famiglie di geni Nella diagnosi di tumori e trapamen;: Iden;ficare nuove classi di campioni biologici (e.g., sopo;pi di tumori) TraPamen; individuali Lo stesso ;po di tumore (in diversi pazien;) non necessariamente risponde allo stesso modo alla terapia NCI- 60 Cancer Cell Line Muta;on Data Con;ene i livelli espressivi di circa 1400 geni e la farmo- resistenza rispepo a 1400 medicinali forni; dal Na;onal Cancer Ins;tute per 60 cellule tumorali

37 Expression Vectors I Gene Expression Vectors sono usa; per rappresentare l espressione di un gene in diverse condizioni sperimentali o ;pi di campionamento

38 Interpretazione geometrica t 1 t 2 t 3 G G G Similar Expression G G Experiment 3 Experiment 2 Experiment 1

39 Distanza Intra e Inter- cluster La distanza intracluster è minimizzata La distanza intercluster è massimizzata

40 Cos è la somiglianza Similarity is hard to define, but We know it when we see it Determinare la somiglianza tra oggetti è un tipico task di machine learning 15

41 Analisi dei cluster (1) Per raggruppare insieme oggek è necessario definere: 1. Misura di Distanza tra oggeb: definisce il significato della somiglianza/diversità degli oggek Two conditions and n genes Two genes and n conditions

42 Analisi dei cluster (2) 2. Algoritmo di clustering: definisce le operazioni per openere un insieme di cluster Considerare tupe le possibili soluzioni e prendere quella che ha il migliore inter e intra distanza è impra;cabile... Possibili soluzioni dove k rappresenta il numero di cluster e n il numero di punti

43 Proprietà della distanza Un misura di distanza d è una funzione che prende come argomento due pun; x e y in uno spazio n- dimenzionale Rn e ha le seguen; proprietà: Simmetria: la distanza deve essere simmetrica, ovvero d(x,y) = d(y,x) Posi#vità: la distanza tra due pun; deve essere un numero reale maggiore o uguale a zero d(x,y) 0 per ogni x e y. L uguaglianza è vera solo e solo se x = y, i.e., d(x,x) = 0 Disuguaglianza triangolare: la distanza tra due pun; x e y deve essere minore o iguale della somma delle distanze da x e un terzo punto z e da z a y: d(x,y) d(x,z) + d(z,y) Tale proprietà riflepe il fapo che la distanza tra due pun; dovrebbe essere calcolata considerando il cammino più breve

44 Misure di distanza Da; due vepori n- dimensionali x=(x1, x2,,xn) e y=(y1, y2,,yn), la distanza tra x e y può essere calcolata usando diverse misure: Euclidean distance squared standardized ManhaPan distance Chebychev distance Cosine similarity (Angle) Correla;on distance Mahalanobis distance Minkowski distance

45 Euclidean Distance La distanza Euclidea prende in considerazione sia la direzione che il magnitudo di due vepori La distanza Euclidea tra due vepori n- dimensionali x=(x1,x2,,xn) e y=(y1,y2,,yn) è data da: Ciascun asse rappresenta un esperimento La coordinata di ciascun asse è l espressività del gene nell esperimento (n = 2)

46 Squared Euclidean Distance La distanza Euclidea quadra;ca tra due vepori n- dimensionali x=(x1,x2,,xn) and y=(y1,y2,,yn) è: A differenza della distanza Euclidea, quella quadra;ca tende a date più peso agli outliers (geni con livelli espressivi molto diversi in ciascuna condizione, o due condizioni che causano livelli espressivi molto diversi in ciascun gene) a causa della mancanza della radice quadrata

47 Standardized Euclidean Distance L idea chiave è che non tupe le direzioni hanno la stessa importanza. La distanza Euclidea standardizzata tra due vepori n- dimensionali x=(x1,x2,,xn) e y=(y1,y2,,yn) è: Exp. Dove s 2 1 è la varianza della prima dimensione nello spazio n- dimensionale e 1 e 2 e 3 e n x x 1 x 2 x n y y 1 y 2 y n Genes Usa l idea di pesare ciascuna dimensione con una quan;à inversamente proporzionale alla variabilità dei valori lungo ciascuna dimensione

48 ManhaPan Distance La distanza di ManhaPan rappresenta la distanza misurata lungo direzioni parallele agli assi La distanza di ManhaPan tra due vepori n- dimensionali x=(x1,x2,,xn) e y=(y1,y2,,yn) è:

49 Chebychev Distance La distanza di Chebychev considera semplicemente la maggiore distanza tra due coordinate di due vepori. Ad esempio, se i vepori x=(x1,x2,,xn) e y=(y1,y2,,yn) sono due geni misura; in n esperimen;, la distanza di Chebychev prenderà in considerazione il solo esperimento in cui i due geni hanno la massima differenza espressiva e considererà tale differenza come distanza tra i due geni. Generalmente usata per evidenziare le differenze maggiori tra coordinate corrisponden;. La distanza di Chebychev tra due vepori n- dimensionali x=(x1,x2,,xn) and y=(y1,y2,,yn) è: Da notare che tale misura di distanza è molto sensible ad outlier e poco resistente ad errori di misurazione

50 Cosine Similarity (Angle) The Cosine Similarity takes into account only the angle and discards the magnitude. The Cosine Similarity distance between two n- dimensional vectors x=(x1,x2,,xn) and y=(y1,y2,,yn) is: x x dα ( x, y) = cos( θ) = y = 2 2 x1 + x2 + = x x i= 1 x1 y1 + x2 y2 + + n y y 2 + x n = x i x n 2 y n = n i= 1 x i y i Gene2 Expression Level Gene1 Expression Level θ xy

51 Correla;on Distance La Pearson correla;on distance calcola la distanza tra ciascun punto e la repa di regressione La Pearson correla;on distance tra due vepori n- dimensionali x=(x1,x2,,xn) e y=(y1,y2,,yn) è: dove rappresenta il coefficiente di correlazione di Pearson

52 Mahalanobis Distance La distanza di Mahalanobis tra due vepori n- dimensionali x=(x1,x2,,xn) e y=(y1,y2,,yn) è: La matrice S serve a distorcere lo spazio veporiale. Generalmente S è rappresentata dalla matrice della covarianza. Se invece S è la matrice iden;tà la distanza di Mahalanobis si riduce a quella Euclidea:

53 Minkowski Distance La distanza di Minkowski è una generalizzazione della distanza Euclidea e di ManhaPan. La distanza di Minkowski tra due vepori n- dimensionali x=(x1,x2,,xn) e y=(y1,y2,,yn) è: d M k( x, y) = { } m m m x y + x y + + x y n n 1 m = n i= 1 x i y i m 1 m Ricordando che per m = 1 la distanza si riduce a quella di ManhaPan distance, mentre per m = 2 la distanza di Minkowski si riduce a quella Euclidea

54 Come scegliere la misura? La scelta della misura di distanza è legata al dominio applica;vo, i.e., che ;po di somiglianza si è interessa; a capurare? Euclidean distance: prende in considerazione il magnitudo delle differenze tra i livelli espressivi Distance Correla#on: insensibile all ampiezza delle espressioni, considera solo il trend del cambiamento

55 Confronto tra distanze (1) Euclidean Distance: la più conosciuta ed anche più usata Squared Euclidean Distance: tende ad enfa;zzare le distanze. Gli stessi da; clusterizza; con una distanza euclidea quadra;ca potrebbero apparire più sparsi e meno compak Standardized Euclidean: elimina l influenza di diversi range di variazione. TuPe le direzioni saranno ugualmente imporan; Manha>an Distance: l insieme di geni o esperimen; alla stessa distanza da un punto di riferimento non coincide con l insieme di geni o esperimen; costruito con la distanza Euclidea

56 Confronto tra distanze (2) Cosine Distance (angle): considera solo l angolo e non il magnitudo. Ad esempio: un gene g1 misurato in due esperimen;: g1=(1,1) un gene g2 misurato in due esperimen;: g2 =(100,100) avranno la sequente distanza cos( θ ) = x x y y = 100 [ ] = = 1 l angolo tra i due vepori è zero. Il clustering con questa misura di distanza posizionerà g1 e g2 nello stesso cluster anche se il loro livello espressivo è molto diverso!

57 Confronto tra distanze (3) Correla#on distance: considera simili variazioni e non simili valori numerici. Ad esempio, si consideri un insieme di 5 esperimen; e un gene g1 che ha la seguente espressività g1=(1,2,3,4,5) nei 5 esperimen;. un gene g2 che ha la seguente espressività g2=(100,200,300,400,500) nei 5 esperimen;. un gene g3 che ha la seguente espressività g3=(5,4,3,2,1) nei 5 esperimen;. La correla;on distance meperà g1 e g2 nello stesso cluster e g3 in un cluster diverso, poichè: g1= (1,2,3,4,5) e g2=(100,200,300,400,500) hanno un alta correlazione (1) d(g1,g2) = 1- r = 1-1 = 0 g1= (1,2,3,4,5) e g3= (5,4,3,2,1) sono correla; inversamente (- 1) d(g1,g3) = 1- r = 1- (- 1) = 2

58 Confronto tra distanze (4) Chebychev distance: si focalizza sulle differenze più importan;. I vepori (1,2,3,4) e (2,3,4,5) hanno distanza Euclidea 2 e 1 come distanza di Chebychev. I vepori (1,2,3,4) e (1,2,3,6) hanno distanza Euclidea e 2 come distanza di Chebychev. Mahalanobis distance: può deformare lo spazio nel modo più conviente. Generalmente, lo spazio è deformato usando la matrice di covarianza.

59 Osservazioni Tu>o può essere clusterizzato Il clustering è altamente dipendente dalla misura di distanza ado>ata. Cambiare la misura di distanza può influenzare dramma;camente il numero e la composizione dei cluster, così come le relazioni tra loro Lo stesso algor#mo di clustering applicato allo stesso dataset può produrre risulta# diversi. Mol; algor;mi di clustering hanno una componente non- determinis;ca intrinseca Un insieme di cluster che include tuk i geni o gli esperimen; considera; forma un clustering, albero di cluster o dendogramma

60 Algoritmi di clustering I tradizionali algoritmi di clustering posso essere divisi in tre principali categorie: Clustering par;zionale Clustering gerarchico Model- based clustering

61 Par;;onal Clustering Il clustering par;zionale ha l obiekvo di dirivare par;zioni (cluster) da una collezione di oggek Mol; di ques; metodi sono basa; sull okmizzazione itera;va di un criterio (funzione obiebvo) che riflepe l agreement tra i da; e la par;zione Un esempio di funzione obiekvo: minimizzare la distanza intra- cluster e massimizzare quella inter- cluster Uno degli algor;mi di clustering par;zionale più usato è il k- means

62 Par;;onal Clustering: k- Means 1. Specificare il numero di cluster desidera; (K) 2. Selezionare il maniera random K elemen; rappresenta;vi, chiama; centroidi 3. Calcolare la distanza di ciascun papern (punto) dal tuk i centroidi 4. Asssegnare i pun; a centroide con la minima distanza 5. Aggiornare i centroidi con la media degli elemen; appartenen; a ciascun cluster e calcolare la nuova composizione dei cluster 6. Controllare la condizione di convergenza Se tuk i pun; sono sta; assegna; agli stessi cluster rispepo all iterazione precedente e quindi tuk i centroidi restano invaria;, fermare il processo Altrimen;, ripar;re dal punto 3

63 K- means clustering (k=3)

64 CaraPeris;che del K- means Una diversa inizializzazione potrebbe produrre cluster diversi. Quindi, diversi run dell algor;mo potrebbero portare a clustering diversi Inizializzazione 1 Inizializzazione II L algoritmo ha una bassa seman;ca: il labelling e l interpretazione dei cluster è una fase successiva

65 Nearest Neighbor Clustering Il numero di cluster (k) non è fissato a priori Una soglia (t) è usata per determinare se un nuovo oggepo deve essere aggiunto ad un cluster esistente oppure è necessario crearne uno nuovo Gli oggek sono aggiun; (in maniera incrementale) ai cluster esisten; più vicini E un algor;mo incrementale

66 Nearest Neighbor Clustering (1) Si sepa una soglia t t

67 Nearest Neighbor Clustering (2) Arriva un nuovo dato Si controlla la soglia t 8 7 Poichè il nuovo dato è 6 all interno della soglia 5 per il cluster 1, il nuovo dato è aggiunto a tale cluster. Si aggiorna il 1 2 centroide Metodi numerici per la bioinformatica 46 Francesco Archetti

68 Nearest Neighbor Clustering 10 Arriva un nuovo dato Si controlla la soglia t 7 6 Poichè il nuovo dato è al 5 di fuori della soglia per il cluster 1, si crea un nuovo cluster Metodi numerici per la bioinformatica 47 Francesco Archetti

69 Nearest Neighbor Clustering Arriva un nuovo dato... Difficile determinare t a priori Si controlla la soglia t Poichè il nuovo dato è al di fuori della soglia per il cluster 1, si crea un Un diverso valore di t implica un diverso nuovo cluster. 10 valore per la distanza intra/inter cluster Metodi numerici per la bioinformatica 47 Francesco Archetti

70 Hierarchical Clustering Il clustering gerarchio mira a un obiekvo più ambizioso, ovvero quello di openere una gerarchia di cluster (dendogramma) che mostra come i cluster sono collega; gli uni agli altri L altezza di un nodo nel dendogramma rappresenta la somiglianza dei due cluster figli

71 Il dendogramma Similarity threshold : 60% Similarity threshold : 70%

72 Euris;che Poichè non è possibile provare tuk i possibili alberi, è necessario definire delle euris;che per costruire il dendogramma Il clustering gerarchico è determinis;co e si okene in due modi: Bo>om- Up (Agglomera#ve): si parte mepeno ciascun oggepo nel proprio cluster, dopodicchè si cerca la migliore coppia e si crea un nuovo cluster. Si con;nua così fino ad arrivare a mepere tuk gli oggek in un unico cluster Top- Down (divisive): si parte mependo tuk gli oggek in un unico cluster, dopodicchè si considerano tupe le possibili strade per dividere il cluster in due. Si sceglie la migliore divisione e si con;nua ad operare in maniera ricorsiva su entrambe le par;zioni create

73 Agglomera;ve Hierarchical Clustering (1) 1. Calcola la distanza tra tuk i data point (geni o esperimen;) 2. Clusterizza i data point in cluster iniziali 3. Calcola la distanza tra tuk i cluster 4. Fondi le coppie di cluster più simili 5. Ripe; 3 e 4 finchè tuk gli elemen; non sono raggruppa; in un unico cluster

74 Agglomera;ve Hierarchical Clustering (2)

75 Varian; del AHC (1) Esistono diversi modi per determinare la somiglianza tra cluster complete-link -max dist.- single-link -min dist.- Group-average -avg dist.-

76 Varian; del AHC (2) Il clustering gerarchico agglomera;vo dipende molto dalla scelta della misura di somiglianza tra cluster Single linkage: distanza tra i meno distan; vicini Complete linkage: distanza tra i più distan; vicini Central linkage: distanza tra i centroidi Average linkage: distanza media tra tuk i pun; Single e Complete linkage usano distanze già calcolate, mentre l average linkage è il più onoreso

Analisi dei requisiti e casi d uso

Analisi dei requisiti e casi d uso Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello del sistema 4 2.1 Requisiti hardware........................ 4 2.2 Requisiti software.........................

Dettagli

Elementi di Statistica

Elementi di Statistica Elementi di Statistica Contenuti Contenuti di Statistica nel corso di Data Base Elementi di statistica descrittiva: media, moda, mediana, indici di dispersione Introduzione alle variabili casuali e alle

Dettagli

REALIZZARE UN MODELLO DI IMPRESA

REALIZZARE UN MODELLO DI IMPRESA REALIZZARE UN MODELLO DI IMPRESA - organizzare e gestire l insieme delle attività, utilizzando una piattaforma per la gestione aziendale: integrata, completa, flessibile, coerente e con un grado di complessità

Dettagli

Relazione sul data warehouse e sul data mining

Relazione sul data warehouse e sul data mining Relazione sul data warehouse e sul data mining INTRODUZIONE Inquadrando il sistema informativo aziendale automatizzato come costituito dall insieme delle risorse messe a disposizione della tecnologia,

Dettagli

Product Overview. ITI Apps Enterprise apps for mobile devices

Product Overview. ITI Apps Enterprise apps for mobile devices Product Overview ITI Apps Enterprise apps for mobile devices ITI idea, proge2a e sviluppa apps per gli uten6 business/enterprise che nell ipad, e nelle altre pia2aforme mobili, possono trovare un device

Dettagli

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testualilezione

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testualilezione Text mining ed analisi di dati codificati in linguaggio naturale Analisi esplorative di dati testualilezione 2 Le principali tecniche di analisi testuale Facendo riferimento alle tecniche di data mining,

Dettagli

Grafi, alberi e re1: modelli su cui cercare soluzioni o;me

Grafi, alberi e re1: modelli su cui cercare soluzioni o;me Università degli Studi Roma Tre Dipar-mento di Scienze della Formazione Laboratorio di Matema-ca per la Formazione Primaria Grafi, alberi e re: modelli su cui cercare soluzioni o;me Mini corso Informa.ca

Dettagli

Sistemi di supporto alle decisioni Ing. Valerio Lacagnina

Sistemi di supporto alle decisioni Ing. Valerio Lacagnina Cosa è il DSS L elevato sviluppo dei personal computer, delle reti di calcolatori, dei sistemi database di grandi dimensioni, e la forte espansione di modelli basati sui calcolatori rappresentano gli sviluppi

Dettagli

di4g: Uno strumento di clustering per l analisi integrata di dati geologici

di4g: Uno strumento di clustering per l analisi integrata di dati geologici di4g: Uno strumento di clustering per l analisi integrata di dati geologici Alice Piva 1, Giacomo Gamberoni 1, Denis Ferraretti 1, Evelina Lamma 2 1 intelliware snc, via J.F.Kennedy 15, 44122 Ferrara,

Dettagli

La Valutazione della Ricerca nelle Università Italiane: la SUA-RD e le prospettive future.

La Valutazione della Ricerca nelle Università Italiane: la SUA-RD e le prospettive future. La Valutazione della Ricerca nelle Università Italiane: la SUA-RD e le prospettive future. Massimo Castagnaro Coordinatore AVA - Consiglio Direttivo ANVUR massimo.castagnaro@anvur.org Roma, 11.11.2014

Dettagli

Esercizi per il corso di Algoritmi e Strutture Dati

Esercizi per il corso di Algoritmi e Strutture Dati 1 Esercizi per il corso di Algoritmi e Strutture Dati Esercizi sulla Tecnica Divide et Impera N.B. Tutti gli algoritmi vanno scritti in pseudocodice (non in Java, né in C++, etc. ). Di tutti gli algoritmi

Dettagli

Realizzare un architettura integrata di Business Intelligence

Realizzare un architettura integrata di Business Intelligence Realizzare un architettura integrata di Business Intelligence Un sistema integrato di Business Intelligence consente all azienda customer oriented una gestione efficace ed efficiente della conoscenza del

Dettagli

Devi fare una fattura elettronica alla PA? Tu fatturi, al resto ci pensiamo noi. Servizio Fatt PA Lextel

Devi fare una fattura elettronica alla PA? Tu fatturi, al resto ci pensiamo noi. Servizio Fatt PA Lextel Devi fare una fattura elettronica alla PA? Tu fatturi, al resto ci pensiamo noi. Servizio Fatt PA Lextel FATTURAZIONE ELETTRONICA Fa# PA è il servizio online di fa/urazione ele/ronica semplice e sicuro

Dettagli

EQUAZIONI E DISEQUAZIONI POLINOMIALI E COLLEGAMENTI CON LA GEOMETRIA ELEMENTARE

EQUAZIONI E DISEQUAZIONI POLINOMIALI E COLLEGAMENTI CON LA GEOMETRIA ELEMENTARE EQUAZIONI E DISEQUAZIONI POLINOMIALI E COLLEGAMENTI CON LA GEOMETRIA ELEMENTARE 1. EQUAZIONI Definizione: un equazione è un uguaglianza tra due espressioni letterali (cioè in cui compaiono numeri, lettere

Dettagli

Business Intelligence. Il data mining in

Business Intelligence. Il data mining in Business Intelligence Il data mining in L'analisi matematica per dedurre schemi e tendenze dai dati storici esistenti. Revenue Management. Previsioni di occupazione. Marketing. Mail diretto a clienti specifici.

Dettagli

Stefano Bonetti Framework per la valutazione progressiva di interrogazioni di localizzazione

Stefano Bonetti Framework per la valutazione progressiva di interrogazioni di localizzazione Analisi del dominio: i sistemi per la localizzazione Definizione e implementazione del framework e risultati sperimentali e sviluppi futuri Tecniche di localizzazione Triangolazione Analisi della scena

Dettagli

RELAZIONE TRA DUE VARIABILI QUANTITATIVE

RELAZIONE TRA DUE VARIABILI QUANTITATIVE RELAZIONE TRA DUE VARIABILI QUANTITATIVE Quando si considerano due o più caratteri (variabili) si possono esaminare anche il tipo e l'intensità delle relazioni che sussistono tra loro. Nel caso in cui

Dettagli

15 Aggiornamento Circolare 263/2006: Esternalizzazione di funzioni aziendali

15 Aggiornamento Circolare 263/2006: Esternalizzazione di funzioni aziendali Informa(on and Communica(on Technology supply chain security 15 Aggiornamento Circolare 263/2006: Esternalizzazione di funzioni aziendali Luca Lazzaretto Rosangela D'Affuso Padova, 29 aprile 2015 1 15

Dettagli

(accuratezza) ovvero (esattezza)

(accuratezza) ovvero (esattezza) Capitolo n 2 2.1 - Misure ed errori In un analisi chimica si misurano dei valori chimico-fisici di svariate grandezze; tuttavia ogni misura comporta sempre una incertezza, dovuta alla presenza non eliminabile

Dettagli

ANALISI DEI DATI CON SPSS

ANALISI DEI DATI CON SPSS STRUMENTI E METODI PER LE SCIENZE SOCIALI Claudio Barbaranelli ANALISI DEI DATI CON SPSS II. LE ANALISI MULTIVARIATE ISBN 978-88-7916-315-9 Copyright 2006 Via Cervignano 4-20137 Milano Catalogo: www.lededizioni.com

Dettagli

Analisi dei requisiti e casi d uso

Analisi dei requisiti e casi d uso Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello della Web Application 5 3 Struttura della web Application 6 4 Casi di utilizzo della Web

Dettagli

I.Stat Guida utente Versione 1.7 Dicembre 2010

I.Stat Guida utente Versione 1.7 Dicembre 2010 I.Stat Guida utente Versione 1.7 Dicembre 2010 1 Sommario INTRODUZIONE 3 I concetti principali di I.Stat 4 Organizzazione dei dati 4 Ricerca 5 GUIDA UTENTE 6 Per iniziare 6 Selezione della lingua 7 Individuazione

Dettagli

Business Intelligence: dell impresa

Business Intelligence: dell impresa Architetture Business Intelligence: dell impresa Silvana Bortolin Come organizzare la complessità e porla al servizio dell impresa attraverso i sistemi di Business Intelligence, per creare processi organizzativi

Dettagli

Accesso in cloud alle informazioni mul1mediali, provenien1 da più fon1 e canali di comunicazione (Es. rassegna stampa)

Accesso in cloud alle informazioni mul1mediali, provenien1 da più fon1 e canali di comunicazione (Es. rassegna stampa) Accesso in cloud alle informazioni mul1mediali, provenien1 da più fon1 e canali di comunicazione (Es. rassegna stampa) Massimiliano Viglian1 Solu1on Specialist Applica1on Division CBT Comunicazione integrata

Dettagli

VC-dimension: Esempio

VC-dimension: Esempio VC-dimension: Esempio Quale è la VC-dimension di. y b = 0 f() = 1 f() = 1 iperpiano 20? VC-dimension: Esempio Quale è la VC-dimension di? banale. Vediamo cosa succede con 2 punti: 21 VC-dimension: Esempio

Dettagli

RETTE, PIANI, SFERE, CIRCONFERENZE

RETTE, PIANI, SFERE, CIRCONFERENZE RETTE, PIANI, SFERE, CIRCONFERENZE 1. Esercizi Esercizio 1. Dati i punti A(1, 0, 1) e B(, 1, 1) trovare (1) la loro distanza; () il punto medio del segmento AB; (3) la retta AB sia in forma parametrica,

Dettagli

errore I = numero soggetti (I = 4) K = numero livelli tratt. (K = 3) popolazione varianza dovuta ai soggetti trattamento

errore I = numero soggetti (I = 4) K = numero livelli tratt. (K = 3) popolazione varianza dovuta ai soggetti trattamento Analisi della varianza a una via a misure ripetute (Anova con 1 fattore within) modello strutturale dell'analisi della varianza a misure ripetute con 1 fattore: y = μ ik 0 +π i +α k + ik ε ik interazione

Dettagli

Indicizzazione terza parte e modello booleano

Indicizzazione terza parte e modello booleano Reperimento dell informazione (IR) - aa 2014-2015 Indicizzazione terza parte e modello booleano Gruppo di ricerca su Sistemi di Gestione delle Informazioni (IMS) Dipartimento di Ingegneria dell Informazione

Dettagli

General Linear Model. Esercizio

General Linear Model. Esercizio Esercizio General Linear Model Una delle molteplici applicazioni del General Linear Model è la Trend Surface Analysis. Questa tecnica cerca di individuare, in un modello di superficie, quale tendenza segue

Dettagli

ESAME DI STATO DI LICEO SCIENTIFICO CORSO DI ORDINAMENTO 2004

ESAME DI STATO DI LICEO SCIENTIFICO CORSO DI ORDINAMENTO 2004 ESAME DI STATO DI LICEO SCIENTIFICO CORSO DI ORDINAMENTO 004 Il candidato risolva uno dei due problemi e 5 dei 10 quesiti in cui si articola il questionario. PROBLEMA 1 Sia f la funzione definita da: f

Dettagli

Data warehouse.stat Guida utente

Data warehouse.stat Guida utente Data warehouse.stat Guida utente Versione 3.0 Giugno 2013 1 Sommario INTRODUZIONE 3 I concetti principali 4 Organizzazione dei dati 4 Ricerca 5 Il browser 5 GUIDA UTENTE 6 Per iniziare 6 Selezione della

Dettagli

Presentazione Commerciale So1lab S.p.A.

Presentazione Commerciale So1lab S.p.A. Presentazione Commerciale So1lab S.p.A. Marzo 2013 So1lab Composta da circa 500 risorse, So#lab è da quasi 30 anni specializzata nella proge+azione, produzione e sviluppo evolu?vo di tecnologie, sistemi,

Dettagli

Indice generale. Modulo 1 Algebra 2

Indice generale. Modulo 1 Algebra 2 Indice generale Modulo 1 Algebra 2 Capitolo 1 Scomposizione in fattori. Equazioni di grado superiore al primo 1.1 La scomposizione in fattori 2 1.2 Raccoglimento a fattor comune 3 1.3 Raccoglimenti successivi

Dettagli

Data Alignment and (Geo)Referencing (sometimes Registration process)

Data Alignment and (Geo)Referencing (sometimes Registration process) Data Alignment and (Geo)Referencing (sometimes Registration process) All data aquired from a scan position are refered to an intrinsic reference system (even if more than one scan has been performed) Data

Dettagli

DERIVATE DELLE FUNZIONI. esercizi proposti dal Prof. Gianluigi Trivia

DERIVATE DELLE FUNZIONI. esercizi proposti dal Prof. Gianluigi Trivia DERIVATE DELLE FUNZIONI esercizi proposti dal Prof. Gianluigi Trivia Incremento della variabile indipendente e della funzione. Se, sono due valori della variabile indipendente, y f ) e y f ) le corrispondenti

Dettagli

a. 10 4 b. 10-15 c. 10 25 d. 10-4 a. 4,375 10-7 b. 3,625 10-6 c. 4,375 10 2 d. nessuno dei precedenti valori a. 10-5 b. 10 +5 c. 10 +15 d.

a. 10 4 b. 10-15 c. 10 25 d. 10-4 a. 4,375 10-7 b. 3,625 10-6 c. 4,375 10 2 d. nessuno dei precedenti valori a. 10-5 b. 10 +5 c. 10 +15 d. 1) Il valore di 5 10 20 è: a. 10 4 b. 10-15 c. 10 25 d. 10-4 2) Il valore del rapporto (2,8 10-4 ) / (6,4 10 2 ) è: a. 4,375 10-7 b. 3,625 10-6 c. 4,375 10 2 d. nessuno dei precedenti valori 3) La quantità

Dettagli

Accuratezza di uno strumento

Accuratezza di uno strumento Accuratezza di uno strumento Come abbiamo già accennato la volta scora, il risultato della misurazione di una grandezza fisica, qualsiasi sia lo strumento utilizzato, non è mai un valore numerico X univocamente

Dettagli

Ricerca Operativa Branch-and-Bound per problemi di Programmazione Lineare Intera

Ricerca Operativa Branch-and-Bound per problemi di Programmazione Lineare Intera Ricerca Operativa Branch-and-Bound per problemi di Programmazione Lineare Intera L. De Giovanni AVVERTENZA: le note presentate di seguito non hanno alcuna pretesa di completezza, né hanno lo scopo di sostituirsi

Dettagli

Quando A e B coincidono una coppia ordinata é determinata anche dalla loro posizione.

Quando A e B coincidono una coppia ordinata é determinata anche dalla loro posizione. Grafi ed Alberi Pag. /26 Grafi ed Alberi In questo capitolo richiameremo i principali concetti di due ADT che ricorreranno puntualmente nel corso della nostra trattazione: i grafi e gli alberi. Naturale

Dettagli

Dott.ssa Caterina Gurrieri

Dott.ssa Caterina Gurrieri Dott.ssa Caterina Gurrieri Le relazioni tra caratteri Data una tabella a doppia entrata, grande importanza riveste il misurare se e in che misura le variabili in essa riportata sono in qualche modo

Dettagli

Valore di costo procedimen+ sinte+ci

Valore di costo procedimen+ sinte+ci Corso di valutazione es+ma+va del proge5o Clasa a.a. 2012/13 Valore di costo procedimen+ sinte+ci Docente Collaboratore prof. Stefano Stanghellini arch. Pietro Bonifaci Il mercato delle costruzioni LE

Dettagli

Il sistema AVA e la VQR: la Scheda Unica Annuale della Ricerca Dipartimentale (SUA-RD)

Il sistema AVA e la VQR: la Scheda Unica Annuale della Ricerca Dipartimentale (SUA-RD) Il sistema AVA e la VQR: la Scheda Unica Annuale della Ricerca Dipartimentale (SUA-RD) Massimo Castagnaro Coordinatore AVA - Consiglio Direttivo ANVUR massimo.castagnaro@anvur.org Lecce, 19.02.2014 La

Dettagli

if t>=0 x=1; else x=0; end fornisce, nella variabile x, il valore della funzione gradino a tempi continui, calcolata in t.

if t>=0 x=1; else x=0; end fornisce, nella variabile x, il valore della funzione gradino a tempi continui, calcolata in t. Il programma MATLAB In queste pagine si introduce in maniera molto breve il programma di simulazione MAT- LAB (una abbreviazione di MATrix LABoratory). Introduzione MATLAB è un programma interattivo di

Dettagli

Algoritmo euclideo, massimo comun divisore ed equazioni diofantee

Algoritmo euclideo, massimo comun divisore ed equazioni diofantee Algoritmo euclideo, massimo comun divisore ed equazioni diofantee Se a e b sono numeri interi, si dice che a divide b, in simboli: a b, se e solo se esiste c Z tale che b = ac. Si può subito notare che:

Dettagli

4.2. IL TEST F DI FISHER O ANALISI DELLA VARIANZA (ANOVA)

4.2. IL TEST F DI FISHER O ANALISI DELLA VARIANZA (ANOVA) 4.2. IL TEST F DI FISHER O ANALISI DELLA VARIANZA (ANOVA) L analisi della varianza è un metodo sviluppato da Fisher, che è fondamentale per l interpretazione statistica di molti dati biologici ed è alla

Dettagli

Esempi di algoritmi. Lezione III

Esempi di algoritmi. Lezione III Esempi di algoritmi Lezione III Scopo della lezione Implementare da zero algoritmi di media complessità. Verificare la correttezza di un algoritmo eseguendolo a mano. Imparare a valutare le prestazioni

Dettagli

Esercizi svolti sui numeri complessi

Esercizi svolti sui numeri complessi Francesco Daddi - ottobre 009 Esercizio 1 Risolvere l equazione z 1 + i = 1. Soluzione. Moltiplichiamo entrambi i membri per 1 + i in definitiva la soluzione è z 1 + i 1 + i = 1 1 + i z = 1 1 i. : z =

Dettagli

DI D AGRA R MM M I M A BLOCC C H C I TEORI R A E D D E SERC R I C ZI 1 1

DI D AGRA R MM M I M A BLOCC C H C I TEORI R A E D D E SERC R I C ZI 1 1 DIAGRAMMI A BLOCCHI TEORIA ED ESERCIZI 1 1 Il linguaggio dei diagrammi a blocchi è un possibile formalismo per la descrizione di algoritmi Il diagramma a blocchi, o flowchart, è una rappresentazione grafica

Dettagli

ISTITUTO COMPRENSIVO N 1 LANCIANO - SCUOLA SECONDARIA DI PRIMO GRADO CURRICOLO VERTICALE - Classe Prima MATEMATICA a.s. 2014/2015

ISTITUTO COMPRENSIVO N 1 LANCIANO - SCUOLA SECONDARIA DI PRIMO GRADO CURRICOLO VERTICALE - Classe Prima MATEMATICA a.s. 2014/2015 NUMERI. SPAZIO E FIGURE. RELAZIONI, FUNZIONI, MISURE, DATI E PREVISIONI Le sociali e ISTITUTO COMPRENSIVO N 1 LANCIANO - SCUOLA SECONDARIA DI PRIMO GRADO CURRICOLO VERTICALE - Classe Prima MATEMATICA procedure

Dettagli

La ricerca empirica: una definizione

La ricerca empirica: una definizione Lucido 35/51 La ricerca empirica: una definizione La ricerca empirica si distingue da altri tipi di ricerca per tre aspetti (Ricolfi, 23): 1. produce asserti o stabilisce nessi tra asserti ipotesi teorie,

Dettagli

Energy Studio Manager Manuale Utente USO DEL SOFTWARE

Energy Studio Manager Manuale Utente USO DEL SOFTWARE Energy Studio Manager Manuale Utente USO DEL SOFTWARE 1 ANALYSIS.EXE IL PROGRAMMA: Una volta aperto il programma e visualizzato uno strumento il programma apparirà come nell esempio seguente: Il programma

Dettagli

Amministrazione, finanza e marketing - Turismo Ministero dell Istruzione, dell Università e della Ricerca PROGRAMMAZIONE DISCIPLINARE PER U. di A.

Amministrazione, finanza e marketing - Turismo Ministero dell Istruzione, dell Università e della Ricerca PROGRAMMAZIONE DISCIPLINARE PER U. di A. UdA n. 1 Titolo: Disequazioni algebriche Saper esprimere in linguaggio matematico disuguaglianze e disequazioni Risolvere problemi mediante l uso di disequazioni algebriche Le disequazioni I principi delle

Dettagli

Parte 2. Determinante e matrice inversa

Parte 2. Determinante e matrice inversa Parte. Determinante e matrice inversa A. Savo Appunti del Corso di Geometria 013-14 Indice delle sezioni 1 Determinante di una matrice, 1 Teorema di Cramer (caso particolare), 3 3 Determinante di una matrice

Dettagli

Metodi e Strumenti per la Caratterizzazione e la Diagnostica di Trasmettitori Digitali RF ing. Gianfranco Miele g.miele@unicas.it

Metodi e Strumenti per la Caratterizzazione e la Diagnostica di Trasmettitori Digitali RF ing. Gianfranco Miele g.miele@unicas.it Corso di laurea magistrale in Ingegneria delle Telecomunicazioni Metodi e Strumenti per la Caratterizzazione e la Diagnostica di Trasmettitori Digitali RF ing. Gianfranco Miele g.miele@unicas.it Trasmettitore

Dettagli

Principal Component Analysis (PCA)

Principal Component Analysis (PCA) Principal Component Analysis (PCA) Come evidenziare l informazione contenuta nei dati S. Marsili-Libelli: Calibrazione di Modelli Dinamici pag. Perche PCA? E un semplice metodo non-parametrico per estrarre

Dettagli

Statistica. Lezione 6

Statistica. Lezione 6 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 6 a.a 011-01 Dott.ssa Daniela Ferrante

Dettagli

PROBABILITA, VALORE ATTESO E VARIANZA DELLE QUANTITÁ ALEATORIE E LORO RELAZIONE CON I DATI OSSERVATI

PROBABILITA, VALORE ATTESO E VARIANZA DELLE QUANTITÁ ALEATORIE E LORO RELAZIONE CON I DATI OSSERVATI statistica, Università Cattaneo-Liuc, AA 006-007, lezione del 08.05.07 IDICE (lezione 08.05.07 PROBABILITA, VALORE ATTESO E VARIAZA DELLE QUATITÁ ALEATORIE E LORO RELAZIOE CO I DATI OSSERVATI 3.1 Valore

Dettagli

Business Intelligence

Business Intelligence aggregazione dati Business Intelligence analytic applications query d a t a w a r e h o u s e aggregazione budget sales inquiry data mining Decision Support Systems MIS ERP data management Data Modeling

Dettagli

white paper La Process Intelligence migliora le prestazioni operative del settore assicurativo

white paper La Process Intelligence migliora le prestazioni operative del settore assicurativo white paper La Process Intelligence migliora le prestazioni operative del settore assicurativo White paper La Process Intelligence migliora le prestazioni operative del settore assicurativo Pagina 2 Sintesi

Dettagli

Analisi statistica di dati biomedici Analysis of biologicalsignals

Analisi statistica di dati biomedici Analysis of biologicalsignals Analisi statistica di dati biomedici Analysis of biologicalsignals II Parte Verifica delle ipotesi (a) Agostino Accardo (accardo@units.it) Master in Ingegneria Clinica LM in Neuroscienze 2013-2014 e segg.

Dettagli

Esercizi Capitolo 5 - Alberi

Esercizi Capitolo 5 - Alberi Esercizi Capitolo 5 - Alberi Alberto Montresor 19 Agosto, 2014 Alcuni degli esercizi che seguono sono associati alle rispettive soluzioni. Se il vostro lettore PDF lo consente, è possibile saltare alle

Dettagli

Sistemi di supporto alle decisioni

Sistemi di supporto alle decisioni Sistemi di supporto alle decisioni Introduzione I sistemi di supporto alle decisioni, DSS (decision support system), sono strumenti informatici che utilizzano dati e modelli matematici a supporto del decision

Dettagli

Analisi delle Corrispondenze Multiple Prof. Roberto Fantaccione

Analisi delle Corrispondenze Multiple Prof. Roberto Fantaccione Analisi delle Corrispondenze Multiple Prof. Roberto Fantaccione Consideriamo il nostro dataset formato da 468 individui e 1 variabili nominali costituite dalle seguenti modalità : colonna D: Age of client

Dettagli

Da una a più variabili: derivate

Da una a più variabili: derivate Da una a più variabili: derivate ( ) 5 gennaio 2011 Scopo di questo articolo è di evidenziare le analogie e le differenze, relativamente al calcolo differenziale, fra le funzioni di una variabile reale

Dettagli

Release Management. Obiettivi. Definizioni. Responsabilità. Attività. Input

Release Management. Obiettivi. Definizioni. Responsabilità. Attività. Input Release Management Obiettivi Obiettivo del Release Management è di raggiungere una visione d insieme del cambiamento nei servizi IT e accertarsi che tutti gli aspetti di una release (tecnici e non) siano

Dettagli

IT FOR BUSINESS AND FINANCE

IT FOR BUSINESS AND FINANCE IT FOR BUSINESS AND FINANCE Business Intelligence Siena 14 aprile 2011 AGENDA Cos è la Business Intelligence Terminologia Perché la Business Intelligence La Piramide Informativa Macro Architettura Obiettivi

Dettagli

Studio grafico-analitico delle funzioni reali a variabile reale

Studio grafico-analitico delle funzioni reali a variabile reale Studio grafico-analitico delle funzioni reali a variabile reale Sequenza dei passi Classificazione In pratica Classifica il tipo di funzione: Funzione razionale: intera / fratta Funzione irrazionale: intera

Dettagli

BPEL: Business Process Execution Language

BPEL: Business Process Execution Language Ingegneria dei processi aziendali BPEL: Business Process Execution Language Ghilardi Dario 753708 Manenti Andrea 755454 Docente: Prof. Ernesto Damiani BPEL - definizione Business Process Execution Language

Dettagli

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA ESERCIZI SVOLTI PER LA PROVA DI STATISTICA Stefania Naddeo (anno accademico 4/5) INDICE PARTE PRIMA: STATISTICA DESCRITTIVA. DISTRIBUZIONI DI FREQUENZA E FUNZIONE DI RIPARTIZIONE. VALORI CARATTERISTICI

Dettagli

Flusso a costo minimo e simplesso su reti

Flusso a costo minimo e simplesso su reti Flusso a costo minimo e simplesso su reti La particolare struttura di alcuni problemi di PL può essere talvolta utilizzata per la progettazione di tecniche risolutive molto più efficienti dell algoritmo

Dettagli

CAPITOLO CAPIT Tecnologie dell ecnologie dell info inf rmazione e controllo

CAPITOLO CAPIT Tecnologie dell ecnologie dell info inf rmazione e controllo CAPITOLO 8 Tecnologie dell informazione e controllo Agenda Evoluzione dell IT IT, processo decisionale e controllo Sistemi di supporto al processo decisionale Sistemi di controllo a feedback IT e coordinamento

Dettagli

+ / operatori di confronto (espressioni logiche/predicati) / + 5 3 9 = > < Pseudo codice. Pseudo codice

+ / operatori di confronto (espressioni logiche/predicati) / + 5 3 9 = > < Pseudo codice. Pseudo codice Pseudo codice Pseudo codice Paolo Bison Fondamenti di Informatica A.A. 2006/07 Università di Padova linguaggio testuale mix di linguaggio naturale ed elementi linguistici con sintassi ben definita e semantica

Dettagli

RICERCA-AZIONE. l insegnamento riflessivo. Caterina Bortolani-2009

RICERCA-AZIONE. l insegnamento riflessivo. Caterina Bortolani-2009 RICERCA-AZIONE ovvero l insegnamento riflessivo Gli insegnanti sono progettisti.. riflettono sul contesto nel quale devono lavorare sugli obiettivi che vogliono raggiungere decidono quali contenuti trattare

Dettagli

www.bistrategy.it In un momento di crisi perché scegliere di investire sulla Business Intelligence?

www.bistrategy.it In un momento di crisi perché scegliere di investire sulla Business Intelligence? In un momento di crisi perché scegliere di investire sulla Business Intelligence? Cos è? Per definizione, la Business Intelligence è: la trasformazione dei dati in INFORMAZIONI messe a supporto delle decisioni

Dettagli

Una proposta per la matematica del Secondo Biennio e per il quinto anno tra contenuti e attività

Una proposta per la matematica del Secondo Biennio e per il quinto anno tra contenuti e attività XXXII CONVEGNO UMI-CIIM IL VALORE FORMATIVO DELLA MATEMATICA NELLA SCUOLA DI OGGI dedicato a Federigo Enriques Livorno, 16-18 ottobre 2014 Una proposta per la matematica del Secondo Biennio e per il quinto

Dettagli

I N F I N I T Y Z U C C H E T T I WORKFLOW HR

I N F I N I T Y Z U C C H E T T I WORKFLOW HR I N F I N I T Y Z U C C H E T T I WORKFLOW HR WORKFLOW HR Zucchetti, nell ambito delle proprie soluzioni per la gestione del personale, ha realizzato una serie di moduli di Workflow in grado di informatizzare

Dettagli

Problem Management. Obiettivi. Definizioni. Responsabilità. Attività. Input

Problem Management. Obiettivi. Definizioni. Responsabilità. Attività. Input Problem Management Obiettivi Obiettivo del Problem Management e di minimizzare l effetto negativo sull organizzazione degli Incidenti e dei Problemi causati da errori nell infrastruttura e prevenire gli

Dettagli

TECNICHE DI SIMULAZIONE

TECNICHE DI SIMULAZIONE TECNICHE DI SIMULAZIONE MODELLI STATISTICI NELLA SIMULAZIONE Francesca Mazzia Dipartimento di Matematica Università di Bari a.a. 2004/2005 TECNICHE DI SIMULAZIONE p. 1 Modelli statistici nella simulazione

Dettagli

Matematica B - a.a 2006/07 p. 1

Matematica B - a.a 2006/07 p. 1 Matematica B - a.a 2006/07 p. 1 Definizione 1. Un sistema lineare di m equazioni in n incognite, in forma normale, è del tipo a 11 x 1 + + a 1n x n = b 1 a 21 x 1 + + a 2n x n = b 2 (1) = a m1 x 1 + +

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

Le trasformazioni geometriche

Le trasformazioni geometriche Le trasformazioni geometriche Le trasformazioni geometriche Le trasformazioni affini del piano o affinità Le similitudini Le isometrie Le traslazioni Le rotazioni Le simmetrie assiale e centrale Le omotetie

Dettagli

Esponenziali elogaritmi

Esponenziali elogaritmi Esponenziali elogaritmi Potenze ad esponente reale Ricordiamo che per un qualsiasi numero razionale m n prendere n>0) si pone a m n = n a m (in cui si può sempre a patto che a sia un numero reale positivo.

Dettagli

METODO DEI MINIMI QUADRATI. Quest articolo discende soprattutto dai lavori di Deming, Press et al. (Numerical Recipes) e Jefferys.

METODO DEI MINIMI QUADRATI. Quest articolo discende soprattutto dai lavori di Deming, Press et al. (Numerical Recipes) e Jefferys. METODO DEI MINIMI QUADRATI GIUSEPPE GIUDICE Sommario Il metodo dei minimi quadrati è trattato in tutti i testi di statistica e di elaborazione dei dati sperimentali, ma non sempre col rigore necessario

Dettagli

un occhio al passato per il tuo business futuro

un occhio al passato per il tuo business futuro 2 3 5 7 11 13 17 19 23 29 31 37 41 43 47 53 59 61 un occhio al passato per il tuo business futuro BUSINESS DISCOVERY Processi ed analisi per aziende virtuose Che cos è La Business Discovery è un insieme

Dettagli

ESAME DI STATO 2002 SECONDA PROVA SCRITTA PER IL LICEO SCIENTIFICO DI ORDINAMENTO

ESAME DI STATO 2002 SECONDA PROVA SCRITTA PER IL LICEO SCIENTIFICO DI ORDINAMENTO ARCHIMEDE 4/ 97 ESAME DI STATO SECONDA PROVA SCRITTA PER IL LICEO SCIENTIFICO DI ORDINAMENTO Il candidato risolva uno dei due problemi e 5 dei quesiti in cui si articola il questionario. PROBLEMA In un

Dettagli

Estensione di un servizo di messaggistica per telefonia mobile (per una società di agenti TuCSoN)

Estensione di un servizo di messaggistica per telefonia mobile (per una società di agenti TuCSoN) Estensione di un servizo di messaggistica per telefonia mobile (per una società di agenti TuCSoN) System Overview di Mattia Bargellini 1 CAPITOLO 1 1.1 Introduzione Il seguente progetto intende estendere

Dettagli

Modelli di Sistemi di Produzione

Modelli di Sistemi di Produzione Modelli di Sistemi di Produzione 2 Indice 1 I sistemi di produzione 1 1.1 Generalità............................. 1 1.2 I principi dei sistemi manifatturieri............... 4 1.3 Descrizione dei principali

Dettagli

Cristian Secchi Pag. 1

Cristian Secchi Pag. 1 CONTROLLI DIGITALI Laurea Magistrale in Ingegneria Meccatronica SISTEMI A TEMPO DISCRETO Ing. Tel. 0522 522235 e-mail: cristian.secchi@unimore.it http://www.dismi.unimo.it/members/csecchi Richiami di Controlli

Dettagli

Guida rapida all uso di ECM Titanium

Guida rapida all uso di ECM Titanium Guida rapida all uso di ECM Titanium Introduzione Questa guida contiene una spiegazione semplificata del funzionamento del software per Chiputilizzare al meglio il Tuning ECM Titanium ed include tutte

Dettagli

Introduzione ad Access

Introduzione ad Access Introduzione ad Access Luca Bortolussi Dipartimento di Matematica e Informatica Università degli studi di Trieste Access E un programma di gestione di database (DBMS) Access offre: un supporto transazionale

Dettagli

Legge del Raffreddamento di Newton

Legge del Raffreddamento di Newton Legge del Raffreddamento di Newton www.lepla.eu Obiettivo L'obiettivo di questo esperimento è studiare l'andamento temporale della temperatura di un oggetto che si raffredda e trovare un modello matematico

Dettagli

STUDIO DI SETTORE SM43U

STUDIO DI SETTORE SM43U ALLEGATO 3 NOTA TECNICA E METODOLOGICA STUDIO DI SETTORE SM43U NOTA TECNICA E METODOLOGICA CRITERI PER LA COSTRUZIONE DELLO STUDIO DI SETTORE Di seguito vengono esposti i criteri seguiti per la costruzione

Dettagli

Studente: SANTORO MC. Matricola : 528

Studente: SANTORO MC. Matricola : 528 CORSO di LAUREA in INFORMATICA Corso di CALCOLO NUMERICO a.a. 2004-05 Studente: SANTORO MC. Matricola : 528 PROGETTO PER L ESAME 1. Sviluppare una versione dell algoritmo di Gauss per sistemi con matrice

Dettagli

La struttura dell RNA Struttura dell RNA mediante analisi comparativa Predizione della struttura secondaria: L algoritmo di Nussinov Predizione della

La struttura dell RNA Struttura dell RNA mediante analisi comparativa Predizione della struttura secondaria: L algoritmo di Nussinov Predizione della La struttura dell RNA Struttura dell RNA mediante analisi comparativa Predizione della struttura secondaria: L algoritmo di Nussinov Predizione della struttura secondaria: Minimizzazione dell energia Un

Dettagli

Preprocessamento dei Dati

Preprocessamento dei Dati Preprocessamento dei Dati Raramente i dati sperimentali sono pronti per essere utilizzati immediatamente per le fasi successive del processo di identificazione, a causa di: Offset e disturbi a bassa frequenza

Dettagli

f : A A = f (A) In altre parole f è una funzione che associa a un punto del piano un altro punto del piano e che si può invertire.

f : A A = f (A) In altre parole f è una funzione che associa a un punto del piano un altro punto del piano e che si può invertire. Consideriamo l insieme P dei punti del piano e una f funzione biiettiva da P in P: f : { P P A A = f (A) In altre parole f è una funzione che associa a un punto del piano un altro punto del piano e che

Dettagli

ESTRAZIONE DI RADICE

ESTRAZIONE DI RADICE ESTRAZIONE DI RADICE La radice è l operazione inversa dell elevamento a potenza. L esponente della potenza è l indice della radice che può essere: quadrata (); cubica (); quarta (4); ecc. La base della

Dettagli

ITALIANO - ASCOLTARE E PARLARE

ITALIANO - ASCOLTARE E PARLARE O B I E T T I V I M I N I M I P E R L A S C U O L A P R I M A R I A E S E C O N D A R I A D I P R I M O G R A D O ITALIANO - ASCOLTARE E PARLARE Ascoltare e comprendere semplici consegne operative Comprendere

Dettagli

Modal 2 Modulo Analisi modale Modulo per l Analisi della dinamica strutturale.

Modal 2 Modulo Analisi modale Modulo per l Analisi della dinamica strutturale. Modal 2 Modulo Analisi modale Modulo per l Analisi della dinamica strutturale. L analisi modale è un approccio molto efficace al comportamento dinamico delle strutture, alla verifica di modelli di calcolo

Dettagli

2- Identificazione del processo. (o dei processi) da analizzare. Approcci: Esaustivo. In relazione al problema. Sulla base della rilevanza

2- Identificazione del processo. (o dei processi) da analizzare. Approcci: Esaustivo. In relazione al problema. Sulla base della rilevanza PROCESS MAPPING (2) Approcci: 2- Identificazione del processo Esaustivo (o dei processi) da analizzare Mappatura a largo spettro (es.: vasta implementazione di un ERP) In relazione al problema ad es. i

Dettagli