Analisi di segnali fisiologici mediante reti neurali

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Analisi di segnali fisiologici mediante reti neurali"

Transcript

1 POLITECNICO DI TORINO III Facoltà di Ingegneria Corso di Laurea in Ingegneria Informatica Tesi di Laurea Specialistica Analisi di segnali fisiologici mediante reti neurali Relatori: Prof.ssa Elena Baralis Ing. Tania Cerquitelli Candidato: Piera Gueli Anno accademico

2 II

3 Con immenso amore alla mia famiglia e a Luigi... III

4 IV

5 Sommario Negli ultimi anni, anche in ambito sportivo si sta via via diffondendo l utilizzo di concetti e tecniche di data mining per l analisi di quegli stessi dati, raccolti anche in passato, ma sfruttati solo superficialmente con gli strumenti tradizionali di analisi. Infatti, la maggior parte delle organizzazioni sportive memorizzano informazioni relative ai giocatori, alle squadre e alle gare, che, successivamente, possono essere esaminate mediante tecniche di data mining, con lo scopo sia di effettuare analisi statistica sia di predire risultati futuri. A tal fine, a partire dai dati raccolti, è importante ottenere conoscenza utile in modo che i manager e gli allenatori possano prendere le giuste decisioni per migliorare l allenamento, comprendere la potenzialità dagli avversari e sfruttare al meglio le capacità di ciascun giocatore. Di solito, negli ambienti sportivi, per misurare la resistenza dell atleta, vengono effettuati esami cardiopolmonari, utilizzando test incrementali, con lo scopo di valutare le performance dell atleta. Questa tipologia di test si basa sul sottoporre ciascun atleta ad un carico di lavoro (workload) via via crescente, da cui deriva il nome incrementale. Tale workload è un segnale relativo a ciascun step definito da due parametri: l incremento del carico ad ogni step, indicato con W step e la durata di ogni step, indicata con t step, nel quale il carico rimane costante. Questi due parametri definiscono il protocollo di test, denotato con W step t step, che indica, che ogni t step minuti il workload aumenta di W step Watt. Il protocollo è settato prima di cominciare il test e rimane costante per tutta la durata dello stesso. Ciascun atleta è caratterizzato dai dati fattuali, quali età, BMI (indice di massa corporea), BSA (area di superficie corporea), che rappresentano le sue caratteristiche antropomorfiche, e dai dati dinamici, che includono diversi segnali fisiologici campionati durante il test. Tali segnali fisiologici descrivono le funzioni respiratorie dell atleta e vengono monitorati per analizzare la reazione del corpo dell atleta allo sforzo crescente. Il problema di questa tipologia di test è che viene richiesto un grande sforzo fisico all atleta, per cui potrebbe verificarsi anche un sovraccarico cardiopolmonare, con conseguenze sulla V

6 salute dell atleta. Il più alto valore di workload raggiunto nell ultima fase del test rappresenta il massimo carico di lavoro sotto al quale l atleta è in grado di lavorare. Tale valore, indicato con W peak, è un informazione fondamentale per gli allenatori per pianificare le sessioni di allenamento di ciascun atleta, poiché corrisponde al migliore adeguamento cardiopolmonare, in termini di ritmo cardiaco e ventilazione per l individuo monitorato. Lo scopo di questa tesi di laurea specialistica è stato quello di individuare un approccio, che a partire dai dati raccolti durante i test incrementali, fosse in grado di predire il valore di W peak raggiunto fin dai primi step del test incrementale. L approccio utilizzato analizza sia la risposta del corpo dell atleta, mediante i dati fisiologici monitorati sia le caratteristiche dell atleta mediante i dati fattuali, e predice il valore di W peak, in modo da permettere l interruzione prematura del test, evitando così la sua intera esecuzione e quindi limitando al minimo lo sforzo dell atleta e minimizzando il rischio di sovraccarico cardiopolmonare. Per analizzare i dati fisici e fisiologici degli atleti, predire e classificare le loro performance è stata utilizzata come tecnica di analisi quella delle reti neurali (ANN). In particolare è stata utilizzata l implementazione disponibile in uno dei maggiori tool open source del data mining, RapidMiner. Inoltre, i risultati ottenuti sono stati confrontati con quelli prodotti da una tecnica di classificazione istance-based, nota come K-Nearest Neighbor (K-NN). Le reti neurali, ispirate alla struttura del cervello umano, sono costituite da nodi, unità di elaborazione che simulano il comportamento dei neuroni, collegati mediante archi, ciascuno avente il proprio peso. In particolare, nelle reti neurali sono presenti tre tipi di nodi: nodi d input, uno o più livelli di nodi nascosti e nodi d output. Ciascun livello è connesso con quello immediatamente successivo, per cui i valori prodotti ad un livello costituiscono l input di quello successivo. Infatti, tramite il livello d input la rete neurale riceve i dati d ingresso, che vengono passati ai nodi dei livelli nascosti, elaborati in base al valore dei pesi su ciascun arco, facendo uso di una funzione di attivazione e infine passati al livello d output per essere trasmessi in uscita. Esistono varie funzioni di attivazione, tra cui la sigmoide, che è stata usata anche nel modello di rete neurale del presente lavoro. L obiettivo della mia tesi è stato quello di consentire fin dai primi minuti la predizione del massimo valore di carico di lavoro che un atleta sia in grado di eseguire, limitando l errore di predizione. Tale errore è utilizzato per valutare le prestazioni della rete neurale ed è definito, per ciascun test, come la differenza tra il valore predetto di W peak e quello reale. In realtà si tiene conto del valore assoluto di tale differenza, che è appunto chiamato VI

7 errore di predizione assoluto. Per valutare l errore di predizione è stata usata la leave-oneout cross-valitation, per cui ogni volta che viene incrementato il workload, è selezionato il sottoinsieme di atleti che stanno ancora eseguendo il test e un record per volta viene usato come test set e i rimanenti come training set. Una volta effettuata la predizione per tutti gli atleti del dataset e avendo ottenuto, così, gli errori di predizione di ciascun atleta è possibile misurare il Mean Absolute Error, al tempo t p come media di tutti gli errori di predizione assoluti calcolati per tutti i test. Sono stati eseguiti vari esperimenti, utilizzando due insiemi di test incrementali raccolti dal CSA Sport Training Test Center, usando due protocolli comuni per testare la resistenza degli atleti: 25 2 e 5 2. Ciascun record appartenente ai due dataset D 25 2 e D 5 2 è costituito sia dai dati fattuali sia da quelli dinamici, che sono stati forniti alla rete neurale usando due approcci: nel primo si utilizza un indice, creato da studenti laureatesi precedentemente, chiamato CardioPulmonary Efficient Index(CPE), che riassume la risposta polmonare e cardiaca all esercizio dell atleta, mentre nel secondo approccio sono stati considerati direttamente i campioni dei segnali fisiologici monitorati durante ciascuno step del test. Per entrambi gli approcci è fondamentale che si tenga conto di tutta la storia passata di quell atleta. Negli esperimenti basati sul CPE, la storicità delle informazioni è mantenuta proprio in esso, poiché per sua costruzione si tiene conto dei dati fisiologici ottenuti fino ad un certo istante, mentre negli esperimenti in cui non si utilizza il CPE ad ogni step si tiene conto anche dei campioni relativi ai dati fisiologici, non solo dello step corrente ma di tutti quelli precedenti. Dunque, la sezione sperimentale è divisa in due parti: nella prima parte sono analizzati gli esperimenti, i cui dati dinamici degli atleti sono rappresentati per mezzo del CPE, nell altra gli esperimenti in cui si utilizzano direttamente dei campioni di segnali fisiologici. Inoltre, dato che i dataset utilizzati presentano atleti con caratteristiche eterogenee e con capacità sportive diverse, si è pensato di effettuare una segmentazione, separando gli atleti in due categorie, ciascuna contenente individui con valori di W peak vicini tra di loro, per poi rieseguire la classificazione degli atleti mediante la stessa rete neurale, con lo scopo di confrontare i risultati con quelli precedentemente ottenuti. Inizialmente, sono stati eseguiti degli esperimenti con entrambi i dataset con lo scopo di trovare la giusta configurazione dei parametri da utilizzare nella rete neurale. Una volta scelti i parametri, è stato possibile effettuare gli esperimenti di nostro interesse. Per quanto riguarda gli esperimenti con il CPE, è emerso che per entrambi i dataset se si effettuata la segmentazione prima della classificazione si ottengono risultati migliori, poichè è possibile interrompere prematuramente il test, con un errore di predizione limitato VII

8 ad un solo step. Inoltre, confrontando i risultati della rete neurale, fornendo come input i dataset con e senza segmentazione, con quelli ottenuti mediante l utilizzo di una tecnica istance-based, nota come K-Nearest Neighbor (K-NN), si osserva che per il dataset D 25 2 nei primi step le prestazioni migliori sono offerte dal K-Nearest Neighbor (K-NN), ma andando avanti nell esecuzione del test la predizione con la rete neurale è più accurata. Per quanto riguarda il dataset D 5 2, nonostante con il K-NN si ottengano buoni risultati, l errore di predizione commesso con la rete neurale è nettamente inferiore rispetto a quello ottenuto usando il K-NN, per cui anche con questo dataset la rete neurale è più accurata. Per quanto concerne gli esperimenti senza CPE, si è scelto di utilizzare prima due campioni dei segnali fisiologici, poi tre, cinque e infine sette. Dai risultati ottenuti si evince che sia per il D 25 2 sia per D 5 2, al crescere del numero di campioni usati, decresce la quantità dell errore di predizione commesso. Inoltre, confrontando tali risultati con quelli ottenuti effettuando prima la segmentazione e poi la classificazione, si osserva che, com era prevedibile, per tutta la durata del test l errore di predizione degli esperimenti con segmentazione assume valori inferiori rispetto a quelli senza. I risultati ottenuti con la rete neurale, dando come input i campioni di segnali fisiologici, sono stati confrontati con quelli ottenuti facendo uso del K-NN, fornendo come input per ciascun step diversi valori di CPE. Dall analisi dei risultati sperimentali, si osserva che all aumentare del numero di CPE utilizzati per il D 5 2 migliora la predizione del sistema, in quanto decresce l errore commesso nella predizione, mentre per il D 25 2 non c è nessun miglioramento. Infine, confrontando i risultati della rete neurale usando i dati fisiologici e il CPE, si evince che per il D 25 2 sia per fascia di atleti, aventi lo stesso W peak, che nel totale, va meglio la predizione senza l uso del CPE, mentre per il D 5 2 si osserva che per classi di atleti, con lo stesso W peak, non esiste molta differenza tra l errore di predizione ottenuto usando i dati fisiologici e il CPE. L approccio proposto in questo lavoro di tesi si è dimostrato capace di predire il valore di W peak, con un limitato errore di predizione, per cui è possibile ridurre la durata del test proteggendo l atleta da un eventuale sovraccarico cardiopolmonare. Inoltre, riducendo la durata del test, si aumenta il numero di test eseguibili giornalmente. Dati i buoni risultati ottenuti, il presente approccio potrebbe essere sfruttato anche in ambito clinico per analizzare sia le funzioni del cuore dei pazienti affetti da malattie cardiache croniche che le funzionalità dei soggetti con patologie polmonari croniche. Inoltre, l approccio di predizione presentato può essere riutilizzato per costruire un predittore per i parametri fisiologici fondamentali per l allenamento. VIII

9 IX

10 Indice Sommario V 1 Introduzione 1 2 Reti neurali Data mining Data Mining Task Clustering Regole di associazione Classificazione Reti neurali Percettrone Reti neurali multi-livello Algoritmo di apprendimento ANN Costruzione rete multi-livello supervisionata Punti di forza e punti di debolezza delle reti neurali K-Nearest Neighbor Classification Regressione Descrizione dell approccio usato RapidMiner Introduzione Caratteristiche principali Manipolazione dei dati e metadati Operatori per il Data mining Estendibilità di RapidMiner Diversi modi di usare RapidMiner X

11 3.7 Net Neural e Apply Model Operatore Net Neural Parametri Apply Model operator Processo apprendimento Test protocol Dataset Dati fattuali Dati dinamici CardioPulmonary efficient Index (CPE) Pre-processamento dei dati Predizione del valore di W peak Leave-one-out Analisi esperimenti con CPE Errore di predizione Dataset usati Risultati classificazione Configurazione: training cycles = 5, learning rate =.3, momentum =.2, hidden layer = Configurazione: training cycles = 5, learning rate =.3, momentum =.2, hidden layer = Configurazione: training cycles = 5, learning rate =.2, momentum =.3, hidden layer = Configurazione: training cycles = 5, learning rate =.2, momentum =.3, hidden layer = Configurazione: training cycles = 5, learning rate =.4, momentum =.2, hidden layer = Esperimenti con diversi valori di training cycles Conclusioni Segmentazione Confronto con il K-NN Regressione XI

12 6 Analisi esperimenti con i campioni dei segnali fisiologici Campionamento segnali fisiologici Risultati Classificazione Esperimenti con due campioni di segnali fisiologici Esperimenti con tre campioni di segnali fisiologici Esperimenti con cinque campioni di segnali fisiologici Esperimenti con sette campioni di segnali fisiologici Conclusioni Segmentazione Dataset D Dataset D Confronto con il K-NN con più valori di CPE Confronto e conclusioni risultati rete con CPE e con i campioni dei segnali fisiologici Confronto e conclusioni risultati dataset segmentato con CPE e con i campioni dei segnali fisiologici Conclusioni e sviluppi futuri Conclusioni Risultati sperimentali Sviluppi futuri Bibliografia 17 XII

13 Elenco delle tabelle 2.1 Esempio di matrice di confusione Segnali fisiologici monitorati Caratteristiche del dataset D Caratteristiche del dataset D XIII

14 Elenco delle figure 2.1 Knowledge discovery in databases Clustering Esempio di regole di associazione Reti neurali biologica e Rete Neurale artificiale Esempio di percettrone Esempio di rete neurale artificiale multilayer feed-forward Tipi di funzioni di attivazioni nelle reti neurali: segno(a), lineare(b), sigmoide(c), tanh(d) Net Neural e Apply Model operator Sintesi dei dati dinamici collezionati durante il test Esempio di andamento di CPE[t] e CPE peaks [t] Processo Net Neural Esempio di modello di Net Neural Risultati configurazione default di D Risultati configurazione default di D Risultati del dataset D 25 2 con la seguente configurazione: training cycles = 5, learning rate =.3, momentum =.2, hidden layer = Risultati del dataset D 5 2 con la seguente configurazione: training cycles = 5, learning rate =.3, momentum =.2, hidden layer = Risultati del dataset D 25 2 con la seguente configurazione: training cycles = 5, learning rate =.2, momentum =.3, hidden layer = Risultati del dataset D 5 2 con la seguente configurazione: training cycles = 5, learning rate =.2, momentum =.3, hidden layer = Risultati del dataset D 25 2 con la seguente configurazione: training cycles = 5, learning rate =.2, momentum =.3, hidden layer = XIV

15 5.8 Risultati del dataset D 5 2 con la seguente configurazione: training cycles = 5, learning rate =.2, momentum =.3, hidden layer = Risultati del dataset D 25 2 con la seguente configurazione: training cycles = 5, learning rate =.4, momentum =.2, hidden layer = Risultati del dataset D 5 2 con la seguente configurazione: training cycles = 5, learning rate =.4, momentum =.2, hidden layer = Risultati del D 25 2 con segmentazione con frontiera = 3W (Categoria A (b), Categoria B (a) ) Confronto risultati esperimenti del dataset D 25 2 segmentato e non Risultati del D 5 2 con segmentazione con frontiera = 35W (Categoria A (b), Categoria B (a)) Confronto risultati esperimenti del dataset D 5 2 segmentato e non MAE con K-NN del dataset D Confronto dell andamento del MAE relativo al D 25 2 con un classificatore K-NN : a) totale b) suddiviso per fasce di W peak MAE con K-NN del dataset D Confronto dell andamento del MAE relativo al D 5 2 con un classificatore K-NN : a) totale b) suddiviso per fasce di W peak MAE ottenuto mediante l utilizzo della tecnica di K-NN sul dataset D 25 2 con segmentazione, frontiera = 3W (Categoria A (a), Categoria B (b)) Confronto dell andamento del MAE relativo al D 25 2 segmentato con un classificatore K-NN MAE ottenuto mediante l utilizzo della tecnica di K-NN sul dataset D 25 2 con segmentazione, frontiera = 35W (Categoria A (a), Categoria B (b)) Confronto dell andamento del MAE relativo al D 5 2 segmentato con un classificatore K-NN MAE del dataset D 25 2 mediante l utilizzo della tecnica di regressione Risultati esperimenti con 2 campioni di segnali fisiologici del dataset D Risultati esperimenti con 2 campioni di segnali fisiologici del dataset D Risultati esperimenti con 3 campioni di segnali fisiologici del dataset D Risultati esperimenti con 3 campioni di segnali fisiologici del dataset D Risultati esperimenti con 5 campioni di segnali fisiologici del dataset D Risultati esperimenti con 5 campioni di segnali fisiologici del dataset D Risultati esperimenti con 7 campioni di segnali fisiologici del dataset D Risultati esperimenti con 7 campioni di segnali fisiologici del dataset D XV

16 6.9 Risultati esperimenti con segmentazione del dataset D 25 2 a) Categoria B, b) Categoria A Confronto risultati esperimenti del dataset D 25 2 segmentato e non Risultati esperimenti con segmentazione del dataset D Confronto risultati esperimenti del dataset D 5 2 segmentato e non Risultati KNN del dataset D 5 2 con più valori di CPE: a) 2 valori di CPE, b) 7 valori di CPE Confronto risultati esperimenti del dataset D 25 2 con e senza CPE: a) totale, b)per fasce di atleti Confronto risultati esperimenti del dataset D 5 2 con e senza CPE: a) totale, b)per fasce di atleti Confronto risultati esperimenti del dataset D 25 2 segmentato con e senza CPE: a) totale, b)per fasce di atleti Confronto risultati esperimenti del dataset D 5 2 segmentato con e senza CPE: a) totale, b)per fasce di atleti XVI

17 Capitolo 1 Introduzione Il data mining è una disciplina che ha come obiettivo l estrazione di conoscenza e informazione utile da grandi volumi di dati. I continui progressi tecnologici delle tecniche di raccolta e memorizzazione dei dati, hanno permesso alle organizzazioni di accumulare enormi quantità di dati, in grandi basi di dati, chiamati data warehouse. Di conseguenza, l interesse verso il data mining è aumentato in maniera significativa sia in ambito aziendale sia in tante discipline scientifiche. Infatti, questa enorme quantità di dati è difficilmente gestibile utilizzando solamente le tecniche classiche di analisi, mentre il data mining combina tecniche tradizionali della statistica, quali campionamento, stima, testing, con algoritmi sofisticati di ricerca, riconoscimento di pattern, tecniche di modellazione e teorie di apprendimento dell intelligenza artificiale, con l obiettivo di processare enormi volumi di dati, estraendo informazioni implicite, non banali e non note in precedenza. Il data mining trova applicazioni in tutti quei settori in cui è disponibile una grande quantità di dati, che necessita di essere analizzata. Infatti, la scoperta di pattern sconosciuti e la predizione di nuovi andamenti, che sono alcuni degli aspetti salienti di questa disciplina, hanno attratto una grande attenzione in moltissimi ambiti, quali ad esempio la gestione aziendale, il controllo di produzione, la progettazione ingegneristica, il text mining, la bioinfomatica. Anche in ambito sportivo si sta via via diffondendo l utilizzo di concetti e tecniche di data mining per l analisi di quegli stessi dati, raccolti anche in passato, ma sfruttati solo superficialmente con gli strumenti tradizionali di analisi. Infatti, la maggior parte delle organizzazioni sportive memorizzano informazioni relative ai giocatori, alle squadre e alle gare, che, successivamente, possono essere esaminate mediante tecniche di data mining, 1

18 1 Introduzione con lo scopo sia di effettuare analisi statistica sia di predire risultati futuri. A tal fine, a partire dai dati raccolti, è importante ottenere conoscenza utile in modo che i manager e gli allenatori possano prendere le giuste decisioni per migliorare l allenamento, comprendere la potenzialità dagli avversari e sfruttare al meglio le capacità di ciascun giocatore. Di solito, negli ambienti sportivi, per misurare la resistenza dell atleta, vengono effettuati esami cardiopolmonari, utilizzando test incrementali, con lo scopo di valutare le performance dell atleta [9]. Questa tipologia di test si basa sul sottoporre ciascun atleta ad un carico di lavoro (workload) via via crescente, da cui deriva il nome incrementale. Durante l esecuzione del test, vengono rilevati diversi segnali fisiologici, che descrivono le funzioni respiratorie dell atleta e vengono monitorati per analizzare la reazione del corpo dell atleta allo sforzo crescente. Il problema di questa tipologia di test è che viene richiesto un grande sforzo fisico all atleta, per cui potrebbe verificarsi anche un sovraccarico cardiopolmonare, con conseguenze sulla salute dell atleta. Il più alto valore di wokload raggiunto nell ultima fase del test rappresenta il massimo carico di lavoro sotto al quale l atleta è in grado di lavorare. Tale valore, indicato con W peak, è un informazione fondamentale per gli allenatori per pianificare le sessioni di allenamento di ciascun atleta, poiché è un significativo indicatore della potenza aerobica dell atleta. Lo scopo di questa tesi di laurea specialistica è stato quello di individuare un approccio, che a partire dai dati raccolti durante i test incrementali, fosse in grado di predire il valore di W peak raggiunto. L approccio utilizzato analizza sia la risposta del corpo dell atleta, mediante i dati fisiologici monitorati sia le caratteristiche dell atleta mediante i dati fattuali, e predice il valore di W peak, in modo da permettere l interruzione prematura del test, evitando così la sua intera esecuzione e quindi limitando al minimo lo sforzo dell atleta e minimizzando il rischio di sovraccarico cardiopolmonare. Per effettuare la predizione è stata utilizzata una delle tecniche predittive di data mining: la classificazione, che si basa sulla generazione di un modello, che rappresenti nel miglior modo possibile la relazione tra l insieme degli attributi indipendenti dei record e l attributo target, chiamato etichetta di classe, in modo da predirne correttamente il valore per quei record, la cui etichetta di classe è sconosciuta. Esistono varie tecniche per la classificazione, quali alberi di decisione, reti neurali, modelli istance-based, reti di bayes, support vector machine ecc., ciascuna avente caratteristiche più adatte ad un contesto rispetto ad un altro. Nel presente lavoro, per analizzare i dati fisici e fisiologici degli atleti, predire e classificare le loro performance è stata utilizzata come tecnica di analisi le reti neurali (ANN)[11]. In particolare è stata utilizzata l implementazione disponibile in uno 2

19 dei maggiori tool open source del data mining, RapidMiner [1]. Inoltre, i risultati ottenuti sono stati confrontati con quelli prodotti da una tecnica di classificazione istance-based, nota come K-Nearest Neighbor (K-NN). Le reti neurali, ispirate alla struttura del cervello umano, sono costituite da nodi, unità di elaborazione che simulano il comportamento dei neuroni, collegati mediante archi, ciascuno avente il proprio peso. In particolare, nelle reti neurali sono presenti tre tipi di nodi: nodi d input, uno o più livelli di nodi nascosti e nodi d output. Ciascun livello è connesso con quello immediatamente successivo, per cui i valori prodotti ad un livello costituiscono l input di quello successivo. Infatti, tramite il livello d input la rete neurale riceve i dati d ingresso, che vengono passati ai nodi dei livelli nascosti, elaborati in base al valore dei pesi su ciascun arco, facendo uso di una funzione di attivazione e infine passati al livello d output per essere trasmessi in uscita. Esistono varie funzioni di attivazione, come ad esempio la funzione segno, la funzione lineare, la tangente iperbolica e la sigmoide, che è stata usata anche nel modello di rete neurale del presente lavoro. L obiettivo della rete neurale è quello di trovare una corretta configurazione dei pesi, in modo da minimizzare la somma totale degli errori quadratici relativi al valore di uscita. Per costruire una rete neurale multilivello inizialmente viene fatta un assegnazione con valori casuali dei pesi, poi per ciascuna istanza del training set si propaga il valore fino ad ottenerne l output, lo si confronta con quello atteso, si calcola l errore e infine si applica l algoritmo di backpropagation per propagare all indietro l errore e così ricalcolare i pesi. Il processo di apprendimento va avanti fino a quando si raggiunge la soglia di accuratezza stabilita oppure si ottiene un valore di errore al di sotto della soglia stabilita oppure si raggiunge il numero massimo di epoche stabilite. In questo lavoro sono stati seguiti due approcci: 1. fornendo i dati antropomorfici e dei campioni dei segnali fisiologici; 2. riutilizzando una nuova misura, realizzata da altri studenti laureatesi precedentemente, chiamata CardioPulmonary Efficiency Index (CPE) [3], che riassume sia la risposta polmonare all esercizio che quella cardiaca, insieme sempre ai dati antropomorfici. L obiettivo della mia tesi è stato quello di consentire fin dai primi minuti la predizione del massimo valore di carico di lavoro che un atleta sia in grado di eseguire, limitando l errore di predizione. Questo approccio presenta i seguenti vantaggi: 3

20 1 Introduzione minore stress del corpo dell atleta: l approccio presentato potrebbe ridurre la durata del test, limitando, così, lo stress a cui è sottoposto il corpo dell atleta e proteggendolo da un eventuale sovraccarico cardiopolmonare. minor costo dei test: per valutare le funzionalità respiratorie degli atleti vengono monitorati i segnali durante il test e successivamente viene utilizzato un analizzatore di gas per effettuare le analisi chimiche sui dati raccolti. Se si riesce a ridurre la durata del test, si riduce anche la quantità di analizzatore di gas necessario, diminuendo, così, i costi del test. uso efficiente dell attrezzatura del test: i test con durata maggiore limitano il numero di test che possono essere effettuati usando la stessa attrezzatura nello stesso giorno, per cui riducendo la durata del test, si aumenta il numero di test eseguibili giornalmente e di conseguenza si riesce a ottimizzare la gestione dell attrezzatura. Il resto del presente documento è organizzato nel modo che segue. Il capitolo 2 fornisce una panoramica sulle principali tecniche di data mining, ponendo maggiore attenzione alla descrizione delle reti neurali e successivamente introduce le caratteristiche dell approccio realizzato. Il capitolo 3 descrive le caratteristiche generali di RapidMiner e il processo generato mediante questo software per la realizzazione delle reti neurali. Una descrizione dettagliata dell approccio realizzato viene fornita nel capitolo 4. Il capitolo 5 fornisce un analisi approfondita dei risultati ottenuti con l utilizzo della rete neurale, fornendo in input anche il CPE, mentre nel capitolo 6 vengono analizzati i risultati ottenuti quando in input si hanno campioni di segnali fisiologici. Le conclusioni e gli sviluppi futuri sono sottolineati nel capitolo 7. 4

21 Capitolo 2 Reti neurali 2.1 Data mining Il data mining è una disciplina che ha come obiettivo l estrazione automatica di informazione utile da grandi volumi di dati. Infatti combina tecniche classiche della statistica, quali campionamento, stima, testing, con algoritmi di ricerca, tecniche di modellazione e teorie di apprendimento dell intelligenza artificiale, riconoscimento di pattern e apprendimento automatico, per ottenere informazioni implicite, non banali e sconosciute in precedenza. Il data mining, inoltre, adotta varie idee da differenti aree, quali l ottimizzazione, la teoria dell informazione, il processamento e la visualizzazione dei segnali, e utilizza contributi provenienti da altre aree, quali i sistemi di database, che mettono a disposizioni efficienti meccanismi di memorizzazione, di indicizzazione e di interrogazione, il calcolo parallelo, per velocizzare le operazioni sui grandi dataset, e tecniche distribuite che sono essenziali quando i dati non possono essere mantenuti in un unica locazione. Il data mining è una parte dell intero processo di analisi dei dati, chiamato Knowledge discovery in databases (KDD), che a partire dai dati grezzi estrae pattern potenzialmente utili [5]. Tale processo, come è illustrato nella figura 2.1, consiste in diversi fasi: selection: selezione dei dati realmente utili tra tutti quelli presenti nel database e/o data warehouse; preprocessing-trasformation: trasformazione dei dati grezzi in un formato appropriato per l analisi, unendo dati provenienti da molteplici sorgenti, pulendo dati per rimuovere i duplicati e il rumore e selezionando solo i record e i relativi attributi che sono rilevanti per la fase di data mining; 5

22 2 Reti neurali data mining: applicazione di una delle possibili tecniche per individuare regolarità nei dati, ottenendo così dei pattern, correlazioni tra i dati; interpretation/evaluation: interpretazione corretta delle correlazioni ottenute al passo precedente ed eventualmente integrazione di tali pattern in un sistema di supporto di decisione. A volte prima delle integrazioni è richiesta una fase di post-processing che assicura che vengano considerati solo i risultati utili e validi. [11] Figura 2.1. Knowledge discovery in databases 2.2 Data Mining Task Le attività di data mining sono generalmente divise in due categorie: predittive: hanno lo scopo di predire il valore di un particolare attributo, chiamato target o variabile dipendente, basandosi sui valori degli altri attributi, noti come explanatory o variabili indipendenti; descrittive: hanno l obiettivo di ricavare pattern (correlazioni) che riassumano le relazioni tra i dati. Spesso, tali attività sono esplorative, per cui necessitano di una fase di post-processing per validare i risultati. Esistono diverse tecniche per ciascuna delle categorie sopra elencate. In particolare classificazione, regressione e deviation detection sono tecniche predittive, mentre l estrazione di regole di associazioni, scoperta di pattern sequenziali e clustering sono tecniche descrittive [6]. Di seguito riportiamo una breve descrizione della tecnica di clustering e delle regole di associazione, mentre la classificazione e la regressione saranno trattate nel paragrafo seguente. 6

23 2.2 Data Mining Task Clustering Il clustering è una tecnica descrittiva, che si occupa di raggruppare oggetti che sono simili in un unico cluster e oggetti dissimili in cluster diversi. Il clustering è una tecnica di classificazione non supervisionata, per cui a differenza della classificazione, il dataset non presenta un attributo di cui si vuole predire il valore, ma ha come obiettivo quello di segmentare l intero dataset in sottogruppi relativamente omogenei o cluster, dove, come mostra la figura 2.2, è massimizzata la similarità dei record dentro il cluster e minimizzata la similarità dei record appartenenti a cluster diversi. Dunque, il clustering è un insieme di cluster. [11] Figura 2.2. Clustering Esistono due categorie di algoritmo di clustering: clustering partizionale: realizza una suddivisione dei dati in cluster non sovrapposti, per cui ciascun elemento del dataset appartiene esclusivamente ad un sottoinsieme(un esempio di clustering partizionale è K-Means); clustering gerarchico: suddivide i record dei dataset in un insieme di cluster annidati, organizzati come un albero gerarchico. In base alla categoria di clustering usata, si ottengono tipi di cluster diversi: wellseparated, center-based, contiguous, density-based, ecc.. Con il passare del tempo il clustering ha trovato applicazione in varie aree, quali ad esempio biologia, medicina, ricerca di mercato. 7

24 2 Reti neurali Regole di associazione La tecnica delle regole di associazione è una tecnica descrittiva e ha come obiettivo l estrazione delle correlazioni frequenti o pattern nei database transazionali. Le regole di associazione vengono espresse nella forma A,B C dove A,B è il corpo della regola e C è la testa della regola. Queste regole vanno intese come co-occorenza e non causalità. Data la natura probabilistica delle regole, vengono usate due misure, supporto e confidenza, per permettere la valutazione di pattern frequenti e ricavare, così, le regole corrette. Infatti, dato un insieme di transazioni, l algoritmo di estrazione delle regole di associazione estrae le regole, il cui supporto e la confidenza superino i rispettivi valori di soglia definiti. Il supporto è il rapporto tra il numero di transazioni che includono sia il corpo che la testa della regola e il numero totale di transazioni, la confidenza è la probabilità condizionata di trovare la testa della regola avendo trovato il relativo corpo [11]. Esistono numerosi algoritmi per la generazione delle regole, ma alcuni tra questi, come Apriori, FP-Growth ecc, si occupano di estrarre gli itemset frequenti, per cui sarà, poi, necessario un ulteriore step per l estrazione delle regole. Figura 2.3. Esempio di regole di associazione La tecnica delle regole di associazione è ampiamente utilizzata nella cosiddetta market basket analysis, per trovare regolarità nelle abitudini di acquisto nei clienti dei negozi, ma può essere applicata anche in numerosi altri campi, come diagnosi mediche, scoperta di frodi fiscali, ecc. 2.3 Classificazione La classificazione è una tecnica di apprendimento automatico supervisionata, che genera un modello per rappresentare nel miglior modo possibile la relazione tra l insieme degli 8

25 2.3 Classificazione attributi indipendenti dei record e l attributo target, chiamato etichetta di classe, in modo da predirne correttamente il valore per quei record che non sono stati ancora classificati. Dunque per la costruzione del modello è indispensabile la presenza del training set, che è l insieme dei record, ciascuno caratterizzato da una lista di attributi e dall etichetta di classe, un attributo discreto conosciuto a priori, mentre per valutarne le prestazioni si utilizza un insieme dei dati, chiamato test set, di cui si vuole predire il valore dell etichetta di classe di ciascun elemento, poichè non è conosciuto a priori. Essenzialmente la classificazione è una tecnica predittiva, che consiste nel dividere gli elementi del dataset, in modo che ad ognuno di essi venga assegnata una tra le tante categorie mutuamente esaustive ed esclusive, chiamate classi. Naturalmente prima di usare il classificatore realizzato è buona norma stimare le sue performance, calcolando il numero di record predetti correttamente e non. Questi valori vengono tabulati nella matrice di confusione, che, come è possibile osservare dall esempio mostrato in figura 2.1, contiene tante righe e tante colonne quante sono le etichette di classe e ciascuna entry f ij rappresenta il numero di record della classe i predetti come record della classe j. Predicted Class Class = 1 Class = Actual Class Class = 1 f 11 f 1 Class = f 1 f Tabella 2.1. Esempio di matrice di confusione Sebbene la matrice di confusione dia molte informazioni per valutare il lavoro svolto dal classificatore, si preferisce utilizzare un unica misura, che riassuma le informazioni contenute nella matrice di confusione in un unico numero, chiamato accuratezza, che è definita nel seguente modo: accuratezza = f 11 + f numero di predizioni corrette = f 11 + f 1 + f 1 + f numero di predizioni Esistono varie tecniche per la classificazione, quali ad esempio alberi di decisione, reti neurali, modelli istance-based, reti di bayes, support vector machine. Infatti non esiste un singolo classificatore che lavora bene con tutti i tipi di problemi, poiché ciascuna tecnica di classificazione è caratterizzata dai propri punti di forza e di debolezza, valutati in base all accuratezza della predizione, all efficienza, alla scalabilità, alla robustezza, alla comprensibilità e alla compatezza del modello. 9

26 2 Reti neurali I problemi di classificazione si presentano in molte applicazioni di data mining, quali ad esempio medicina, geostatica, identificazione biometrica, classificazione dei documenti, riconoscimento pattern, credit scoring. 2.4 Reti neurali Le reti neurali artificiali, abbreviati come ANN, sono un modello matematico/informatico di calcolo, che simulano il comportamento delle reti neurali biologiche. Queste sono costituite dall interconnessione di unità elementari, i neuroni, per mezzo di fili chiamati assoni, che si occupano di trasmettere l impulso elettrico ricevuto da un neurone ad un altro. Ciascun neurone è connesso agli assoni degli altri neuroni per mezzo delle estensioni del suo corpo chiamato denditri, il cui punto di contatto con un assone è chiamato sinapsi. I neurologi hanno scoperto che in base all energia delle sinapsi nella connessione tra neuroni il cervello apprende in maniera diversa lo stesso segnale d input ricevuto. In maniera del tutto analoga le reti neurali sono costituite da un insieme di unità (nodi) collegate ad altre unità per mezzo di collegamenti diretti (archi), in modo che in presenza di uno stimolo (input) proveniente dalle unità antecedenti ad essa, si attivino e inviino il segnale alle unità collegate. Anche nelle reti neurali artificiali, i collegamenti hanno la capacità di attenuare il segnale, in modo che questo viaggi secondo percorsi diversi e/o non raggiunga tutti i nodi dei livelli successi, per cui è possibile modificare l energia, più opportunamente chiamato peso, dei collegamenti per ottenere apprendimenti differenti. 1

27 2.4 Reti neurali Figura 2.4. Reti neurali biologica e Rete Neurale artificiale 11

28 2 Reti neurali Percettrone Il modello più semplice di rete neurale artificiale è il percettrone, introdotto nel 1958 da Rosenblatt [13]. Esso, come mostra l esempio in figura 2.5, consiste in due tipi di nodi, quelli di input e quelli di output, interconnessi per mezzo di collegamenti pesati, usati per emulare l energia che è presente nelle sinapsi che collegano i neuroni. Il valore di output viene calcolato come funzione segno della somma pesata degli input, a cui verrà sottratto il valore soglia, in formula: ŷ = sign(w d x d + w d-1 x d-1 + w d-2 x d w 2 x 2 + w 1 x 1 - t) dove w 1,w 2,...,w d sono i pesi dei link di input, x 1,x 2,...,x d sono i valori degli attributi in ingresso e sign agisce da funzione di attivazione. Figura 2.5. Esempio di percettrone Dunque, l output assume valore pari a +1, se l argomento della funzione di attivazione è positivo, o in caso contrario valore pari a -1. In maniera più compatta l output può essere espresso come: ŷ = sign(w x) dove w = t, x = 1, x rappresenta il vettore degli input, w il vettore dei pesi. Inoltre, durante la fase di apprendimento di un modello con percettrone, il vettore w dei pesi viene modificato fino a quando l output ottenuto diventa consistente con l effettivo valore di output dell insieme dei record usati come training set. 12

29 2.4 Reti neurali Il percettrone è un modello lineare nei suoi parametri w e x, per cui converge ad una soluzione ottimale solo per i problemi in cui è possibile realizzare una classificazione lineare: in particolare, Minsky e Papert [4] mostrarono che il percettrone non era in grado di apprendere nemmeno l elementare funzione logica XOR. Dato che nella realtà è difficilissimo trovare istanze di training che sono separabili perfettamente si utilizzano le reti neurali multi-livello, la cui struttura è molto più complessa del percettrone Reti neurali multi-livello Le reti neurali multi-livello (MLP), come mostrato in figura 2.6, sono costituite da tre livelli di nodi: Figura 2.6. Esempio di rete neurale artificiale multilayer feed-forward livello d input, che rappresenta il primo strato ed è in contatto diretto con i dati in ingresso; livello nascosto (hidden), che rappresenta lo strato intermedio, non ha contatti diretti con l esterno, ma riceve i dati dai nodi di input o dal livello hidden precedente e li trasmette, dopo averli opportunamente modificati, al livello hidden successivo o a quello di uscita; output layer, che rappresenta lo strato d uscita, riceve i dati dai nodi del livello hidden e li trasmette in uscita. 13

30 2 Reti neurali Nelle reti recurrent possono esserci collegamenti tra nodi dello stesso livello o tra nodi di un livello e di quello dei livelli precedenti, mentre nelle reti neurali feed-forward [11], come mostrato in figura 2.6, i nodi di un livello sono connessi solo con i nodi del livello successivo. In quest ultimo tipo di reti neurali i singoli livelli di nodi sono dei percettori, con eccezione dei nodi di output, che eseguono operazioni molto più complicate di quelle fatte di solito dai percettori. Inoltre, la ANN usa come funzione di attivazione, non solo la funzione sign usata nei percettori, ma anche altre funzioni, come quella lineare, la sigmoide e la tangente iperbolica, permettendo così ai nodi appartenenti al hidden layer e a quelli appartenenti all output di produrre valori di uscita che siano non lineari rispetto ai parametri di input. Nella figura 2.7 sono mostrate le tipiche funzioni di attivazioni della rete neurale. (a) (b) (c) (d) Figura 2.7. Tipi di funzioni di attivazioni nelle reti neurali: segno(a), lineare(b), sigmoide(c), tanh(d) Un altro aspetto altrettanto importante nelle reti neurali è rappresentato dai pesi che vengono attribuiti agli archi che collegano i vari nodi, per cui è necessario un efficiente 14

31 2.4 Reti neurali algoritmo che converga alla corretta configurazione dei pesi quando viene fornita una certa quantità di dati per il training. In base all algoritmo utilizzato è possibili identificare tre tipi di MLP [8]: 1. MLP con pesi fissati: di fatto, non contemplano una fase di apprendimento, ma i pesi vengono determinati sulla base di informazioni a priori. Questo approccio è davvero poco usato, perché presuppone una conoscenza a priori sul corretto output dei livelli nascosti; 2. MLP con apprendimento supervisionato: qualora si disponga di un insieme di dati per l addestramento (o training set) comprendente esempi tipici di ingressi con le corrispondenti uscite, la rete può apprendere quale sia la relazione che li lega. Successivamente, la rete è addestrata mediante un opportuno algoritmo, il quale usa tali dati allo scopo di modificare i pesi ed altri parametri della rete stessa in modo tale da minimizzare l errore di previsione relativo all insieme d addestramento. La supervisione consiste proprio nel conoscere che risposta ci si aspetta da un determinato input. Se l addestramento ha successo, la rete impara a riconoscere la relazione incognita che lega le variabili d ingresso a quelle d uscita, ed è quindi in grado di fare previsioni anche laddove l uscita non è nota a priori; in altri termini, l obiettivo finale dell apprendimento supervisionato è la previsione del valore dell uscita per ogni valore valido dell ingresso, basandosi soltanto su un numero limitato di esempi di corrispondenza (vale a dire, coppie di valori input-output); 3. MLP con apprendimento non supervisionato: anche note come Self Organizing Maps o Mappe di Kohonen, dal nome di chi le ha introdotte, non prevedono la definizione di un target nel training set, ma dividono gli input in opportuni cluster rappresentativi dei dati stessi, facendo uso tipicamente di metodi topologici o probabilistici, creando, così, una mappa degli input mettendo vicini tra di loro quelli simili Algoritmo di apprendimento ANN L obiettivo dell algoritmo di apprendimento è quello di determinare un insieme di pesi w che minimizza la somma totale degli errori quadratici [11]: E(w) = 1 2 N (y i ŷ i ) 2 i=1 15

32 2 Reti neurali Notiamo che tale somma dipende da w, poiché l etichetta di classe predetta ŷ è una funzione dei pesi assegnati nei nodi di livello hidden e in quelli di output. Inoltre, la maggior parte dei valori di output, a causa delle funzione di attivazione scelta, sono ottenuti usando una funzione non lineare, per cui diventa davvero complicato ottenere una soluzione per w che sia globalmente ottimale. Per risolvere tale problema sono stati utilizzati vari algoritmi Greedy, basati sul metodo gradient descent e sviluppati con lo scopo di risolvere efficientemente il problema dell ottimizzazione. Tali algoritmi utilizzano la seguente formula per aggiornare il valore dei pesi w: w j w j λ E(w) w j dove λ è il learning rate (velocità di apprendimento), per cui il peso dovrebbe crescere in una direzione opposta rispetto a quella che riduce l errore totale. Tuttavia, poiché la funzione errore non è lineare, si può verificare che il metodo gradient descent si blocchi in un minimo locale e soprattutto con questo metodo risulta difficile calcolare il termine dell errore E(w) w j, poiché non si conoscono i loro corretti valori di output. Per risolvere questo problema è stata sviluppato un algoritmo di apprendimento chiamato backpropagation [7]. Esso è suddiviso in due fasi: forward phase, durante la quale i pesi ottenuti dalla precedente iterazione sono usati per calcolare il valore di output di ogni neurone nella rete, per cui il valore dell output del livello k-esimo è calcolato prima di quello del livello (k+1)-esimo backward phase, durante la quale la formula per il calcolo dell aggiornamento dei pesi è usata nella direzione opposta, per cui i pesi del livelli k+1 sono aggiornati prima dei pesi di livello k. Dunque, la formula che regola la variazione dei pesi nell addestramento della rete neurale con l algoritmo backpropagation è: w (s) ji = λ E(w)(s) (s) y w (s) i j dove s indica lo step corrente, y i (s) indica l uscita della rete allo step s e λ è il learning rate. Il learning rate è un parametro definito dall utente, prima di cominciare l apprendimento, che può influenzare in modo drastico la capacità di apprendimento di una rete neurale. Nel caso sia troppo elevato viene amplificato il catastrofic forgetting e si ottiene una rete con pesi oscillanti che tendono ad imparare solamente le ultime cose dette. Nel caso di un learning rate troppo basso, invece, la rete apprende molto lentamente e in 16

Tecniche di riconoscimento statistico

Tecniche di riconoscimento statistico On AIR s.r.l. Tecniche di riconoscimento statistico Applicazioni alla lettura automatica di testi (OCR) Parte 4 Reti neurali per la classificazione Ennio Ottaviani On AIR srl ennio.ottaviani@onairweb.com

Dettagli

Automazione Industriale (scheduling+mms) scheduling+mms. adacher@dia.uniroma3.it

Automazione Industriale (scheduling+mms) scheduling+mms. adacher@dia.uniroma3.it Automazione Industriale (scheduling+mms) scheduling+mms adacher@dia.uniroma3.it Introduzione Sistemi e Modelli Lo studio e l analisi di sistemi tramite una rappresentazione astratta o una sua formalizzazione

Dettagli

Data mining e rischi aziendali

Data mining e rischi aziendali Data mining e rischi aziendali Antonella Ferrari La piramide delle componenti di un ambiente di Bi Decision maker La decisione migliore Decisioni Ottimizzazione Scelta tra alternative Modelli di apprendimento

Dettagli

Analisi dei requisiti e casi d uso

Analisi dei requisiti e casi d uso Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello del sistema 4 2.1 Requisiti hardware........................ 4 2.2 Requisiti software.........................

Dettagli

Pro e contro delle RNA

Pro e contro delle RNA Pro e contro delle RNA Pro: - flessibilità: le RNA sono approssimatori universali; - aggiornabilità sequenziale: la stima dei pesi della rete può essere aggiornata man mano che arriva nuova informazione;

Dettagli

e-dva - eni-depth Velocity Analysis

e-dva - eni-depth Velocity Analysis Lo scopo dell Analisi di Velocità di Migrazione (MVA) è quello di ottenere un modello della velocità nel sottosuolo che abbia dei tempi di riflessione compatibili con quelli osservati nei dati. Ciò significa

Dettagli

Ricerca di outlier. Ricerca di Anomalie/Outlier

Ricerca di outlier. Ricerca di Anomalie/Outlier Ricerca di outlier Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Ricerca di Anomalie/Outlier Cosa sono gli outlier? L insieme di dati che sono considerevolmente differenti dalla

Dettagli

Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario

Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario Nell ambito di questa attività è in fase di realizzazione un applicativo che metterà a disposizione dei policy makers,

Dettagli

Corso di. Dott.ssa Donatella Cocca

Corso di. Dott.ssa Donatella Cocca Corso di Statistica medica e applicata Dott.ssa Donatella Cocca 1 a Lezione Cos'è la statistica? Come in tutta la ricerca scientifica sperimentale, anche nelle scienze mediche e biologiche è indispensabile

Dettagli

Organizzazione degli archivi

Organizzazione degli archivi COSA E UN DATA-BASE (DB)? è l insieme di dati relativo ad un sistema informativo COSA CARATTERIZZA UN DB? la struttura dei dati le relazioni fra i dati I REQUISITI DI UN DB SONO: la ridondanza minima i

Dettagli

A intervalli regolari ogni router manda la sua tabella a tutti i vicini, e riceve quelle dei vicini.

A intervalli regolari ogni router manda la sua tabella a tutti i vicini, e riceve quelle dei vicini. Algoritmi di routing dinamici (pag.89) UdA2_L5 Nelle moderne reti si usano algoritmi dinamici, che si adattano automaticamente ai cambiamenti della rete. Questi algoritmi non sono eseguiti solo all'avvio

Dettagli

Sommario. Definizione di informatica. Definizione di un calcolatore come esecutore. Gli algoritmi.

Sommario. Definizione di informatica. Definizione di un calcolatore come esecutore. Gli algoritmi. Algoritmi 1 Sommario Definizione di informatica. Definizione di un calcolatore come esecutore. Gli algoritmi. 2 Informatica Nome Informatica=informazione+automatica. Definizione Scienza che si occupa dell

Dettagli

Registratori di Cassa

Registratori di Cassa modulo Registratori di Cassa Interfacciamento con Registratore di Cassa RCH Nucleo@light GDO BREVE GUIDA ( su logiche di funzionamento e modalità d uso ) www.impresa24.ilsole24ore.com 1 Sommario Introduzione...

Dettagli

Strutturazione logica dei dati: i file

Strutturazione logica dei dati: i file Strutturazione logica dei dati: i file Informazioni più complesse possono essere composte a partire da informazioni elementari Esempio di una banca: supponiamo di voler mantenere all'interno di un computer

Dettagli

Distributed P2P Data Mining. Autore: Elia Gaglio (matricola n 809477) Corso di Sistemi Distribuiti Prof.ssa Simonetta Balsamo

Distributed P2P Data Mining. Autore: Elia Gaglio (matricola n 809477) Corso di Sistemi Distribuiti Prof.ssa Simonetta Balsamo Distributed P2P Data Mining Autore: (matricola n 809477) Corso di Sistemi Distribuiti Prof.ssa Simonetta Balsamo A.A. 2005/2006 Il settore del Data Mining Distribuito (DDM): Data Mining: cuore del processo

Dettagli

Librerie digitali. Video. Gestione di video. Caratteristiche dei video. Video. Metadati associati ai video. Metadati associati ai video

Librerie digitali. Video. Gestione di video. Caratteristiche dei video. Video. Metadati associati ai video. Metadati associati ai video Video Librerie digitali Gestione di video Ogni filmato è composto da più parti Video Audio Gestito come visto in precedenza Trascrizione del testo, identificazione di informazioni di interesse Testo Utile

Dettagli

Generazione Automatica di Asserzioni da Modelli di Specifica

Generazione Automatica di Asserzioni da Modelli di Specifica UNIVERSITÀ DEGLI STUDI DI MILANO BICOCCA FACOLTÀ DI SCIENZE MATEMATICHE FISICHE E NATURALI Corso di Laurea Magistrale in Informatica Generazione Automatica di Asserzioni da Modelli di Specifica Relatore:

Dettagli

Effetti sull opinione di pazienti riguardo all utilizzo di un computer in uno studio medico nell assistenza ordinaria

Effetti sull opinione di pazienti riguardo all utilizzo di un computer in uno studio medico nell assistenza ordinaria Effetti sull opinione di pazienti riguardo all utilizzo di un computer in uno studio medico nell assistenza ordinaria Christopher N. Sciamanna, Scott P. Novak, Bess H. Marcus. International Journal of

Dettagli

Introduzione all analisi dei segnali digitali.

Introduzione all analisi dei segnali digitali. Introduzione all analisi dei segnali digitali. Lezioni per il corso di Laboratorio di Fisica IV Isidoro Ferrante A.A. 2001/2002 1 Segnali analogici Si dice segnale la variazione di una qualsiasi grandezza

Dettagli

Mining Positive and Negative Association Rules:

Mining Positive and Negative Association Rules: Mining Positive and Negative Association Rules: An Approach for Confined Rules Alessandro Boca Alessandro Cislaghi Premesse Le regole di associazione positive considerano solo gli item coinvolti in una

Dettagli

Capitolo 13: L offerta dell impresa e il surplus del produttore

Capitolo 13: L offerta dell impresa e il surplus del produttore Capitolo 13: L offerta dell impresa e il surplus del produttore 13.1: Introduzione L analisi dei due capitoli precedenti ha fornito tutti i concetti necessari per affrontare l argomento di questo capitolo:

Dettagli

Regressione Mario Guarracino Data Mining a.a. 2010/2011

Regressione Mario Guarracino Data Mining a.a. 2010/2011 Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il volume produttivo X per uno dei propri stabilimenti e il corrispondente costo mensile Y di produzione. Volume

Dettagli

Sistemi Informativi Aziendali. Sistemi Informativi Aziendali

Sistemi Informativi Aziendali. Sistemi Informativi Aziendali DIPARTIMENTO DI INGEGNERIA INFORMATICA AUTOMATICA E GESTIONALE ANTONIO RUBERTI Cenni al Data Mining 1 Data Mining nasce prima del Data Warehouse collezione di tecniche derivanti da Intelligenza Artificiale,

Dettagli

Principi di analisi causale Lezione 2

Principi di analisi causale Lezione 2 Anno accademico 2007/08 Principi di analisi causale Lezione 2 Docente: prof. Maurizio Pisati Logica della regressione Nella sua semplicità, l espressione precedente racchiude interamente la logica della

Dettagli

Regressione non lineare con un modello neurale feedforward

Regressione non lineare con un modello neurale feedforward Reti Neurali Artificiali per lo studio del mercato Università degli studi di Brescia - Dipartimento di metodi quantitativi Marco Sandri (sandri.marco@gmail.com) Regressione non lineare con un modello neurale

Dettagli

Page 1. Evoluzione. Intelligenza Artificiale. Algoritmi Genetici. Evoluzione. Evoluzione: nomenclatura. Corrispondenze natura-calcolo

Page 1. Evoluzione. Intelligenza Artificiale. Algoritmi Genetici. Evoluzione. Evoluzione: nomenclatura. Corrispondenze natura-calcolo Evoluzione In ogni popolazione si verificano delle mutazioni. Intelligenza Artificiale In un ambiente che varia, le mutazioni possono generare individui che meglio si adattano alle nuove condizioni. Questi

Dettagli

Data mining. Vincenzo D Elia. vincenzo.delia@polito.it. DBDMG - Politecnico di Torino

Data mining. Vincenzo D Elia. vincenzo.delia@polito.it. DBDMG - Politecnico di Torino Data mining Vincenzo D Elia vincenzo.delia@polito.it DBDMG - Politecnico di Torino vincenzo.delia@polito.it Archivi Multimediali e Data Mining - p. 1 Rapid Miner vincenzo.delia@polito.it Archivi Multimediali

Dettagli

Come valutare le caratteristiche aerobiche di ogni singolo atleta sul campo

Come valutare le caratteristiche aerobiche di ogni singolo atleta sul campo Come valutare le caratteristiche aerobiche di ogni singolo atleta sul campo Prima di organizzare un programma di allenamento al fine di elevare il livello di prestazione, è necessario valutare le capacità

Dettagli

03. Il Modello Gestionale per Processi

03. Il Modello Gestionale per Processi 03. Il Modello Gestionale per Processi Gli aspetti strutturali (vale a dire l organigramma e la descrizione delle funzioni, ruoli e responsabilità) da soli non bastano per gestire la performance; l organigramma

Dettagli

Appunti sulla Macchina di Turing. Macchina di Turing

Appunti sulla Macchina di Turing. Macchina di Turing Macchina di Turing Una macchina di Turing è costituita dai seguenti elementi (vedi fig. 1): a) una unità di memoria, detta memoria esterna, consistente in un nastro illimitato in entrambi i sensi e suddiviso

Dettagli

LE CARTE DI CONTROLLO (4)

LE CARTE DI CONTROLLO (4) LE CARTE DI CONTROLLO (4) Tipo di carta di controllo Frazione difettosa Carta p Numero di difettosi Carta np Dimensione campione Variabile, solitamente >= 50 costante, solitamente >= 50 Linea centrale

Dettagli

Dimensione di uno Spazio vettoriale

Dimensione di uno Spazio vettoriale Capitolo 4 Dimensione di uno Spazio vettoriale 4.1 Introduzione Dedichiamo questo capitolo ad un concetto fondamentale in algebra lineare: la dimensione di uno spazio vettoriale. Daremo una definizione

Dettagli

Esperienze di Apprendimento Automatico per il corso di Intelligenza Artificiale

Esperienze di Apprendimento Automatico per il corso di Intelligenza Artificiale Esperienze di Apprendimento Automatico per il corso di lippi@dsi.unifi.it Dipartimento Sistemi e Informatica Università di Firenze Dipartimento Ingegneria dell Informazione Università di Siena Introduzione

Dettagli

Marketing relazionale

Marketing relazionale Marketing relazionale Introduzione Nel marketing intelligence assume particolare rilievo l applicazione di modelli predittivi rivolte a personalizzare e rafforzare il legame tra azienda e clienti. Un azienda

Dettagli

Backpropagation in MATLAB

Backpropagation in MATLAB Modello di neurone BACKPROPAGATION Backpropagation in MATLAB Prof. Beatrice Lazzerini Dipartimento di Ingegneria dell Informazione Via Diotisalvi 2, 56122 Pisa La funzione di trasferimento, che deve essere

Dettagli

Data mining: classificazione DataBase and Data Mining Group of Politecnico di Torino

Data mining: classificazione DataBase and Data Mining Group of Politecnico di Torino DataBase and Data Mining Group of Database and data mining group, Database and data mining group, DataBase and Data Mining Group of DataBase and Data Mining Group of So dati insieme di classi oggetti etichettati

Dettagli

S-TRAINER v.1.00 Esempio d uso

S-TRAINER v.1.00 Esempio d uso S-TRAINER v.1.00 Esempio d uso S-TRAINER v.1.00, ovvero il software per la pianificazione e la gestione dell allenamento sportivo. Andiamo a scoprire le potenzialità di questo nuovo software ideato da

Dettagli

Indice. pagina 2 di 10

Indice. pagina 2 di 10 LEZIONE PROGETTAZIONE ORGANIZZATIVA DOTT.SSA ROSAMARIA D AMORE Indice PROGETTAZIONE ORGANIZZATIVA---------------------------------------------------------------------------------------- 3 LA STRUTTURA

Dettagli

V= R*I. LEGGE DI OHM Dopo aver illustrato le principali grandezze elettriche è necessario analizzare i legami che vi sono tra di loro.

V= R*I. LEGGE DI OHM Dopo aver illustrato le principali grandezze elettriche è necessario analizzare i legami che vi sono tra di loro. LEGGE DI OHM Dopo aver illustrato le principali grandezze elettriche è necessario analizzare i legami che vi sono tra di loro. PREMESSA: Anche intuitivamente dovrebbe a questo punto essere ormai chiaro

Dettagli

I database relazionali (Access)

I database relazionali (Access) I database relazionali (Access) Filippo TROTTA 04/02/2013 1 Prof.Filippo TROTTA Definizioni Database Sistema di gestione di database (DBMS, Database Management System) Sistema di gestione di database relazionale

Dettagli

Database. Si ringrazia Marco Bertini per le slides

Database. Si ringrazia Marco Bertini per le slides Database Si ringrazia Marco Bertini per le slides Obiettivo Concetti base dati e informazioni cos è un database terminologia Modelli organizzativi flat file database relazionali Principi e linee guida

Dettagli

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Un po di statistica. Christian Ferrari. Laboratorio di Matematica Un po di statistica Christian Ferrari Laboratorio di Matematica 1 Introduzione La statistica è una parte della matematica applicata che si occupa della raccolta, dell analisi e dell interpretazione di

Dettagli

Progettaz. e sviluppo Data Base

Progettaz. e sviluppo Data Base Progettaz. e sviluppo Data Base! Progettazione Basi Dati: Metodologie e modelli!modello Entita -Relazione Progettazione Base Dati Introduzione alla Progettazione: Il ciclo di vita di un Sist. Informativo

Dettagli

Uno standard per il processo KDD

Uno standard per il processo KDD Uno standard per il processo KDD Il modello CRISP-DM (Cross Industry Standard Process for Data Mining) è un prodotto neutrale definito da un consorzio di numerose società per la standardizzazione del processo

Dettagli

Identificazione dei Parametri Caratteristici di un Plasma Circolare Tramite Rete Neuronale

Identificazione dei Parametri Caratteristici di un Plasma Circolare Tramite Rete Neuronale Identificazione dei Parametri Caratteristici di un Plasma Circolare Tramite Rete euronale Descrizione Il presente lavoro, facente segiuto a quanto descritto precedentemente, ha il fine di: 1) introdurre

Dettagli

Scheduling della CPU. Sistemi multiprocessori e real time Metodi di valutazione Esempi: Solaris 2 Windows 2000 Linux

Scheduling della CPU. Sistemi multiprocessori e real time Metodi di valutazione Esempi: Solaris 2 Windows 2000 Linux Scheduling della CPU Sistemi multiprocessori e real time Metodi di valutazione Esempi: Solaris 2 Windows 2000 Linux Sistemi multiprocessori Fin qui si sono trattati i problemi di scheduling su singola

Dettagli

ISTITUTO TECNICO ECONOMICO MOSSOTTI

ISTITUTO TECNICO ECONOMICO MOSSOTTI CLASSE III INDIRIZZO S.I.A. UdA n. 1 Titolo: conoscenze di base Conoscenza delle caratteristiche dell informatica e degli strumenti utilizzati Informatica e sistemi di elaborazione Conoscenza delle caratteristiche

Dettagli

Indice generale. OOA Analisi Orientata agli Oggetti. Introduzione. Analisi

Indice generale. OOA Analisi Orientata agli Oggetti. Introduzione. Analisi Indice generale OOA Analisi Orientata agli Oggetti Introduzione Analisi Metodi d' analisi Analisi funzionale Analisi del flusso dei dati Analisi delle informazioni Analisi Orientata agli Oggetti (OOA)

Dettagli

Università di Pisa A.A. 2004-2005

Università di Pisa A.A. 2004-2005 Università di Pisa A.A. 2004-2005 Analisi dei dati ed estrazione di conoscenza Corso di Laurea Specialistica in Informatica per l Economia e per l Azienda Tecniche di Data Mining Corsi di Laurea Specialistica

Dettagli

Analisi della Costruzione Partecipativa di un Wiki con un Applicazione a Wikipedia

Analisi della Costruzione Partecipativa di un Wiki con un Applicazione a Wikipedia POLITECNICO DI MILANO Facoltà di Ingegneria dell'informazione Corso di Laurea in Ingegneria Informatica Analisi della Costruzione Partecipativa di un Wiki con un Applicazione a Wikipedia Tesi di laurea

Dettagli

Lezione 8. La macchina universale

Lezione 8. La macchina universale Lezione 8 Algoritmi La macchina universale Un elaboratore o computer è una macchina digitale, elettronica, automatica capace di effettuare trasformazioni o elaborazioni su i dati digitale= l informazione

Dettagli

Project Management. Modulo: Introduzione. prof. ing. Guido Guizzi

Project Management. Modulo: Introduzione. prof. ing. Guido Guizzi Project Management Modulo: Introduzione prof. ing. Guido Guizzi Definizione di Project Management Processo unico consistente in un insieme di attività coordinate con scadenze iniziali e finali, intraprese

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2014-2015 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

SISTEMI INFORMATIVI AVANZATI -2010/2011 1. Introduzione

SISTEMI INFORMATIVI AVANZATI -2010/2011 1. Introduzione SISTEMI INFORMATIVI AVANZATI -2010/2011 1 Introduzione In queste dispense, dopo aver riportato una sintesi del concetto di Dipendenza Funzionale e di Normalizzazione estratti dal libro Progetto di Basi

Dettagli

Il database management system Access

Il database management system Access Il database management system Access Corso di autoistruzione http://www.manualipc.it/manuali/ corso/manuali.php? idcap=00&idman=17&size=12&sid= INTRODUZIONE Il concetto di base di dati, database o archivio

Dettagli

Sistema operativo: Gestione della memoria

Sistema operativo: Gestione della memoria Dipartimento di Elettronica ed Informazione Politecnico di Milano Informatica e CAD (c.i.) - ICA Prof. Pierluigi Plebani A.A. 2008/2009 Sistema operativo: Gestione della memoria La presente dispensa e

Dettagli

4 3 4 = 4 x 10 2 + 3 x 10 1 + 4 x 10 0 aaa 10 2 10 1 10 0

4 3 4 = 4 x 10 2 + 3 x 10 1 + 4 x 10 0 aaa 10 2 10 1 10 0 Rappresentazione dei numeri I numeri che siamo abituati ad utilizzare sono espressi utilizzando il sistema di numerazione decimale, che si chiama così perché utilizza 0 cifre (0,,2,3,4,5,6,7,8,9). Si dice

Dettagli

L ANALISI ABC PER LA GESTIONE DEL MAGAZZINO

L ANALISI ABC PER LA GESTIONE DEL MAGAZZINO L ANALISI ABC PER LA GESTIONE DEL MAGAZZINO È noto che la gestione del magazzino è uno dei costi nascosti più difficili da analizzare e, soprattutto, da contenere. Le nuove tecniche hanno, però, permesso

Dettagli

Università degli Studi di Salerno

Università degli Studi di Salerno Università degli Studi di Salerno Facoltà di Scienze Matematiche Fisiche e Naturali Corso di Laurea in Informatica Tesi di Laurea Algoritmi basati su formule di quadratura interpolatorie per GPU ABSTRACT

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 29-Analisi della potenza statistica vers. 1.0 (12 dicembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

Ottimizzazione delle interrogazioni (parte I)

Ottimizzazione delle interrogazioni (parte I) Ottimizzazione delle interrogazioni I Basi di Dati / Complementi di Basi di Dati 1 Ottimizzazione delle interrogazioni (parte I) Angelo Montanari Dipartimento di Matematica e Informatica Università di

Dettagli

LA REVISIONE LEGALE DEI CONTI La comprensione

LA REVISIONE LEGALE DEI CONTI La comprensione LA REVISIONE LEGALE DEI CONTI La comprensione dell impresa e del suo contesto e la valutazione dei rischi di errori significativi Ottobre 2013 Indice 1. La comprensione dell impresa e del suo contesto

Dettagli

11. Evoluzione del Software

11. Evoluzione del Software 11. Evoluzione del Software Andrea Polini Ingegneria del Software Corso di Laurea in Informatica (Ingegneria del Software) 11. Evoluzione del Software 1 / 21 Evoluzione del Software - generalità Cosa,

Dettagli

Reti di Telecomunicazione Lezione 8

Reti di Telecomunicazione Lezione 8 Reti di Telecomunicazione Lezione 8 Marco Benini Corso di Laurea in Informatica marco.benini@uninsubria.it Livello di trasporto Programma della lezione relazione tra lo strato di trasporto e lo strato

Dettagli

Metodi Computazionali

Metodi Computazionali Metodi Computazionali Elisabetta Fersini fersini@disco.unimib.it A.A. 2009/2010 Catene di Markov Applicazioni: Fisica dinamica dei sistemi Web simulazione del comportamento utente Biologia evoluzione delle

Dettagli

Ottimizzazione Multi Obiettivo

Ottimizzazione Multi Obiettivo Ottimizzazione Multi Obiettivo 1 Ottimizzazione Multi Obiettivo I problemi affrontati fino ad ora erano caratterizzati da una unica (e ben definita) funzione obiettivo. I problemi di ottimizzazione reali

Dettagli

connessioni tra i singoli elementi Hanno caratteristiche diverse e sono presentati con modalità diverse Tali relazioni vengono rappresentate QUINDI

connessioni tra i singoli elementi Hanno caratteristiche diverse e sono presentati con modalità diverse Tali relazioni vengono rappresentate QUINDI Documenti su Internet LINGUAGGI DI MARKUP Internet permette (tra l altro) di accedere a documenti remoti In generale, i documenti acceduti via Internet sono multimediali, cioè che possono essere riprodotti

Dettagli

Sistemi Operativi IMPLEMENTAZIONE DEL FILE SYSTEM. D. Talia - UNICAL. Sistemi Operativi 9.1

Sistemi Operativi IMPLEMENTAZIONE DEL FILE SYSTEM. D. Talia - UNICAL. Sistemi Operativi 9.1 IMPLEMENTAZIONE DEL FILE SYSTEM 9.1 Implementazione del File System Struttura del File System Implementazione Implementazione delle Directory Metodi di Allocazione Gestione dello spazio libero Efficienza

Dettagli

I documenti di www.mistermanager.it. Gli ingredienti per l allenamento per la corsa LE RIPETUTE

I documenti di www.mistermanager.it. Gli ingredienti per l allenamento per la corsa LE RIPETUTE I documenti di www.mistermanager.it Gli ingredienti per l allenamento per la corsa LE RIPETUTE Le Ripetute sono una delle forme di allenamento che caratterizzano i corridori più evoluti, in quanto partono

Dettagli

Application note. CalBatt NomoStor per i sistemi di accumulo di energia

Application note. CalBatt NomoStor per i sistemi di accumulo di energia 1. Panoramica Application note CalBatt NomoStor per i sistemi di accumulo di energia Gli Energy Management Systems () sono dispositivi atti al controllo dei flussi di energia dalle sorgenti di produzione

Dettagli

FIRESHOP.NET. Gestione del taglia e colore. www.firesoft.it

FIRESHOP.NET. Gestione del taglia e colore. www.firesoft.it FIRESHOP.NET Gestione del taglia e colore www.firesoft.it Sommario SOMMARIO Introduzione... 3 Configurazione iniziale... 5 Gestione delle varianti... 6 Raggruppamento delle varianti... 8 Gestire le varianti

Dettagli

Corso di Matematica per la Chimica

Corso di Matematica per la Chimica Dott.ssa Maria Carmela De Bonis a.a. 203-4 I sistemi lineari Generalità sui sistemi lineari Molti problemi dell ingegneria, della fisica, della chimica, dell informatica e dell economia, si modellizzano

Dettagli

Algoritmi di clustering

Algoritmi di clustering Algoritmi di clustering Dato un insieme di dati sperimentali, vogliamo dividerli in clusters in modo che: I dati all interno di ciascun cluster siano simili tra loro Ciascun dato appartenga a uno e un

Dettagli

IL SISTEMA INFORMATIVO

IL SISTEMA INFORMATIVO LEZIONE 15 DAL MODELLO DELLE CONDIZIONI DI EQUILIBRIO AL MODELLO CONTABILE RIPRESA DEL CONCETTO DI SISTEMA AZIENDALE = COMPLESSO DI ELEMENTI MATERIALI E NO CHE DIPENDONO RECIPROCAMENTE GLI UNI DAGLI ALTRI

Dettagli

Appendice III. Competenza e definizione della competenza

Appendice III. Competenza e definizione della competenza Appendice III. Competenza e definizione della competenza Competenze degli psicologi Lo scopo complessivo dell esercizio della professione di psicologo è di sviluppare e applicare i principi, le conoscenze,

Dettagli

Lezione 1. Introduzione e Modellazione Concettuale

Lezione 1. Introduzione e Modellazione Concettuale Lezione 1 Introduzione e Modellazione Concettuale 1 Tipi di Database ed Applicazioni Database Numerici e Testuali Database Multimediali Geographic Information Systems (GIS) Data Warehouses Real-time and

Dettagli

SVM. Veronica Piccialli. Roma 11 gennaio 2010. Università degli Studi di Roma Tor Vergata 1 / 14

SVM. Veronica Piccialli. Roma 11 gennaio 2010. Università degli Studi di Roma Tor Vergata 1 / 14 SVM Veronica Piccialli Roma 11 gennaio 2010 Università degli Studi di Roma Tor Vergata 1 / 14 SVM Le Support Vector Machines (SVM) sono una classe di macchine di che derivano da concetti riguardanti la

Dettagli

Introduzione alla Virtualizzazione

Introduzione alla Virtualizzazione Introduzione alla Virtualizzazione Dott. Luca Tasquier E-mail: luca.tasquier@unina2.it Virtualizzazione - 1 La virtualizzazione è una tecnologia software che sta cambiando il metodo d utilizzo delle risorse

Dettagli

13. Campi vettoriali

13. Campi vettoriali 13. Campi vettoriali 1 Il campo di velocità di un fluido Il concetto di campo in fisica non è limitato ai fenomeni elettrici. In generale il valore di una grandezza fisica assegnato per ogni punto dello

Dettagli

ControlloCosti. Cubi OLAP. Controllo Costi Manuale Cubi

ControlloCosti. Cubi OLAP. Controllo Costi Manuale Cubi ControlloCosti Cubi OLAP I cubi OLAP Un Cubo (OLAP, acronimo di On-Line Analytical Processing) è una struttura per la memorizzazione e la gestione dei dati che permette di eseguire analisi in tempi rapidi,

Dettagli

risulta (x) = 1 se x < 0.

risulta (x) = 1 se x < 0. Questo file si pone come obiettivo quello di mostrarvi come lo studio di una funzione reale di una variabile reale, nella cui espressione compare un qualche valore assoluto, possa essere svolto senza necessariamente

Dettagli

Data mining. Data Mining. processo di Data Mining estrarre automaticamente informazioneda un insieme di dati

Data mining. Data Mining. processo di Data Mining estrarre automaticamente informazioneda un insieme di dati Data mining Il consente l informazione processo di Data Mining estrarre automaticamente informazioneda un insieme di dati telefoniche, ènascostaa a causa di fra quantitàdi loro, complessità: non... ci

Dettagli

SISTEMI OPERATIVI. Prof. Enrico Terrone A. S: 2008/09

SISTEMI OPERATIVI. Prof. Enrico Terrone A. S: 2008/09 SISTEMI OPERATIVI Prof. Enrico Terrone A. S: 2008/09 Che cos è il sistema operativo Il sistema operativo (SO) è il software che gestisce e rende accessibili (sia ai programmatori e ai programmi, sia agli

Dettagli

Raggruppamenti Conti Movimenti

Raggruppamenti Conti Movimenti ESERCITAZIONE PIANO DEI CONTI Vogliamo creare un programma che ci permetta di gestire, in un DB, il Piano dei conti di un azienda. Nel corso della gestione d esercizio, si potranno registrare gli articoli

Dettagli

Il concetto di valore medio in generale

Il concetto di valore medio in generale Il concetto di valore medio in generale Nella statistica descrittiva si distinguono solitamente due tipi di medie: - le medie analitiche, che soddisfano ad una condizione di invarianza e si calcolano tenendo

Dettagli

Posizionamento ottimale di sensori per il monitoraggio degli inquinanti nelle reti idriche

Posizionamento ottimale di sensori per il monitoraggio degli inquinanti nelle reti idriche Posizionamento ottimale di sensori per il monitoraggio degli inquinanti nelle reti idriche Fulvio BOANO Politecnico di Torino Dipartimento di Ingegneria dell Ambiente, del Territorio e delle Infrastrutture

Dettagli

MANUALE DELLA QUALITÀ Pag. 1 di 6

MANUALE DELLA QUALITÀ Pag. 1 di 6 MANUALE DELLA QUALITÀ Pag. 1 di 6 INDICE GESTIONE DELLE RISORSE Messa a disposizione delle risorse Competenza, consapevolezza, addestramento Infrastrutture Ambiente di lavoro MANUALE DELLA QUALITÀ Pag.

Dettagli

1. Introduzione. 2. Simulazioni elettromagnetiche per la misura del SAR

1. Introduzione. 2. Simulazioni elettromagnetiche per la misura del SAR Relazione Tecnica Analisi simulative e misure con termocamera relative al confronto tra l utilizzo di un telefono smartphone in assenza e in presenza di dispositivo distanziatore EWAD Annamaria Cucinotta

Dettagli

Sistemi Operativi. 5 Gestione della memoria

Sistemi Operativi. 5 Gestione della memoria Gestione della memoria Compiti del gestore della memoria: Tenere traccia di quali parti della memoria sono libere e quali occupate. Allocare memoria ai processi che ne hanno bisogno. Deallocare la memoria

Dettagli

La gestione di un calcolatore. Sistemi Operativi primo modulo Introduzione. Sistema operativo (2) Sistema operativo (1)

La gestione di un calcolatore. Sistemi Operativi primo modulo Introduzione. Sistema operativo (2) Sistema operativo (1) La gestione di un calcolatore Sistemi Operativi primo modulo Introduzione Augusto Celentano Università Ca Foscari Venezia Corso di Laurea in Informatica Un calcolatore (sistema di elaborazione) è un sistema

Dettagli

Codifiche a lunghezza variabile

Codifiche a lunghezza variabile Sistemi Multimediali Codifiche a lunghezza variabile Marco Gribaudo marcog@di.unito.it, gribaudo@elet.polimi.it Assegnazione del codice Come visto in precedenza, per poter memorizzare o trasmettere un

Dettagli

INDIRIZZI IP ARCHITETTURA GENERALE DEGLI INDIRIZZI IP FORME DI INDIRIZZI IP CINQUE FORME DI INDIRIZZI IP

INDIRIZZI IP ARCHITETTURA GENERALE DEGLI INDIRIZZI IP FORME DI INDIRIZZI IP CINQUE FORME DI INDIRIZZI IP INDIRIZZI IP ARCHITETTURA GENERALE DEGLI INDIRIZZI IP Un indirizzo IP è composto da 32 bit. Generalmente, per convenienza, è presentato in decimale: 4 ottetti (bytes) separati da un punto. Ogni rete fisica

Dettagli

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI VERO FALSO CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI 1. V F Un ipotesi statistica è un assunzione sulle caratteristiche di una o più variabili in una o più popolazioni 2. V F L ipotesi nulla unita

Dettagli

Introduzione agli Algoritmi Genetici Prof. Beatrice Lazzerini

Introduzione agli Algoritmi Genetici Prof. Beatrice Lazzerini Introduzione agli Algoritmi Genetici Prof. Beatrice Lazzerini Dipartimento di Ingegneria della Informazione Via Diotisalvi, 2 56122 PISA ALGORITMI GENETICI (GA) Sono usati per risolvere problemi di ricerca

Dettagli

SOFTWARE PER LA RILEVAZIONE DEI TEMPI PER CENTRI DI COSTO

SOFTWARE PER LA RILEVAZIONE DEI TEMPI PER CENTRI DI COSTO SOFTWARE PER LA RILEVAZIONE DEI TEMPI PER CENTRI DI COSTO Descrizione Nell ambito della rilevazione dei costi, Solari con l ambiente Start propone Time&Cost, una applicazione che contribuisce a fornire

Dettagli

uadro Soluzioni software per L archiviazione elettronica dei documenti Gestione Aziendale Fa quadrato attorno alla tua azienda

uadro Soluzioni software per L archiviazione elettronica dei documenti Gestione Aziendale Fa quadrato attorno alla tua azienda Fa quadrato attorno alla tua azienda Soluzioni software per L archiviazione elettronica dei documenti Perché scegliere Q Archiviazione Elettronica dei Documenti? Tale applicativo si pone come obbiettivo

Dettagli

MODULO 5 Appunti ACCESS - Basi di dati

MODULO 5 Appunti ACCESS - Basi di dati MODULO 5 Appunti ACCESS - Basi di dati Lezione 1 www.mondopcnet.com Modulo 5 basi di dati Richiede che il candidato dimostri di possedere la conoscenza relativa ad alcuni concetti fondamentali sui database.

Dettagli

MService La soluzione per ottimizzare le prestazioni dell impianto

MService La soluzione per ottimizzare le prestazioni dell impianto MService La soluzione per ottimizzare le prestazioni dell impianto Il segreto del successo di un azienda sta nel tenere sotto controllo lo stato di salute delle apparecchiature degli impianti. Dati industriali

Dettagli

Business Process Management

Business Process Management Business Process Management Comprendere, gestire, organizzare e migliorare i processi di business Caso di studio a cura della dott. Danzi Francesca e della prof. Cecilia Rossignoli 1 Business process Un

Dettagli

manifatturiera e per i servizi

manifatturiera e per i servizi CAPITOLO 7 Tecnologie per la produzione manifatturiera e per i servizi Agenda Tecnologia e core technology Processi core ed ausiliari Tecnologia e struttura organizzativa Tecnologia core manifatturiera

Dettagli