Alla scoperta del Data Mining. Paolo Pinceti, Micaela Caserza Magro Università di Genova - Dipartimento DITEN



Documenti analoghi
(BD BI) SSI. Cosa significa il titolo di questo lavoro? In che lingua è scritto? È vero quello che dice? Big Data e Business Intelligence

Cosa significa il titolo di questo lavoro? In che lingua è scritto? E vero quello che dice?

MService La soluzione per ottimizzare le prestazioni dell impianto

Monitoraggio Impianti Fotovoltaici

Excel Terza parte. Excel 2003

Confronto tra i fattori di emissione utilizzati in Copert, Artemis e Progress e delle relative stime di emissioni da flotte circolanti in area urbana

Il sistema che rende efficiente la manutenzione delle flotte di automezzi

Analisi di scenario File Nr. 10

PROGRESS: UN CODICE PER IL CALCOLO DELLE EMISSIONI DA VEICOLI STRADALI IN AMBITO URBANO

Sistema Rilevamento Temperatura Sottocassa Treno

Giorno ENERGY SUMMER SCHOOL. contenuti corsi

Relazioni statistiche: regressione e correlazione

Capitolo 12 La regressione lineare semplice

Service di Media Tensione, Agosto 2014 Manutenzione secondo condizione Apparecchiature di media tensione

Asset management per centrali di produzione da fonti rinnovabili.

IL RISPARMIO ENERGETICO E GLI AZIONAMENTI A VELOCITA VARIABILE L utilizzo dell inverter negli impianti frigoriferi.

Il benchmarking sui servizi delle Grandi città: nuovi strumenti Claudia Migliore

Scheduling della CPU. Sistemi multiprocessori e real time Metodi di valutazione Esempi: Solaris 2 Windows 2000 Linux

Il monitoraggio ambientale come supporto al controllo del territorio. Francesco Antolini Emanuele Tavelli

Il metodo della regressione

Opportunità e rischi derivanti dall'impiego massivo dell'informatica in statistica. Francesco Maria Sanna Roma, 3 maggio 2012

PREMESSA AUTOMAZIONE E FLESSIBILITA'

Data mining for e- commerce sites

Monitoraggio per Risparmio Energetico

TECNICO SUPERIORE PER L AUTOMAZIONE INDUSTRIALE

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

LA LOGISTICA INTEGRATA

Architetture software per la diagnostica remota

Second life, vita accelerata e modellistica

Analisi della performance temporale della rete

DSCube. L analisi dei dati come strumento per i processi decisionali

introduzione introduzione soluzione acquisizione dati elaborazione e archiviazione dati interfaccia utente personalizzazioni

Cosa è un foglio elettronico

RIVELAZIONE DELLE RADIAZIONI IONIZZANTI. Nelle tecniche di rivelazione delle radiazioni ionizzanti le grandezze da rivelare possono essere diverse:

OCS Open Control System

Progetto MICS Abilitazioni Macchine Giornata Nazionale di Formazione Formatori in collaborazione con ANIMA/UCoMESA-AISEM Milano 22 Marzo 2012

Sistema youmeter. Il monitoraggio elettrico come strumento di controllo e risparmio dei consumi

maggio 2013 Elevend srl Pag. 1/25

READY-TO-GO PRODUZIONE

Il motore di previsione statistica SAS Forecast Server a

Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario

Per capire meglio l ambito di applicazione di un DWhouse consideriamo la piramide di Anthony, L. Direzionale. L. Manageriale. L.

Smart Grid: Opportunità e sfide per la sicurezza e l affidabilità

L a p i p at a taf a or o ma a p e p r e ga g r a an a t n ire e l ef e fici c en e za za e n e e n r e ge g t e ica Powered By

Efficienza energetica: opportunità e sfide nel settore edile e nel terziario

Sistemi Informativi Territoriali. Paolo Mogorovich

Progettaz. e sviluppo Data Base

Domande e risposte su Avira ProActiv Community

SISTEMA DI TELETTURA CONTATORI

Strutturazione logica dei dati: i file

Caratteristiche V2-S4 V2-S8 V2-S10 V2-S14. Ingressi. Sezione di ciascun cavo DC [mm² ] Da 4 a 10 Da 4 a 10 Da 4 a 10 Da 4 a 10

LA CORRELAZIONE LINEARE

Pro e contro delle RNA

QUADERNO TECNICO- INFORMATIVO 9/16/2014. Il libretto di impianto degli impianti termici: aggiornamento normativo

Industry Automation. HMI: WinCC. SIMATIC WinCC PerformanceMonitor V7.2

La Videosorveglianza Criteri per il dimensionamento dello storage

L'automazione come fattore di risparmio energetico nel water treatment. Roma, 21 Marzo 2013 Marco Filippis

Panoramica sui Sistemi di

Industry 4.0: la visione di IEC. Micaela Caserza Magro, Paolo Pinceti Università di Genova, Dip. DITEN

Introduzione allo studio sulla pericolosità meteorologica a scala nazionale: la sensibilità del mercato assicurativo ai

Federico Laschi. Conclusioni

FUNZIONI DI DIAGNOSTICA PER VALVOLE E ATTUATORI SAVE Verona Dr. Andrea Villa

B C I un altro punto di vista Introduzione

Analisi dei Dati. Scopo di questa parte corso e` la presentazione di metodi per la estrazione di informazioni da insiemi di dati

- la possibilità di monitorare lo stato attuale della macchina - fornire una reportistica sulla base di alcune variabili

I DATABASE Database relazionale

MANUTENZIONE DELLA MACCHINA UTENSILE TRAMITE UN NUOVO APPROCCIO DI MONITORAGGIO VIBRAZIONALE

E l e t t r o m a g n e t i s m o. Saggio Finale

Healt & Usage Monitoring System dei veicoli ferroviari in remoto. Giuseppe Giannini Milano,

Sistemi Informativi Aziendali I

UN SISTEMA SOFTWARE PER L ACCESSO AI DOCUMENTI DIGITALI DI CONTENUTO TECNICO SCIENTIFICO DA PARTE DI PERSONE NON VEDENTI

Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco

DN-SEV Sistema Esperto per la Validazione

Elementi di Psicometria con Laboratorio di SPSS 1

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

Metodologie Informatiche Applicate al Turismo

ZTP WEB SERVER FUNZIONE - REMOTE CAN CAN CONSOLE -

3 - Variabili. Programmazione e analisi di dati Modulo A: Programmazione in Java. Paolo Milazzo

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995).

vendite Come organizzare le informazioni Il Customer Relationship Management nelle Istituzioni Finanziarie Europe

CORRENTE E TENSIONE ELETTRICA LA CORRENTE ELETTRICA

TELEGESTIONE. come spendere meno, inquinare meno e governare meglio gli impianti di illuminazione pubblica. Davide Bassetto A.P. SYSTEMS s.r.l.

VALORE DELLE MERCI SEQUESTRATE

Andrea Cacace, ABB Process Automation, 23 Aprile 2015 Ottimizzazione ed efficienza energetica nei processi: il ruolo della diagnosi energetica

Prof. A. Bemporad, Ing. S. Di Cairano 26 Maggio Esercitazione di Tecnologia dei Sistemi di Controllo

Informazione analogica e digitale

Base di dati e sistemi informativi

Attività destinata a raccogliere e a catalogare documenti con l'obiettivo di farli conoscere e diffonderli.

Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci

Titolo: Sistemi di bigliettazione elettronica: analisi dati e data mining Relatore: Andrea Gaffi

Analysis of temperature time series from thermal IR continuous monitoring network (TIIMNet) at Campi Flegrei Caldera in the period

Access. P a r t e p r i m a

Al giorno d oggi, i sistemi per la gestione di database

Parimenti una gestione delle scorte in maniera non oculata può portare a serie ripercussioni sul rendimento sia dei mezzi propri che di terzi.

Italia - Aprile Fuel Card

My.CassaNova Configura, gestisci e studia il tuo punto vendita. Gruppo Pixel srl Via Enrico Mattei, 86/5 Bologna Tel

Università di L Aquila Facoltà di Biotecnologie Agro-alimentari

Salva Batteria Drive Tech 12V 24V

YOUR EASY SOLUTION FOR COSTING

INTRODUZIONE A EXCEL ESERCITAZIONE I

Transcript:

Alla scoperta del Data Mining Paolo Pinceti, Micaela Caserza Magro Università di Genova - Dipartimento DITEN

Outlines Definizione di Data Mining Tecniche di analisi dati Esempi applicativi 2

Cosa è il Data Mining Il Data Mining è un processo di estrazione di conoscenza da banche dati di grandi dimensioni tramite l'applicazione di algoritmi che individuano le associazioni "nascoste" tra le informazioni e le rendono visibili. Gli algoritmi di Data Mining sono stati sviluppati per far fronte all'esigenza di sfruttare il patrimonio informativo contenuto nelle grandi raccolte di dati che abbiamo a disposizione. 3

Big Data Strutture HW e tecniche SW per acquisizione, immagazzinamento elaborazione, ricerca di grandi quantità di dati. 10 11 10 15 byte se 1 byte è 1 granello di sabbia: 10 6 byte = 1 megabyte = 1 pugno di sabbia 10 9 byte = 1 gigabyte = 1 scatola piena di sabbia 10 12 byte = 1 terabyte = 1 spiaggia grande come un campo da calcio 10 15 byte = 1 petabyte = molti chilometri di spiaggia 4

Le «V» dei Big Data Volume Velocità Varietà Visualizzazione Validazione 5

chi usa BD? 6

La domanda che sorge è: Ma Big Data cosa ha a che fare con l Automazione Industriale? In senso stretto la risposta corretta è: 9

Volume Velocità Varietà Visualizzazione Validazione kbyte - Mbyte non essenziale dati omogenei esterna a monte 10

Struttura database «processo» 11

Struttura database «elettrico» 12

In entrambi i casi, il database di impianto contiene: - dati di processo real-time - dati storici - allarmi e eventi - dati diagnostici sui quali è possibile applicare tecniche di analisi statistiche. 13

Contenuti del DB di processo Dati realtime Dati storici Allarmi ed eventi Dati diagnostici 15

Analisi dei dati Orizzontale: analisi di proprietà uguali di apparati diversi 16

Analisi dei valori medi 11 12 10 9 11 10 9 8 1 2 3 4 5 6 7 8 9 10 8 1 2 3 4 5 6 7 8 9 10 varianza media aritmetica numero di campioni 17

Analisi dei dati Verticale: analisi dell andamento di una o più proprietà di un singolo apparato 18

Analisi verticale Analisi di trend es. ciclo di lavoro di un attuatore di valvola 12 10 8 6 4 2 0 1 2 3 4 5 6 7 8 9 10 11 su parametri funzionali e/o su anomalie o guasti analizzati su un periodo sufficientemente lungo Analisi di firma 19

Analisi dei dati Mista (1): analisi incrociata di proprietà diverse dello stesso apparato 20

Analisi dei dati Mista (2): analisi incrociata di proprietà diverse di apparati diversi 21

Funzione di regressione Regressione Lineare 22 E necessaria un analisi preliminare di ragionevolezza!!!

Funzione di regressione Regressione Polinomiale 23

Coefficiente di correlazione Attenzioni alle variabili nascoste! X = vittime incendio Y = pompieri impegnati meno pompieri meno vittime (Z = dimensione incendio) 24

ESEMPIO DI APPLICAZIONE REALE 25

Applicazione: flotta di locomotive 26

Applicazione: flotta di locomotive Dati dal campo Regole diagnostiche Specifiche Produttore 27

Dati diagnostici No. Segnale Significato Utilità 064F 444D Numero manovre IR o IP Manovre di sicurezza 0607 Velocità >3 km/h Indicatore usura interruttore meccanica Indicatore usura interruttore elettrica/ malfunzionamento drive 1087 Chiusura pantografo Indicatore usura pantografo 21FF Batteria attiva - Flotta 186: Multisistema - Analisi di flotta - Analisi da Gennaio a Novembre 2013 - KPI: numero manovre IR - KPI: numero manovre IP - KPI: numero manovre sicurezza 28

Analisi orizzontale 29

Regole per la CBM Media IR > 3,5 Media sicurezza > 3,5 & Attività manutentive su contattore 186112 186114 186118 186121 186122 186236 (CBM = Condition Based Maintenance) 186117 186119 186144 (falsi positivi) 30

Vantaggi ottenuti Manutenzione ciclica Manutenzione con Data Mining 31

ESEMPIO APPLICATIVO: COMPRESSORE 32

Dati diagnostici per compressori Vibrazioni Temperatura Ore di funzionamento Tempi di ricarica Numero avviamenti 33

Firma per compressori 34

Firma per compressori Tempo di ricarica Ricarica delle perdite di carico Costante durante la vita utile Tempo di funzionamento Ore lavorate complessivamente dal compressore Cicli di funzionamento Cicli di funzionamento normali 35

Time [s] Time [s] Risultati 120 100 80 60 40 20 Compressor time ON in coasting 120 100 80 60 40 20 Compressor time ON in coasting 0 1 2 3 4 5 # of acquisition 0 1 2 3 4 5 # of acqusition Loco ID Average Time ON [s] Average Time ON in coasting [s] % compressor working 186111 90,83 74,48 25,30% 186112 122,91 73,98 30,05% 186113 213,59 126,45 48,46% 186114 73,81 64,47 18,58% 186115 75,49 59,74 16,98% 186116 68,27 54,39 16,13% 186117 88,11 71,74 25,36% 186118 75,79 60,09 22,77% 186119 76,03 60,17 18,64% 186120 77,69 64,45 22,42% 186121 90,03 75,18 26,03% 186122 89,81 67,35 26,89% 186144 121,95 92,87 32,81% 186236 76,05 63,22 21,18% 36

Stima della vita residua Vita del compressore in ore Analisi delle reali ore lavorate Stima della vita residua Vita residua input per manutentore 37

REGOLE GENERALI PER L APPROCCIO AL DATA MINING 38

Flowchart data mining orizzontale Identificazione sottosistema Dati disponibili Best maintenance practice Scelta del tipo di analisi Definizione KPI Identificazione dati e parametri Analisi del database storico Scelta della tecnica di analisi Risultati ottenuti Applicazione a nuovi database Validazione delle regole Regole on-line 39

Flowchart data mining verticale Identificazione sottosistema Dati disponibili Parametri di corretto funzionamento Scelta del tipo di analisi Identificazione della «firma» Setup dei parametri di «firma» Analisi dei dati Scelta della tecnica di analisi Proiezioni temporali Validazione delle regole 40 Applicazione a nuovi database Regole on-line

Conclusioni L analisi statistica dei dati può evidenziare comportamenti anomali e correlazioni tra parametri di processo e di ambiente utili ad ottimizzare, gli interventi manutentivi. Si possono ottenere importanti benefici, e senza nemmeno essere Il Mago dei Numeri 41