ITIL Best Practices: dall Operation al Service Management L esperienza TIM 30 Novembre 2005 Sandra Foglia, Francesco Muscuso 1
d i gi t a l IBM d i g i t a l Data General Il contesto: IT Operations Area Cliente Archit Sviluppo Collaudo Service Manager (crm, vas, prep, postp,dwh) SA BO AM Infrastructure Operations Cross support DSI/ES Sistemi 2
Miglioramento dei processi di IT Operations Fase I: Assessment servizi Analisi di alcuni servizi dell area di Gestione Applicativa della struttura di Operations, al fine di verificare la conformità dei processi di Service Management al modello ITIL (Information Technology Infrastructure Library) Fase II: Problem Management Analisi dell attuale processo di gestione e degli strumenti a supporto, per la definizione di un piano di evoluzione del processo di Problem Management, in sinergia con le strutture di Service Management. 3
Fase I: Assessment servizi Attività svolte Identificazione di un sottoinsieme rappresentativo di servizi Adattamento questionario di assessment ITIL per i processi di: Incident Management, Problem Management, Change Management, Configuration Management, Release Management, Service Level Management Interviste di assessment Rilevazione dei dati quantitativi dallo strumento di tracciamento delle attività Associazione dei dati ai relativi processi Analisi risultati / sintesi 4
Fase I: Assessment servizi Vantaggi del metodo adottato Coinvolgimento e sensibilizzazione del personale, durante la presentazione dei questionari e le interviste, sull importanza dell uso di metodologie e di strumenti Confronto puntuale tra le Practices in uso in TIM e Best Practices internazionali Confronto omogeneo di dati qualitativi e quantitativi sui processi Veloce estrapolazione dei risultati su tutti i servizi 5
Fase I: Assessment servizi Risultati Aderenza ai processi del modello ITIL: Sono implementati in TIM i processi di:» Incident Management» Problem Management» Release Management» Configuration Management» SLA Management Aree di miglioramento: Ottimizzazione dell Incident Management come prerequisito per il Problem Management con conseguente miglioramento dei processi di:» Problem Management» Configuration Management 6» SLA Management
Fase II: Problem Management Possibili benefici Risoluzione definitiva degli Incident ricorrenti: Diminuzione del numero di Incident e dei relativi impatti sull interruzione e/o degrado dei servizi Predisposizione di Soluzioni definitive, con conseguente riduzione dell utilizzo di workaround e fix temporanee e degli indicatori di difettosità dei sistemi Disponibilità Knowledge Base (accesso a Known Errors, Workaround, Soluzioni permanenti): Diminuzione tempo di gestione Incident Maggior numero di Incident risolti al 1 livello di supporto Maggiore affidabilità delle risposte Maggiore soddisfazione degli Utenti Maggiore aderenza agli SLA Diffusione della cultura dell approccio preventivo e non solo reattivo, imparando dall esperienza passata 7 Miglioramento della qualità dei servizi IT, con benefici per i processi di business
Fase II: Problem Management Attività svolte Analisi dello scenario AS IS e della sua aderenza al modello ITIL: Verifica del processo di Incident Management in ottica di Problem Management Le strutture dati degli strumenti di supporto (Sistema di Trouble Ticketing/Catalogo Servizi, Sistema di Change e Configuration Managment, Sistema di Request Management) e la loro aderenza alle entità previste da ITIL in ottica di CMDB e di Problem Management Analisi dati storici su servizi campione 8 Analisi dello scenario TO BE per il miglioramento dei processi di supporto al Problem Management: Le strutture dati per il Problem Management Impatto sui processi Modalità di rollout Impatto sugli strumenti (dati, funzionalità, interfacce) Benefici previsti Misura dei risultati
Fase II: Problem Management Risultati Analisi Piano di evoluzione per il Problem Management relativo a: processi: Evoluzione del processo di Incident Management nell ottica del Problem Management. Revisione del processo di Problem Management strumenti di supporto: Definizione delle specifiche funzionali per l evoluzione dello strumento di supporto al Trouble Ticketing e delle sue interfacce con gli altri sistemi. 9
Segnalazione da Utenti tramite: 119 (CCRM) STT Rete Utenti interni (Help Desk) Dealer (Help Desk) Siti Web (Content Provider, Consociate Estere, Enti esterni) 10 Fase II: Problem Management Workflow Incident, RFC, Change Help Desk B.O. 1 Livello B.O. 2 Livello Sviluppo / Collaudo STT Reclamo Incident RFC/Change Segnalazione da Sistemi Monitoraggio: STT Trouble Ticket STT Scheda Anomalia SRM Richiesta Attività SCCM Comunicazione a Sviluppo SCCM Scheda Modifica SCCM Scheda Rilascio RIL Segnalazione da Sviluppo/Collaudo (Fuori Standard): Utenti STT Segnalazione Disservizio
Fase II: Problem Management Il CMDB per il Problem Management DB STT Incidents Problems DB SCCM DB Modulo Gestione Attività RFC/Changes Releases DB Catalogo Servizi DB SRM Configuration Items (CIs) Relazioni tra i CIs Known Errors Soluzioni Relazioni tra i CIs ed altri oggetti 11 Nuovi oggetti Oggetti ampliati
Fase II: Problem Management Il processo di Problem Management Controllo del Problema Controllo dell errore Identificazione problema Classificazione problema Investigazione Diagnosi Identificazione errore Analisi errore Emissione RFC Chiusura problema Incident ricorrenti Problem Root Cause Analysis Known Error RFC/Change Soluzione definitiva Workaround Fix temporanea Analisi dei Trend Prevenzione proattiva dei Problemi 12
Fase II: Problem Management Impatto sui processi e miglioramenti Esiste un impatto sul processo on line di Incident Management: Nella fase di apertura e di lavorazione del Reclamo e del Trouble Ticket: inserimento dati di categorizzazione, utilizzo dei dati di categorizzazione per ricercare eventuali Known Error, Workaround, Fix temporanee, Soluzioni Miglioramento del processo di Problem Management off line : gestito da risorse dei gruppi di Back Office, principalmente di 2 livello, Attività: Analisi dei dati storici degli Incident, correlati tramite i dati di categorizzazione, per identificare i problemi Controllo del problema: trovare la root cause del problema Controllo dell errore: monitorare i known errors ed emettere le RFC Gestione del problema proattiva: prevenire gli Incident attraverso il miglioramento dell infrastruttura 13
Fase II: Problem Management Risultati attesi Diminuzione numero Incident Diminuzione tempo di gestione Incident Maggior numero di Incident risolti al 1 livello Minor numero di ore/uomo necessarie (sia al 1 sia al 2 livello) Diminuzione costi 14 Miglioramento della qualità del servizio mediante l utilizzo dell effort risparmiato per attività di Problem Management che inducano interventi preventivi