ITSM 101: Consejos claves para la gestión de incidentes (parte 1)

InvGate mayo 24, 2017
- 8 min read

 El proceso ITSM de gestión de incidentes es un conjunto de actividades que garantiza que todos los problemas de IT (llamados “incidentes” por ITIL, marco de referencias de las mejores prácticas de ITSM) se registren y progresen de manera eficaz y coherente hasta la resolución. Esto sucede mientras se asegura de que nada se pierda, se ignore u olvide.

ITIL define la gestión de incidentes como el proceso responsable de  administrar el ciclo de vida de todos los incidentes para asegurar que la operativa normal del servicio se restablezca lo más rápidamente posible y que el impacto en las operaciones de negocio sea mínimo. En otras palabras, los gerentes de la gestión de incidentes son los superhéroes del mundo ITSM, que hacen hasta lo imposible para salvar el día y hacer que el negocio vuelva a funcionar cuando las cosas salieron mal. En este artículo veremos cómo la gestión y priorización de incidentes puede agregar valor a tu organización, junto con algunos consejos sobre cómo hacer que esto funcione eficazmente en la vida real.

En una adopción corporativa tradicional de ITIL (la gente tiende a no llamarla “una implementación" debido a que ITIL se trata de personas, así como de procesos y tecnología) el proceso de gestión de incidentes contiene los siguientes pasos:

  • Identificación
  • Registro
  • Categorización
  • Priorización
  • Diagnóstico inicial (matcheo de incidentes)
  • Escalamiento
  • Investigación y diagnóstico
  • Resolución y restablecimiento del servicio
  • Cierre
  • Monitorización, seguimiento y comunicación del incidente

Identificación

Identificación es la parte del proceso donde advertimos que algo no está bien o que no está funcionando como debería. ITIL define, textualmente, a un incidente como:

  • Una interrupción no planificada de un servicio de TI o una reducción en la calidad de un servicio de TI
  • Fallo de un elemento de configuración (CI, en inglés) que no ha afectado todavía al servicio

Existen varias maneras de detectar un incidente. En un mundo ideal, el monitoreo automatizado, realizado como parte de un proceso de gestión de eventos, identificaría el incidente y lo corregiría antes de que ocurra cualquier impacto en la comunidad de usuarios finales.

Dicho esto, lamentablemente, no vivimos en un mundo ideal. La realidad es que necesitamos  buscar otras formas de identificar incidentes, ya sea a través de los equipos de soporte o a través de nuestros usuarios finales / clientes.

Cuando un incidente es identificado por el personal de TI, el deber recae sobre la persona que garantiza que se genere un ticket por ese incidente, que trabajará con sus compañeros de la mesa de ayuda y otros equipos de soporte, para gestionarlo hasta que se llegue a la resolución.

En el caso de que un usuario final o un cliente identifique un incidente, la prioridad es que el agente de soporte obtenga un ticket que haya sido elevado y priorizado y que el incidente sea corregido lo antes posible. En algunos casos, la mesa de ayuda resolverá el problema y luego registrará los detalles en pos de ayudar más rápidamente al usuario final.

Consejo clave: separar los incidentes de las solicitudes de servicio para permitir una mejor priorización de las tareas y mejores reportes sobre el rendimiento operativo.

Registro

Esta es la parte del proceso donde el incidente es ingresado en un registro de incidente o un ticket de servicio. Una de las principales dificultades que vemos en torno al registro de incidentes está dada por los formularios excesivamente complicados dentro de la mesa de servicio o la herramienta ITSM.

En este sentido, una de las reglas de oro de cualquier metodología de mejores prácticas es que tiene que ser fácil hacer las cosas bien. Con esto en mente, el formulario de incidencia debe ser corto y directo, con menús desplegables, fáciles de usar y campos de texto editables.

Si bien a medida que vaya madurando nuestro proceso de gestión de incidentes, siempre podremos agregar más detalles, es recomendable que en el comienzo de la  gestión de incidentes, se haga foco en realizar las preguntas más críticas, para que el esfuerzo en solucionar los incidentes pueda iniciarse tan pronto como sea posible. Algunos ejemplos de preguntas incluyen:

  • ¿Qué está pasando?
  • ¿Qué impacto está causando esto?
  • ¿Hay alguien más afectado?
  • ¿Cuándo empezó?
  • ¿Hay algo que haya cambiado en tu dispositivo?

Consejo clave: recuerda que si bien registrar incidentes es importante para la gestión operativa, la gestión del conocimiento y la mejora del servicio, la prioridad es ayudar al usuario final a que pueda volver a trabajar rápidamente.

Obtén una prueba gratuita de InvGate

Categorización y priorización

Categorización y priorización son los pasos necesarios para garantizar que los equipos de resolución tengan las mejores chances de solucionar los incidentes en el primer punto de contacto.

El primer nivel de categorización debe ser realmente simple, a fin de que los usuarios finales registren sus incidentes de la manera más fácil que sea posible, especialmente cuando estamos hablando de un entorno de autoservicio. Por ejemplo, el primer nivel de categorización podría ser el siguiente:

  •   Hardware
  •   Software
  •   Network
  •   Voice

Siempre se puede agregar más complejidad a otros niveles, pero mantener el nivel inicial simple hará que sea más fácil para los usuarios finales y los analistas de la mesa de ayuda registrar incidentes con la categoría correcta y asignarlos al equipo de resolución adecuado.

La priorización es la parte del proceso que ayuda al equipo de resolución a manejar su carga de trabajo. Al establecer las prioridades de los incidentes, la mejor práctica recomienda que estés atento a:

  •   Impacto: el grado en que la prestación de servicios se interrumpió dentro de la organización y el efecto que esta interrupción tiene en otras áreas de la infraestructura.
  •   Urgencia: la velocidad con que el incidente debe ser resuelto.
  •   Esfuerzo esperado: la cantidad anticipada de energía,  tiempo y costos requeridos para poder empezar a restaurar los servicios luego de ocurrido el incidente.

Una priorización efectiva es clave para asegurarse que se está viendo y solucionando primero los incidentes que así lo requieren. Si tu herramienta de ITSM tiene incorporada una matriz de prioridad, úsala, si no, ten a mano una serie de preguntas estándar o construye tu propia matriz de manera que puedas asignar de modo sensible una prioridad a cada incidente, en lugar de ir por el lado de “si tienes alguna duda, marca la opción del medio”.

Consejo clave: evita los términos de prioridad alta / media / baja al momento en que el usuario final registra su incidente ya que es muy probable que para él siempre sea de suma urgencia. Una situación en la que todo es urgente provocará que se genere una cola de incidentes de alta prioridad y un equipo de soporte que no sabe qué arreglar primero.

Diagnóstico inicial (matcheo de incidentes)

Esta es la parte donde decides si el incidente puede ser solucionado en la primer línea o necesita ser escalado a otros miembros de soporte o a un equipo en particular. El diagnóstico inicial es como ingresar a la sala de urgencias de un hospital -lo habrás observado si alguna vez has tenido el infortunio de ir al departamento de emergencias- la primer persona que te recibe, luego de pasar por la recepción, es la enfermera que evalúa si puedes ser atendido y “remendado” allí o si necesitarás tratamiento adicional.

En un entorno de mesa de ayuda, el primer analista evalúa si se puede corregir de inmediato el incidente que se está reportando o si es necesario escalarlo al soporte de segundo nivel. Los scripts, las bases de datos de errores conocidos (KEDs) y las bases de conocimientos, pueden ayudar a mejorar la tasa de resolución en la primer respuesta.

Un modo fácil de mejorar la tasa de resolución del soporte de primer nivel es hacer que otros equipos de soporte participen en la reunión semanal de service desk, para que den sus mejores sugerencias para solucionar los problemas en el primer contacto con el usuario final. Las ventajas de este enfoque son dos: los agentes de la mesa de ayuda están preparados, capacitados y más comprometidos; y si hay más incidentes en la línea de frente, los equipos de segunda y tercera línea de soporte son libres de concentrarse en las cosas más difíciles.

Consejo Clave: tener un alto nivel de resolución de primer contacto se considera la mejor práctica de la industria, pero cuidado, las métricas dirigen comportamientos. Deberás estar atento a las que generen un comportamiento erróneo, en el que brindar una solución en la primer respuesta parece ser más importante  que la respuesta en sí.  Lo que el usuario quiere  es encontrar una solución adecuada, aún cuando esto no ocurra en el primer contacto.

Entonces, hasta aquí, hemos cubierto la identificación de incidentes, el registro, la categorización, la priorización y el diagnóstico inicial (matcheo de incidentes). Vuelve pronto para explorar la segunda parte de este blog donde veremos escalamientos, restablecimiento y cierre. Mientras tanto, siéntete libre de explorar nuestras funcionalidades de gestión de incidentes.

 

¿Cuáles son tus mejores consejos para la gestión de incidentes? ¡Por favor házmelo saber en los comentarios!

Conoce más sobre InvGate Incident Management

Read other articles like this : Gestión de servicios

Evaluate InvGate as Your ITSM Solution

30-day free trial - No credit card needed