5 consejos para comenzar con la gestión de problemas

InvGate febrero 6, 2019
- 6 min read

La gestión de problemas es el proceso, o capacidad, de gestión de servicios de TI (ITSM) que se encarga de eliminar los problemas recurrentes al garantizar que se encuentre una solución a largo plazo. Bien hecha, mejorará los niveles de servicio y reducirá los costos, porque la gestión de problemas facilita el análisis de la causa raíz requerido, identifica soluciones (tanto provisorias como permanentes) y trabaja con otros equipos para garantizar que estas soluciones se entreguen de manera segura.

Tener un proceso formal de gestión de problemas, o una capacidad, es una necesidad si deseas que tu organización de TI ofrezca constantemente altos niveles de disponibilidad y rendimiento (y, por lo tanto, un mínimo de problemas de TI). Nuestro blog te brinda algunos consejos prácticos para comenzar con la gestión de problemas que irá más allá de nuestros blogs anteriores de ITSM 101.


1. Promueve la revisión de incidentes importantes

Hacer un seguimiento de los incidentes importantes es una excelente manera de hacer que tu proceso de gestión de problemas despegue.

Poner en práctica un enfoque estructurado para lidiar con las consecuencias de los principales incidentes es una ganancia rápida para la mayoría de las organizaciones de TI, ya que tendrás beneficios visibles en la identificación de la causa  raíz y las acciones preventivas para el futuro (además de comprender cómo se manejaron las actividades de la gestión de incidentes importantes). Y lo más probable es que esté relacionado con un área, o incidentes, que haya causado (y pueda seguir causando) problemas comerciales reales. A la empresa le importará que hayas tomado medidas para evitar que se repita.

Los datos que se deben obtener al revisar un incidente importante incluyen:

  • Descripción del incidente importante
  • Servicios afectados
  • Unidades de negocio y operaciones afectadas
  • El equipo resolutor
  • Número de incidentes relacionados
  • Detalles del cambio relacionados si es aplicable
  • Esfuerzo de solución
  • Solución final
  • Causa raíz
  • Acciones para prevenir la recurrencia

Luego, agrupar la información anterior en un documento breve le dará a la dirección una visión general valiosa de lo que salió mal, cómo se solucionó y los pasos necesarios para evitar que se repita.

Además, en lugar de tener que buscar desesperadamente información cuando preguntan "¿Qué sucedió?", tu equipo de administración tendrá una visión general coherente, idealmente escrita en lenguaje de negocios, que posiciona instantáneamente al soporte de TI en términos de capacidad de respuesta y profesionalismo.


2. Emplea soluciones alternativas (workaround)

Continuando con el tema de las victorias rápidas y mejorar la percepción que se tiene de TI, es importante utilizar la gestión de problemas para encontrar soluciones temporales a problemas comunes. Estos se denominan workaround, cuya traducción más certera podría ser "soluciones alternativas".  

¿Por qué a veces se necesitan estas soluciones?

No todos los problemas serán fáciles de diagnosticar y solucionar; ni se pueden resolver de forma permanente. A veces un problema es demasiado costoso para remediarlo, o la solución podría causar problemas con otro aspecto del servicio. A veces sucederá que no haya suficientes recursos para investigar problemas complejos.

Si este es el caso, en lugar de desanimarte, investiga si el problema puede ser evitado recurriendo a una solución temporal. Es algo que no solucionará todo para siempre, pero hará que los servicios y los usuarios vuelvan a estar en funcionamiento.

Los ejemplos de soluciones alternativas podrían incluir reinicios de mantenimiento para dispositivos de red más antiguos, agregar capacidad adicional a los servidores de archivos o buscar en la virtualización o el cambio de trabajos por lotes de rutina para que se ejecuten durante la noche para reducir la carga en la red.


3. Mantente siempre en el TOP (sí, lo ponemos en mayúsculas a propósito)

Todos hemos visto problemas que suceden una y otra vez. Desde que la red es lenta los lunes por la mañana, pasando por problemas de rendimiento de aplicaciones, que afectan a las empresas, hasta el tiempo de inactividad inesperado. La gestión de problemas debe ser la capacidad encargada de corregir a estas reincidencias.

Un enfoque que puede producir grandes resultados se es el puesto de observación técnica o TOP (por sus siglas en inglés).

TOP es un equipo de personas que se reúnen para analizar un incidente / problema en detalle; cada uno de los miembros de este equipo es de un área diferente. Si tienes un problema en el que estás atascado, considera armar un equipo TOP para que haya gente que lo vea desde múltiples ángulos.

Por ejemplo, las redes para ver cómo se enruta el tráfico, las aplicaciones desde una perspectiva de código y alguien del centro de datos para buscar hosting y almacenamiento. Este enfoque permitirá que el problema se investigue desde múltiples perspectivas, maximizando la eficiencia y la comprensión de la causa raíz para que pueda solucionarse o evitarse, en lugar de que el departamento de TI esté apagando incendios todo el tiempo.

CTA: Obtén más información sobre la gestión de problemas de InvGate

4. Sé proactivo

La gestión proactiva de problemas es el lado de la capacidad que intenta evitar que ocurran incidentes al identificar debilidades en la infraestructura y las operaciones de TI.

La gestión proactiva de problemas analiza los registros de incidentes y utiliza los datos recopilados por otros procesos de ITSM para identificar tendencias o problemas importantes. Esto se puede hacer de esta manera:

  • Trabajando con la mesa de servicio: pregúntales qué ven a través del proceso de gestión de incidentes día tras día.

  • Realizando análisis de tendencias: revisa incidentes anteriores y busca temas comunes o recurrentes por servicio y unidad de negocios.

  • Generando cambios para evitar que los incidentes se repitan o, mejor aún, que ocurran. Los ejemplos de cambios proactivos podrían incluir reinicios controlados del sistema, parches mensuales de seguridad, alertas de capacidad y monitoreo de la red.

  • Trabajando con equipos de soporte y gerentes de entrega de servicios: pregúntales qué no ha fallado todavía, pero que está en riesgo. Por ejemplo, equipos envejecidos o defectos en el código.

Hablando con tus clientes y comprendiendo los momentos críticos de la empresa para que puedas planificar en consecuencia. Ya sea participando con la gestión de la disponibilidad para garantizar que exista la capacidad de recuperación adecuada, la gestión de la capacidad para garantizar que se puedan mantener los niveles correctos de desempeño o la gestión de cambios para limitar o restringir los volúmenes de cambio. 

5. Entrega actualizaciones mensuales sobre el éxito de la gestión de problemas

Asegúrate de que tus esfuerzos de gestión de problemas y tus éxitos sean interactivos y visibles.

Celebra una reunión mensual e invita a un representante de cada área para que pueda obtener una actualización de estado y progreso para cada problema registrado. Con demasiada frecuencia, la percepción puede ser que las cosas han caído en un agujero negro una vez que el reloj del acuerdo de nivel de servicio (SLA) se ha detenido (debido a que un incidente se ha relacionado con un registro de problemas). Por lo tanto, una actualización periódica de cada problema y lo que se ha hecho para solucionarlo recientemente contribuirá en gran medida a aliviar estas inquietudes.

También usa esta reunión para promover el proceso y para seguir avanzando. Comunica a viva voz sobre las victorias rápidas y asegúrate de publicar una lista de problemas resueltos o mitigados para las partes interesadas del negocio que se han beneficiado de las actividades. Cuanto más se resuelvan los problemas de la gente, más confianza tendrán en el proceso.

 

Estos son nuestros cinco consejos para llevar la gestión de problemas al siguiente nivel. ¿Cuáles son los tuyos? Por favor, haznos saber en los comentarios.

Read other articles like this : Gestion de Incidentes

Evaluate InvGate as Your ITSM Solution

30-day free trial - No credit card needed