La supervisión integrada es la característica más importante de AIOps

monitors in control room

agosto 04, 2023

La complejidad de los sistemas de TI y el continuo crecimiento exponencial de los datos de monitorización han impulsado la mejora de los conocimientos empresariales con AIOps, definido por Gartner como el uso de Big Data y Machine Learning para automatizar los procesos de operaciones de TI, como la correlación de eventos, la detección de anomalías, los análisis de rendimiento y la automatización real de los flujos de trabajo.

Según los cálculos de Research and Markets, estamos hablando de un mercado mundial que se espera que crezca de 5.820 millones de dólares en 2022 a 7.400 millones en 2023, con una tasa de crecimiento anual compuesto (TCAC) del 27,1%. Y se prevé que el mercado alcance una cifra estimada de 19.790 millones de dólares en 2027.

De cara al futuro, parece que el futuro de las TI está muy alineado con las AIOps y su capacidad para reducir los costes operativos y garantizar una mayor calidad del servicio, aumentando la satisfacción del cliente (interno y externo) al ayudar a ampliar la calidad del servicio y reducir el tiempo de inactividad.

Cómo empezar a implantar AIOps

No hay una receta fácil para implantar AIOps. Pero hay algunos aspectos básicos a tener en cuenta. IBM, por ejemplo, trabaja con tres: observabilidad, análisis predictivo y respuesta proactiva.

La observabilidad está relacionada con la recogida, agregación y análisis de datos operativos, generados por la monitorización. Se considera la base para el desarrollo de AIOps. La monitorización integrada se clasificó como la característica más importante de una solución de AIOps, citada por casi el 55% de los encuestados en un estudio reciente de OpsRamp. Las herramientas de supervisión siguen siendo el método ideal para detectar problemas de rendimiento o interrupciones de TI. Y en este caso concreto, el estudio descubrió que las empresas están haciendo un mejor trabajo a la hora de controlar la proliferación de herramientas, con más de la mitad de los encuestados (56,5%) con menos de 10 herramientas de monitorización. Sin embargo, un tercio de las empresas utiliza entre 10 y 19 herramientas y otro 10% tiene más de 20.

 Domain-centric IT infrastructure
monitoring tools is still the go-to approach for detecting performance issues or IT outages
Fuente: OpsRamp

Parte de las soluciones de IA añadidas se utilizan para analizar y correlacionar datos con el fin de obtener una comprensión más precisa para hacerse una idea básica del concepto de AIOps.

El análisis predictivo permite a los profesionales de TI mantener el control sobre procesos complejos y garantizar el rendimiento de las operaciones de TI. Ejemplos de prácticas de análisis predictivo son la detección de anomalías, las alertas, las recomendaciones y la optimización del rendimiento informático.

A partir de ahí, las soluciones de IA se utilizan para analizar y correlacionar datos con el fin de responder de forma proactiva a acontecimientos inesperados, en particular cortes o ralentizaciones. El objetivo es mantener el rendimiento de la infraestructura informática al tiempo que se planifican, programan y asignan recursos. Los algoritmos predictivos pueden reconocer patrones y tendencias en las métricas de rendimiento y así predecir y prevenir problemas antes de que surjan.

Al integrar múltiples herramientas manuales de operaciones de TI dispares en una única plataforma de operaciones de TI inteligente y automatizada, AIOps permite a los equipos de operaciones de TI responder de forma rápida y proactiva a las ralentizaciones e interrupciones con mucho menos esfuerzo.

Según el estudio OpsRamp, realizado en diciembre de 2022, más del 60% de los 265 niveles C encuestados ya estaban adoptando AIOps para mejorar la disponibilidad y el rendimiento de servicios y aplicaciones. En segundo y tercer lugar se sitúan la automatización de operaciones (58 %) y los procesos (54 %).

El mayor reto de las operaciones de TI en 2023 es automatizar tantas operaciones como sea posible, citado por el 66% de los encuestados. Sin embargo, solo la mitad de los encuestados (52%) citó la automatización de tareas tediosas como su principal beneficio operativo de las AIOps, situándose por detrás de la reducción de tickets de incidencias abiertos (65%) y la reducción de MTTD y MTTR (56%).

Las mejoras en la automatización son claramente las principales preocupaciones de las empresas en 2023.

La asignación de dependencias debe gestionarse en la fase de supervisión antes de poder adoptar AIOps.
Fuente: OpsRamp

Beneficios

La principal ventaja de AIOps es que permite a los equipos de TI identificar, abordar y resolver las ralentizaciones e interrupciones más rápidamente de lo que sería posible clasificando manualmente las alertas de diferentes herramientas de operaciones de TI. Esto se traduce en:

  • Tiempo medio de resolución (MTTR) más rápido: al diferenciar las alertas de las operaciones de TI y correlacionar los datos de operaciones de múltiples entornos de TI, AIOps puede identificar las causas raíz y proponer soluciones con mayor rapidez y precisión. Esto permite a las organizaciones establecer y alcanzar objetivos de MTTR antes impensables.

  • Reducción de los costes operativos: la identificación automática de problemas operativos y la reprogramación de las rutas de respuesta reducen los costes operativos, lo que permite asignar los recursos de forma más adecuada. Esto también libera recursos de personal para trabajar en actividades más innovadoras y complejas, lo que redunda en una mejora de la experiencia de los empleados.

  • Más observabilidad y mejor colaboración: La integración disponible en las herramientas de monitorización de AIOps permite una colaboración más eficaz entre los equipos de DevOps, ITOps, gestión y funciones de seguridad. La mejora de la visibilidad, la comunicación y la transparencia permite a estos equipos tomar mejores decisiones y responder a los problemas con rapidez.

  • Pase de la gestión reactiva a la proactiva y a la predictiva: gracias a las funciones integradas de análisis predictivo de datos, AIOps aprende continuamente a identificar y priorizar las alertas más urgentes, lo que permite a los equipos de TI gestionar los posibles problemas antes de que provoquen retrasos y tiempos de inactividad.

Por todas estas razones, el enfoque AIOps tiende un puente entre un panorama informático cada vez más complejo, dinámico y difícil de supervisar y las expectativas de los usuarios de una interrupción mínima o nula del rendimiento y la disponibilidad de las aplicaciones.

De qué preocuparse al elegir proveedor

La mayoría de los expertos consideran que las AIOps son el futuro de la gestión de las operaciones de TI y la demanda crece de forma constante con el aumento de la atención de las empresas a las iniciativas de transformación digital. Con la economía mundial enfrentándose a vientos en contra en varios frentes, como la inflación, la crisis del coste de la vida, el aumento de los tipos de interés y la guerra en Ucrania, muchas empresas se centran en mejorar la eficiencia y la automatización de las TI en 2023.

Estas organizaciones necesitarán ayuda (de proveedores de servicios) para mantener su infraestructura de TI en perfecto funcionamiento. ¿Qué deben buscar los clientes de AIOps en los proveedores? Principalmente eso:

  • Ser eficiente – Las organizaciones que buscan una visión profunda en tiempo real, con capacidades de autocorrección a través de pilas tecnológicas que van desde mainframe a móvil, no pueden permitirse deficiencias en ninguna de las diversas capacidades de AIOps. Las deficiencias significativas en incluso unas pocas funciones pueden hacer que una solución de AIOps sea limitada y requiera costosas integraciones que necesitan un mantenimiento regular. Las funciones nativas sólidas permiten reducir la deuda tecnológica, mientras que una amplia biblioteca de conectores de terceros listos para usar (OOTB) reducirá los costes de integración a medida.

  • Proporcionar capacidades de corrección automatizada transparentes y fiables – La corrección automatizada está limitada en gran medida por la falta de confianza de los compradores corporativos y las dudas sobre la transparencia de las soluciones de los proveedores. Las empresas están utilizando con éxito soluciones para automatizar tareas operativas y correcciones sencillas y repetitivas, pero están probando lentamente acciones más complejas para comprobar su fiabilidad. Una comprensión más profunda de cómo los motores de IA/ML aprovechan los datos sensoriales y telemétricos ayudará a aumentar la adopción de estas capacidades. Para que esto ocurra, las soluciones deben esforzarse aún más por disipar los temores exponiendo cómo toman las decisiones de automatización y en qué se basan, ganando la confianza para ejecutar de forma autónoma y habilitando vías para la adopción.

  • Proporcionar información desde el principio hasta el final de una transacción – Ya no basta con asignar servicios basándose únicamente en la infraestructura tecnológica. Para mejorar realmente la experiencia del usuario, reducir el tiempo medio hasta la resolución (MTTR) y el tiempo medio hasta la identificación (MTTI) y, en última instancia, permitir el crecimiento del negocio, los esfuerzos deben comenzar centrándose en la experiencia del usuario. La identificación de la degradación o las interrupciones del servicio debe hacerse desde la perspectiva de los usuarios, no sólo de la infraestructura. El contexto y los ciclos empresariales, los patrones de uso y las tendencias históricas son elementos de datos vitales para abordar de forma proactiva los posibles impactos negativos en la experiencia del usuario. Las soluciones deben actuar en consecuencia en tiempo real y proporcionar estos elementos a los equipos de arquitectura, desarrollo y diseño para introducir mejoras en los sistemas centrales.

Otras conclusiones clave del estudio OpsRamp

  • El mapeo de dependencias entre aplicaciones e infraestructuras es el principal reto de gestión de incidentes para las empresas, citado por el 64% del total de encuestados.

  • La alerta inteligente es el principal caso de uso de AIOps en la actualidad, adoptado por el 70% de las empresas.

  • La inmensa mayoría de las implantaciones de AIOps -más del 80%- duran seis meses o menos.

  • La exactitud de los datos fue la mayor preocupación de los encuestados sobre las AIOps, citada por el 62% de las empresas.

  • AIOps está creando puestos de trabajo, no acabando con ellos, aunque los ingenieros con las habilidades adecuadas para AIOps siguen siendo difíciles de encontrar. Solo al 36 % de los encuestados le preocupa que el despliegue de AIOps provoque pérdidas de puestos de trabajo, mientras que el 68 % afirma que se tarda más de seis meses en contratar ingenieros con las competencias adecuadas para AIOps.

“El estudio muestra que AIOps es real y ofrece beneficios tangibles a las empresas y MSP”, dijo Suresh Vobbilesetty, vicepresidente ejecutivo de ingeniería de OpsRamp. “Pero también muestra que las iniciativas de AIOps de las organizaciones siguen siendo un trabajo en curso y tienen un largo camino por recorrer antes de que puedan aprovechar todo el potencial de la tecnología”, añadió.