Cuando hablamos de observabilidad, nos referimos a un conjunto de prácticas y herramientas que deben implementarse para que los equipos puedan, en un ecosistema de aplicaciones y arquitecturas que son cada vez más complejas y distribuidas, ver qué está sucediendo allí. Esta observación no se da desde la infraestructura o los servidores, sino que supone una mirada más integral, desde el negocio, atravesando cada uno de los componentes y piezas de tecnología que hacen que el mismo funcione.
Además, la gran oportunidad de la observabilidad es incorporar una mirada de analítica, inteligencia y automatización a los procesos para entender, jerarquizar y priorizar todos los puntos de alerta y, de esta manera, anticiparse a los problemas que puedan experimentar los clientes.
La observabilidad surge como respuesta a la necesidad de evolucionar el monitoreo tradicional, en especial para infraestructuras muy grandes o complejas, como las que suelen gestionar las distribuidoras de contenido audiovisual, conocidas como plataformas de streaming. Para este tipo de plataformas se vuelve imprescindible evaluar ante, por ejemplo, la caída de un servidor, cómo esto impactará en la experiencia del usuario: si no le “carga” una película o serie, si se le frena, o si, efectivamente, no tiene un impacto en el usuario final.
Desde la mirada de la observabilidad, la prioridad estará puesta en el impacto real que una contingencia de este tipo tendrá en la usabilidad y qué medidas deberán tomarse para evitarlo, en lugar de poner foco en aspectos muy puntuales de la infraestructura que quizás no tengan un impacto en el negocio. Mejorar la eficiencia, la productividad y la satisfacción de los usuarios se vuelven protagonistas.
Nos ubicamos en otro lugar de observación y evaluamos el comportamiento, sacamos otro tipo de conclusiones más integrales y tomamos decisiones más complejas. Ese comportamiento implica observar muchos componentes que se pierden de vista en el monitoreo tradicional.
En el universo de las plataformas de contenidos vía streaming, la observabilidad se vuelve más necesaria: hay extrema competencia y una carrera voraz por captar y retener usuarios. El costo de cambio es muy bajo por lo que es vital garantizar una buena experiencia de uso. La observabilidad lo hace posible, al permitir observar la usabilidad y el contenido, esto es, si nos enfrentamos a transmisiones de baja calidad, si hay cortes, si el tiempo de carga del contenido es tolerable o no, y más.
La competencia salvaje y la facilidad con la que los usuarios pasan de una plataforma a otra, lleva a estas compañías a invertir mucho dinero en contenido. Apuesta que debe estar acompañada por un foco fuerte, también, en la observabilidad, para asegurar una experiencia de usuario de calidad y sin contratiempos.
Es importante incorporar transversalmente la observabilidad desde etapas muy tempranas del desarrollo de soluciones. Esta implica el monitoreo tradicional pero también otras cuestiones novedosas, como la telemetría, el A/B testing, canary deployments, probing, el testeo caótico. Estas prácticas deben embeberse muy temprano, en el momento del desarrollo.
IA y observabilidad
La observabilidad se puede nutrir de tecnologías de avanzadas como machine learning y deep learning para ordenar ese enorme caudal de información, jerarquizarla, extraer insights, generar diagnósticos en tiempo real y proponer cursos de acción preventivos o correctivos -de acuerdo al nivel de avance del problema-, todo eso con la menor participación humana posible.
Con el advenimiento de la inteligencia artificial y, más puntualmente, de la IA generativa, la observabilidad adquiere aún mayor relevancia, al implementarse soluciones que tienen detrás modelos aún más complejos. La incorporación de la inteligencia artificial generativa (IAG) en los ecosistemas de observabilidad permite a los usuarios a cargo de esta tarea poder interactuar y tomar decisiones que puedan ser correctivas.
El esfuerzo de la puesta en práctica de la observabilidad valdrá la pena: según estimaciones de Nubiral, el tiempo de diagnóstico de un problema podría reducirse hasta en un 80%. En palabras de la vida real: lo suficiente como para evitar una caída en el sistema.
Autor: Javier Minhondo, Business Solution Architect de Nubiral