Cómo elegir una herramienta de monitoreo de sitios web que se adapte a sus necesidades
Publicado: 2020-10-07Te despierta un tono de alerta y no estás seguro de la hora, pero está oscuro afuera y cuando comienzas a recuperar la conciencia, ves notificaciones que te inundan.
Algo ha bloqueado su aplicación y los usuarios en Europa están bastante perturbados. Ha pasado una hora sin respaldo, excepto que su gerente de servicio al cliente le pregunte obedientemente cada 15 minutos cuándo espera volver a la normalidad. Los dos observan cómo el resto de su equipo se despierta, recibe la noticia y comienza a señalar con el dedo.
Piensa que toda esta situación es evitable, ya que la cuarta hora de tiempo de inactividad llega a su punto máximo. Si tan solo algo nos hubiera advertido de nuestra muerte inminente.
Bienvenido al mundo de la supervisión de sitios web , donde el tiempo de actividad de la aplicación es la directiva principal. Tal vez no fue así como se apagó su fuego de las 3 am, pero si ha sobrevivido tanto tiempo en DevOps, ha tenido uno, y apostamos a que no fue agradable.
Si su objetivo es minimizar este tipo único de dolor, entonces estamos aquí para ayudarlo a hacer que las guardias apesten un poco menos con una guía fácil de leer que establece lo que necesita en un proveedor de monitoreo web .
Una guía integral para seleccionar una herramienta de monitoreo de sitios web
Comencemos con los fundamentos: monitoreo e informes. Al igual que las telepantallas que todo lo ven de 1984, el monitoreo aquí se refiere a la supervisión "externa" de sus operaciones. Los servidores de sondeo externos generalmente se usan para monitorear el estado de su aplicación.
La rendición de cuentas comienza con la supervisión, o más bien con la observación. ¿Qué puede aprender en función de lo que le dice su infraestructura?
Los informes cuantifican su responsabilidad, pero los buenos informes son subjetivos. A algunos les pueden gustar los datos sin procesar que pueden empaquetar en cualquier formato. Otros quieren que se entreguen informes automatizados, algunos pesados en números, otros que desean un enfoque más visual. La generación de informes es la otra cara de la supervisión y obtener estos dos elementos correctamente garantizará que su aplicación siga siendo accesible y que se cumplan sus acuerdos de nivel de servicio.
Cuanto mejor comprenda su infraestructura, más valor obtendrá de la supervisión. Los proveedores a menudo analizan los tipos de cheques para mantener los costos bajos. Comprender las necesidades de monitoreo web de su infraestructura es una buena fuente de ahorro de costos.
Supervisión e informes web para la rendición de cuentas
El monitoreo no se trata simplemente de atrapar a los gnomos de su servidor dormidos en el trabajo, debe decirle más que si el servicio está activo o inactivo. A través de las métricas de rendimiento, puede desarrollar una imagen clara de cómo funciona su infraestructura. Especialmente con controles más avanzados, como el monitoreo de usuarios reales (RUM), pero hablaremos de eso más adelante.
Consulte la página de estado de su proveedor y analice los datos de interrupción de los últimos seis a 12 meses. ¿El proveedor se cae con frecuencia? Su tiempo de actividad general y la gestión de incidentes deberían proporcionar pistas sobre su confiabilidad.
¿Qué tipos de verificación de monitoreo de sitios web son más útiles?
Antes de seleccionar un proveedor, desea evaluar sus necesidades. Responde a esto, ¿qué te despertaría en medio de la noche? Esa infraestructura debe estar entre los primeros componentes que configure cuando pruebe a los proveedores.
Cree una estrategia de plan de ataque para el monitoreo y haga una lista de sus servicios imprescindibles. Los proveedores de servicios que ofrecen planes fijos pueden ayudar o perjudicar aquí. Los buenos planes tienen en cuenta el tamaño de las empresas que los utilizan. Nunca está de más preguntar sobre sus opciones de actualizaciones y complementos para personalizar su plan.
Tal vez lo que provocó su búsqueda de un monitor web fue un error 404 o SSL, pero déjese espacio para experimentar y crecer. A medida que realice la prueba, sin duda encontrará formas adicionales de monitorear su sistema y utilizar sus asignaciones de cheques.

Comprobaciones básicas y sus funciones de monitorización web
Las verificaciones básicas generalmente hacen una sola cosa, como monitorear una sola URL o verificar los registros DNS. Estos tipos de verificación generalmente solicitan a alguien que busque monitoreo, generalmente después de que se ha producido una interrupción. Hacer esto bien es importante.
HTTP(S), SSL, DNS y Domain Expiry son algunas buenas comprobaciones básicas que se deben tener en cuenta porque estos son los tipos de interrupciones que el usuario final tiende a sentir. Estos controles también constituyen la columna vertebral de monitoreo de la mayoría de los usuarios empresariales. Los planes que solo incorporan estos tipos de cheques son sólidos planes de "inicio" para empresas nuevas y pequeñas.
Las comprobaciones de HTTP(S), a veces denominadas "supervisión web", supervisan el tiempo de actividad. SSL, DNS y la caducidad del dominio tienden a garantizar que la infraestructura crítica no falle por motivos evitables. Si su proveedor también incluye métricas de rendimiento, eso es una clara ventaja.
Asegúrese de que su proveedor admita la entrega de alertas donde lo necesite. Si tuviera un próximo vencimiento de SSL, sería útil sortear la burocracia y poner ese aviso directamente frente a la persona que puede pagar la renovación con tiempo suficiente para que renueve. Sería aún mejor si el problema pudiera escalar automáticamente a otra persona si se necesitara más experiencia.
Verificaciones avanzadas que todo equipo de DevOps debe considerar
Una verificación avanzada es aquella que usa datos reales del usuario o basa sus acciones en las acciones del usuario. Estos tipos de cheques complejos generalmente requieren un poco de esfuerzo de configuración. La recompensa puede ser monumental para las organizaciones que los utilizan.
Los tipos de verificación avanzada supervisan los embudos de navegación o los objetivos críticos, como iniciar sesión o comprar un artículo. Debido a que actúan como usuarios reales (o, a veces, extraen datos de ellos), estas comprobaciones ofrecen una imagen clara del rendimiento de su sitio en diversas condiciones.
¿Por qué invertir el esfuerzo para configurar estos tipos de cheques?
- Pruebas: visibilidad del rendimiento de nuevas funciones y actualizaciones mientras se genera una gran cantidad de datos históricos
- Primera respuesta: una página de pago que se cae puede significar que falla más de una sola verificación de HTTP(S). Qué falló y cuándo son buenos indicadores de por dónde empezar el diagnóstico.
Conozcamos a James y veamos cómo varios tipos de cheques resultan útiles:
James está lanzando un nuevo producto para su empresa, Edgeco. Este nuevo servicio requerirá su propio certificado de seguridad, junto con una nueva infraestructura. James implementará este servicio con monitoreo de usuarios reales para que aprenda más sobre la experiencia del usuario inicial. El monitoreo de SSL asegurará que cuando James pase a otros proyectos, su certificado tendrá medidas de seguridad para garantizar que no se olvide la renovación.
Con una verificación de HTTP(S) que supervisa esta URL, James y su equipo tienen capacidades de primera respuesta cuando se detecta un tiempo de inactividad. Al usar una verificación de transacciones, James puede probar flujos de usuarios críticos, como iniciar sesión en el nuevo servicio y usar sus componentes principales.
Debido a que James implementó Real User Monitoring, su servicio ha recopilado estadísticas de uso a lo largo de cada cambio que él y su equipo han realizado durante la vida útil del servicio. Dentro de seis meses, James tendrá suficientes datos para identificar problemas de rendimiento localizados en regiones específicas y dirigir a su equipo para que mejore en consecuencia. Las capas de comprobaciones ayudan a salvaguardar y simplificar la gestión de infraestructuras complejas.
Software de monitoreo web bueno para tener
Una vez que haya establecido los tipos de verificación que necesita, es hora de comenzar a comparar las funciones que es bueno tener para hacer su vida un poco más fácil. Hay una gran diferenciación aquí, ya que algunos proveedores ofrecen una página de estado o integraciones como ofertas "premium".
Informes públicos y privados
La visibilidad importa. ¿Quién puede verlo? ¿Lo entenderán los ejecutivos? ¿El público tiene acceso? Durante una interrupción, es probable que DevOps reciba presión interna y a través de los usuarios, por lo que los informes visibles tienen valor.
El soporte no funciona de forma gratuita. Cada ticket de soporte, incluso con una macro/respuesta rápida, requiere tiempo. Alguien tiene que enviar el ticket, dejar de trabajar en otra tarea y responder. Aumente su base de usuarios en cientos de miles o millones de usuarios, y el soporte puede perder días enteros de productividad enviando la misma respuesta repetitiva a las preguntas sobre si está arriba o abajo. Los informes visibles crean una plataforma para responder preguntas y reducir la tensión en la respuesta de soporte.
El beneficio secundario son los mensajes, porque una noticia equivocada puede destruir su reputación. Cuando estás frente al desastre, enfocándote en la transparencia, te conviertes en la fuente de noticias. Eso es infinitamente mejor que estar a merced de una industria impulsada por controversias de clics.
Facilidad de uso y valor
Todo, desde el monitoreo y la generación de informes, se ve muy bien. ¿Qué pasa con el costo de instalación ? Al igual que su equipo de soporte, sus ingenieros tampoco trabajan gratis. Hay un costo de configuración incluso para probar un proveedor, así que tómese el tiempo para evaluar todos sus requisitos.
La facilidad de uso se refiere a cualquier cosa, desde la configuración de la cuenta hasta la incorporación de nuevos usuarios. Durante su prueba, es posible que se concentre en lo básico y en ponerse en marcha lo antes posible; proyecto a largo plazo y considere cómo los usuarios interactuarán con el sistema.
Si está cambiando de proveedor, también es útil tener una función de importación/exportación donde puede transferir fácilmente cientos de cheques.

El software de inicio de sesión único (SSO) es un buen ejemplo, ya que ofrece un grado de seguridad a su empresa y facilita su adopción por parte de los usuarios. La documentación de soporte y el uso general pueden ayudarlo a conocer la accesibilidad del software. Puede considerar invitar a otro usuario a probar y configurar algunas comprobaciones, o recuperar informes, para probar cómo funciona el sistema desde todas las perspectivas.
Personalización y observabilidad
Consideremos el caso de uso empresarial promedio, donde más de 100 monitores no están fuera de discusión. ¿Cómo se ven los informes para este tipo de configuración? Masivo, es una palabra. Enrevesado, tal vez otro. Más de cien de cualquier cosa será difícil de rastrear, por lo que crear observabilidad a partir del monitoreo web también debe tener en cuenta lo que necesita ver para hacer su trabajo. La forma en que su proveedor maneja la visibilidad le dice mucho sobre su negocio principal.
Algunas características útiles a tener en cuenta incluyen etiquetas, en las que puede codificar con colores o usar el equipo o la convención de nomenclatura interna para organizar los cheques. También puede tener preferencia por trabajar en la línea de comando, en cuyo caso la API es una característica importante que debe buscar. Solo asegúrese de preguntar sobre cualquier límite potencial que deba tener en cuenta al considerar sus opciones.
Los tableros dan visibilidad interna
Una forma de abordar este problema de volumen es proporcionar un espacio centralizado para la gestión de cheques. Si es del tipo al que le gusta la visión general y el acceso instantáneo a métricas clave, los paneles le brindan la visibilidad que anhela. Los bonos aquí incluyen la posibilidad de compartir. ¿Usted o su equipo pueden diseñar tableros a los que pueda cambiar sobre la marcha? ¿Puede controlar el acceso o asignar paneles específicos a usuarios específicos?
Las páginas de estado de marca brindan confianza
La mayoría de las empresas valoran la transparencia, por lo que las páginas de estado son otra buena opción. La confianza no se manifiesta. Combinar su página de estado y monitoreo ofrece simplicidad. Si usa un proveedor para cada uno de estos servicios, necesita tener alguna capa intermedia que ayude a fomentar la comunicación entre los dos. Por lo general, eso significa que alguien tiene que crear componentes meticulosamente o escribir un script. Incluso entonces, es probable que esté extrayendo datos a un servicio autohospedado que puede correr los mismos riesgos de interrupción que su sitio web.
Una experiencia perfecta entre su página de estado y su sitio web se ve profesional. Sin embargo, debe incluir la gestión de incidentes en su rutina de respuesta, incluidas las actualizaciones periódicas de su página de estado durante una interrupción o una ventana de mantenimiento.
También hay páginas de estado internas diseñadas para mantener la información según sea necesario. Las personas ajenas a su equipo de TI pueden tener visibilidad sobre el tiempo de inactividad crítico. Cuando ocurre una interrupción, las páginas de estado internas se convierten en un centro de actualización de toda la empresa.
Alertas y observabilidad
Los acuerdos de nivel de servicio tienden a tener umbrales integrados que señalan cuándo es el momento de reaccionar ante un problema. Estos “presupuestos de error”, le permiten a su equipo dormir por la noche. Las alertas, y lo que contienen, marcan la diferencia entre un tiempo de respuesta de cinco y 60 minutos.
Una buena alerta es instructiva. Las alertas pueden contener códigos de estado, correcciones sugeridas o dirigirlo a recursos útiles como el análisis de alertas. Las mejores alertas indican que está ocurriendo un problema real y le dicen cuál podría ser ese problema. "Está inactivo" versus "Está informando un error 500" apuntan a problemas muy diferentes.
Alertas y detalles
Demasiado vago y es probable que los desarrolladores pierdan cabello buscando el problema, pero rara vez hay un problema con ser demasiado específico. Pruebe los sistemas de alerta minuciosamente. Si planea cambiar de proveedor, realice un ejercicio de día de juego usando el sistema de alerta. ¿Qué información se proporciona a su equipo? ¿La alerta ayudó con su diagnóstico?
Si planea varias interrupciones, ya sea como ejercicios para el día del juego o pruebas extendidas, puede aprender mucho sobre cómo funciona su sistema de monitoreo. ¿Se intensifican las alertas? ¿Qué pasa con las ventanas de mantenimiento en lugar de las interrupciones? ¿Puede su sistema diferenciar?

Entrega de alertas
Regresemos a nuestro caso de uso de Edgecom. James está monitoreando su servicio cuando recibe un ping en su canal de Slack. Una interrupción de HTTP(S) indica que su blog está inactivo. James puede etiquetar a la persona responsable del blog, quien rápidamente investiga el incidente. Resulta que un número inusual de cargas de página es la causa.
El equipo se pregunta si una publicación reciente se volvió viral. James detecta un ataque inminente y amplía los servidores para mejorar la capacidad. Efectivamente, sus acciones son parte de una cadena de eventos que ayudan a repeler un ataque DDoS destinado a derribar su sitio principal.
La moraleja aquí es que las alertas enviadas a su equipo pueden conducir a un diagnóstico y a una casualidad inesperada. Sin alertas significa dolor. Dolor terrible.

El monitoreo web se trata realmente de análisis
No pase por alto el valor del historial de alertas. Es probable que los usuarios devops experimentados tengan un sentido sobrenatural para los desastres. ¿Cómo perfeccionan ese sentido? Observando las causas de un desastre y documentándolas cuidadosamente.
Escalamientos y flexibilidad
Digamos que James ya no es DevOps Spider-Man, y sus sentidos sobrenaturales no están a la altura. El ataque DDoS derriba algunos servicios. ¿Qué puede hacer un proveedor de monitoreo para ayudar?
Las escaladas y el mantenimiento son un buen comienzo. Si su proveedor lo permite, las ventanas de mantenimiento pueden brindar flexibilidad para responder a las interrupciones y alertar a los usuarios. Ya sea que el mantenimiento sea o no un factor en su SLA, es útil cuando puede programar ventanas de mantenimiento de rutina y enviar actualizaciones a sus usuarios avanzados.
También pierde menos tiempo barajando la responsabilidad y escalando internamente si traza sus límites de antemano. ¿Cuánto tiempo es demasiado tiempo para un apagón? Escalar después de la marca de cinco o diez minutos es un buen lugar para comenzar, ya que las interrupciones más prolongadas significan que algo anda realmente mal. Los sistemas de alerta que automatizan las escalaciones eliminan las conjeturas, lo que permite que su equipo trabaje sin preocuparse de cuándo notificar a los niveles superiores.
Monitoreo web de usuario real y sintético para capturar la experiencia del usuario
Deje de depender de los informes de los usuarios que pagan a los probadores beta (sus clientes) y capture la experiencia del usuario de primera mano. El monitoreo de usuarios reales generalmente requiere algún código, como un píxel de seguimiento, pero la recompensa son los datos reales del usuario de sesiones reales. Si alguna vez se ha preguntado qué está viendo su usuario, el monitoreo de RUM es una adición útil a su conjunto de herramientas.

Monitoreo sintético
El monitoreo sintético viene en dos sabores, típicamente: API y transacción. Los cheques de transacciones son exactamente lo que parecen. Ponen a prueba embudos de objetivos y proporcionan capacidades de primera respuesta para transacciones críticas. Sea el primero en enterarse de problemas con su carrito de compras, formularios de registro, inicios de sesión y más.
Las verificaciones de API son útiles para examinar los puntos finales que impulsan el lado de automatización de su servicio. Puede GET, PUSH, PULL, PATCH o DELETE con la mayoría de los proveedores, lo que permite una variedad de posibilidades para el monitoreo de puntos finales. Puntos de bonificación si puede establecer y recuperar variables.
El soporte es un factor invisible en el monitoreo web
Son las 2 am y su monitoreo web está disparando alertas de izquierda a derecha. ¡Necesitas ayuda! Necesita análisis y explicaciones. El soporte receptivo de su proveedor demuestra su valor cuando encuentra un error que no puede ver o no puede replicar.
Cuando necesite ayuda, es importante que haya un equipo dispuesto a trabajar con usted. Las primeras interacciones de soporte son una buena indicación de la calidad del servicio. ¿Cuánto tardan los agentes en responder a un ticket? ¿Cuál es la calidad de su respuesta y qué documentación pueden proporcionar? ¿Qué tipos de soporte están disponibles, como soporte telefónico o por chat? Cuando un proveedor oculta el botón de contacto, eso podría ser una señal de alerta.
Documentación
La documentación debe ser exhaustiva, incluir ejemplos y proporcionar instrucciones paso a paso. Si su proveedor usa código en su documentación, es una buena señal de que sabe de lo que está hablando y se lo toma en serio. Puntos de bonificación para los proveedores que desarrollan conjuntos de herramientas externas, extensiones de navegador y más para ayudarlo a crear su sistema de monitoreo.
Comprometerse con un proveedor de monitoreo web
El monitoreo y los informes son los componentes más importantes para decidir sobre su proveedor, pero la lista de funciones útiles puede simplificar su trabajo y mejorar la supervisión. Recuerde, el objetivo de una alerta es la primera respuesta. Si su alerta se pierde en el éter y nadie puede reclamarla, ¿realmente sucedió el incendio?
El software de monitoreo web es parte de un compromiso importante que usted hace con su base de clientes. Dice que te preocupas por brindar un servicio y que tus usuarios pueden confiar en que estarás ahí para ellos. Tomarse ese compromiso en serio significa reflexionar sobre cuál de estos requisitos es más relevante para su organización.