Monitoramento e observabilidade caminham juntas

Cristina De Luca -

Janeiro 27, 2022

Os ambientes tecnológicos estão sob uma pressão tremenda. Fatores externos mudam quase diariamente. As infraestruturas de TI, OT e IoT devem ser tão ágeis quanto os funcionários quando se trata dos serviços que oferecem.

Uma pequena mudança ou problema de infraestrutura pode ter um efeito significativo – na saúde, na qualidade do produto, no tempo de atividade do serviço e até na segurança das pessoas.  Ficar por dentro do que está acontecendo no seu data center e na sua rede e responder rapidamente às mudanças é também uma missão crítica.

Mas, como a gente não se cansa de dizer, é impossível monitorar e gerenciar o que não é visível e documentado. Você sabe realmente quais dispositivos estão em sua rede e quantos existem? Quais estão se comunicando ativamente e quais protocolos estão usando? Muitas vezes não fica claro quais dispositivos estão se comunicando com o quê ou com quem.

Além disso, em grandes ambientes há falta de transparência sobre o está realmente instalado. Quais versões do sistema operacional estão sendo executadas nas máquinas e dispositivos. Isso significa que vulnerabilidades permanecem não detectadas. 

Cada vez mais, as experiências digitais do cliente navegam em um ecossistema complexo e distribuído. O que parece tão simples quanto um usuário se conectar a um aplicativo é, na verdade, uma jornada complexa por redes domésticas, Internet, ambientes híbridos e multinuvem e redes de provedores SaaS. E pontos cegos nessa infraestrutura pode acabar prejudicando muito os negócios.

Visibilidade e observabilidade são essenciais ao bom funcionamento dos negócios hoje. E elas são alcançadas por meio de sistemas de monitoramento

A definição de monitoramento é bastante direta: a coleta e análise sistemática de dados para ajudar a manter a infraestrutura ou os aplicativos funcionando sem problemas. As ferramentas de monitoramento registram estatísticas de performance ao longo do tempo para que os padrões de uso possam ser identificados. Os agentes de monitoramento registram métricas selecionadas em intervalos definidos e armazenam os dados resultantes em um formato de série temporal.

O Monitoramento de Performance de Aplicativos (APM), por exemplo, permite monitorar a experiência do cliente de ponta a ponta, desde navegadores e dispositivos móveis até as várias camadas da pilha de aplicativos. O APM começa com o monitoramento de front-end – medindo e monitorando a experiência dos clientes a partir do navegador ou dispositivo móvel. No centro do APM, descoberta, rastreamento e diagnóstico de aplicativos, está a capacidade de identificar qual parte de um aplicativo está causando problemas de performance e localizar rapidamente o motivo.

O monitoramento de infraestrutura permite correlacionar métricas e logs de uma pilha de infraestrutura para compreender e resolver as causas raiz dos problemas de performance.

O monitoramento de experiência digital (DEM) fornece insights sobre a experiência do usuário final no envolvimento com o sistema, coletando atividades de seu navegador, aplicativo móvel ou interação de voz. As transações sintéticas envolvem a criação de scripts para emular o comportamento do usuário final ao interagir com um sistema, de modo que possa ser monitorado e testado mesmo quando não está sob carga real. O monitoramento real do usuário (RUM) combina o monitoramento da disponibilidade de um site ou API para receber solicitações de diferentes pontos de presença em todo o mundo, com testes A/B automatizados.

O monitoramento alerta sobre problemas conhecidos. A visibilidade vai além. É o processo de gerenciamento de problemas desconhecidos ou potenciais. Podemos pensar na visibilidade como o corolário do monitoramento. O monitoramento por si só permite que você encontre problemas depois que eles se transformaram em problemas. Em contraste, a visibilidade envolve o aproveitamento de dados de monitoramento, bem como outros conhecimentos de sistemas de TI, para prever e antecipar problemas de desempenho ou confiabilidade antes que eles surjam completamente.

A observabilidade, por sua vez, expande esse monitoramento e permite a correlação e a inspeção dos dados brutos para fornecer insights muito mais profundos. No cenário cibernético cada vez mais complexo de hoje, é mais importante do que nunca que as organizações possam analisar dados contextuais para tomar decisões informadas sobre sua política de segurança de rede.  

Definida de forma simples, observabilidade é uma medida de quão bem algo está funcionando internamente, concluído a partir do que ocorre externamente. A combinação certa de dados contextuais pode ser usada para obter uma compreensão mais profunda da implantação da política de rede e de cada aplicativo que tenta se comunicar pela rede. Com um recurso de observabilidade, os invasores terão dificuldade em tentar movimentos laterais ‘leste-oeste’ ou permanecer ocultos no data center ou na WAN. Por sua vez, a observabilidade pode fornecer uma visão global do ambiente de rede e uma prova visual de que a estratégia de segurança é eficaz e está funcionando. A observabilidade também pode ajudar a encontrar melhorias de performance em sua frota de nuvem, o que, por sua vez, permite reduzir custos.

A detecção oportuna de um problema (de preferência, antes que afete os usuários finais) é a primeira etapa da observabilidade. A detecção deve ser proativa e multifacetada, incluindo alarmes quando os limites de performance são violados, testes sintéticos e detecção de anomalias. 

Visibilidade e observabilidade acrescentam algo valioso às discussões sobre monitoramento.

Entender quais estratégias implementar começa com um parceiro de monitoramento que entenda completamente o funcionamento interno de suas operações de negócios. Que ofereça uma análise prática e detalhada de seus sistemas atuais e necessidades futuras, bem como uma abordagem proativa.

Se tudo passa pelo monitoramento, então, como escolher uma solução que melhor se adapte às suas necessidades de visibilidade e observabilidade? Um bom pontoe partida é avaliar 12 recursos essenciais.

1. Escalar junto com sua infraestrutura — As redes geralmente começam pequenas, mas crescem com o tempo à medida que novos sistemas, funcionalidades, dispositivos, aplicativos e até novas localizações geográficas são adicionados. A ferramenta de monitoramento selecionada deve poder ser dimensionada junto com sua rede.

2. Ser capaz de monitorar mais de um data center e redes distribuídas — Em um cenário realista de grande escala, geralmente há mais de um data center e, muitas vezes, várias localizações geográficas.

3. Ser independente do fornecedor — Grandes ambientes são heterogêneos, com dispositivos e sistemas de diversos fornecedores. Para reunir tudo em uma visão geral, a ferramenta de monitoramento deve ser compatível com o maior número possível de fornecedores e fabricantes.

4. Incluir suporte para todos os principais métodos, tecnologias e protocolos de monitoramento — Existem muitas maneiras de monitorar, e uma boa ferramenta de monitoramento deve fornecer o maior número de opções possível.

5. Oferecer  um amplo conjunto de recursos de monitoramento — O ideal é que você queira uma ferramenta que possa substituir várias ferramentas de monitoramento.

6. Ter um sistema de direitos e funções — É útil poder designar claramente usuários para equipes e responsabilidades, para que cada equipe possa ser responsável por sua própria parte da infraestrutura.

7. Fornecer gerenciamento de alerta avançado para reduzir o ruído de alerta — Em um ambiente grande, você precisa reduzir o número de alertas a um mínimo significativo.

8. Suportar protocolos específicos do setor, APIs abertas e modelos para scripts individuais para integrar tecnologias além da TI — Exemplos disso incluem o monitoramento de dispositivos médicos em um ambiente de saúde, máquinas em um chão de fábrica na fabricação ou configurações de IoT.

9. Integrar-se com outras ferramentas de monitoramento, visibilidade e observaabilidade — Se você deseja obter uma visão geral central, precisará consolidar dados de vários sistemas em uma visão central.

10. Integrar-se com soluções de BI — Para análises avançadas de dados de monitoramento, deve ser possível encaminhar dados para aplicativos de inteligência de negócios.

11. Permitir modelagem, rastreamento e relatórios de SLAs com base em serviços de negócios — Em um ambiente corporativo, você provavelmente tem contratos de nível de serviço internos que as equipes precisam cumprir e contratos de nível de serviço externos com clientes ou usuários. Estes precisam ser rastreados e relatados.

12. Ser Rápida e fácil de configurar — Você precisa ser capaz de começar a trabalhar o mais rápido possível e com um mínimo de esforço.

Isso porque, para fazer um bom trabalho com monitoramento e observabilidade, as equipes precisam ter:

  • Relatórios sobre a integridade geral dos sistemas (“Meus sistemas estão funcionando?”, “Meus sistemas têm recursos suficientes disponíveis?”)
  • Relatórios sobre o estado do sistema conforme a experiência dos clientes (“Meus clientes sabem se meu sistema está fora do ar e têm uma experiência ruim?”)
  • Monitoramento para as principais métricas de negócios e sistemas
  • Ferramentas para ajudar você a entender e depurar seus sistemas em produção
  • Ferramentas para encontrar informações sobre itens que você não sabia anteriormente (ou seja, é possível identificar o que não era conhecido)
  • Acesso a ferramentas e dados que ajudam a rastrear, entender e diagnosticar problemas de infraestrutura no ambiente de produção, incluindo interações entre serviços

As soluções de monitoramento e observabilidade foram criadas para:

  • Fornecer indicadores líderes de interrupção ou degradação do serviço;
  • Detectar interrupções, degradação do serviço, bugs e atividades não autorizadas;
  • Ajudar a depurar interrupções, degradação do serviço, bugs e atividades não autorizadas;
  • Identificar tendências de longo prazo para fins de planejamento de capacidade e negócios;
  • Expor efeitos colaterais inesperados de alterações ou adição de recursos.