O que é Observabilidade?

O que é Observabilidade?

24 de maio de 2022 Wesley Willians

Observabilidade é um conceito que varia de acordo com quem fornece esse tipo de serviço. Porém, você pode entender a ideia principal sobre este tema através de quatro princípios que serão explicados nesse artigo.

1) Uptime

O primeiro princípio é o Uptime, que se refere à garantia de que a nossa aplicação está no ar. E, como bons desenvolvedores, devemos ter um sistema simples de monitoramento para nos certificarmos de eventuais problemas ou erros que possam acontecer.

2) Logs

Antigamente a pasta de logs do servidor era acessada apenas quando surgia algum problema. Mas, devido à elasticidade das situações, com a constante atualização e fechamento de máquinas, os logs não podiam ficar dentro de um servidor que era destruído a cada momento.

Por isso foi necessário um sistema que centralizasse os logs num único local, já que eles caracterizam muitas coisas em relação ao sistema. Não somente a erros e vulnerabilidades, mas como tentativas de ataque, entre outras coisas.

Atualmente podemos contar com diversas ferramentas que nos ajudam a gerenciar todo o processo de logs, mas ainda é necessário um sistema ou agente para guardarmos tudo isso num servidor. Normalmente um sistema desse tipo precisa de um dashboard para consultarmos os nossos logs, etc.

Outro detalhe é que os microsserviços normalmente enviam e recebem solicitações constantemente entre si, então é comum surgir algum problema eventualmente. Mas nessa situação os logs facilitam a nossa rastreabilidade permitindo que, baseado numa solicitação, seja feita uma varredura completa para descobrirmos o que há de errado.

3) Métricas

Além dos registros, as métricas podem nos ajudar a otimizar as aplicações e infraestrutura do nosso sistema. E existem dois tipos de métricas principais quando se trata de observabilidade.

  • Técnica

As métricas da parte técnica se referem à velocidade do sistema, à memória do servidor e o estado do CPU, entre muitos clusters e Kubernetes que estão em operação. Essa métrica tem a ver com infraestrutura.

  • Negócio

São informações das áreas de vendas e marketing, que geralmente tratam a tomada de decisões do negócio. Inclui: quantidade de vendas por hora; quantos usuários colocaram o produto no carrinho; quantos desistiram da compra; quantas páginas foram visitadas, etc. Também serve para detectar anomalias como a queda de vendas e outros indicadores sugerindo que algum problema grave está acontecendo.

Dada a relevância das métricas é importante nos certificarmos das necessidades de escalar o sistema e de como está o uso da CPU, considerando todas essas informações de infraestrutura para garantir que tudo vai funcionar corretamente e que não estamos à beira de um colapso, por exemplo.

4) Ferramentas de Rastreabilidade

Com as métricas nós também podemos trabalhar com ferramentas de APM (Application Performance Monitoring), que servem para monitorarmos a performance do sistema.

E com rastreabilidade é possível acompanhar uma request do início ao fim, mesmo passando por diversos microsserviços. Com isso, você é capaz de verificar erros, tempo de resposta em cada parte da request e até mesmo ter acesso as queries executadas no banco de dados.

A APM pode checar erros típicos que impactam o negócio, como: gargalos nas páginas, falhas nas chamadas de CSS ou a lentidão num SQL. E, entre essas checagens, também podemos incluir os níveis de método, caso isso deixe a sua aplicação lenta a ponto de atrapalhar as métricas de negócio.

Alarmes

E não basta contarmos com os melhores dashboards se ninguém pode observá-los integralmente; nós precisamos receber alarmes baseados no problema quando algum erro se apresentar.

Definitivamente a Observabilidade não se resume nas terminologias que precisamos memorizar a fundo; mas em entender que nós precisamos ter uma visão muito clara do que está acontecendo com a nossa aplicação.

Unindo, então, os pontos citados nesse artigo, pode-se dizer que você tem Observabilidade.

Curtiu esse post? Se você quer aprender mais sobre como esse conceito pode transformar sua operação, clique aqui, solicite contato e nós te ajudamos.

Assista ao vídeo completo no nosso canal do youtube ou voltando ao começo dessa matéria.