Explorando Observabilidade de serviços
Observabilidade de serviços ajuda as equipes de operações a triar e gerenciar incidentes em um sistema de produção complexo e distribuído. Ele combina a telemetria de sistemas externos de monitoramento de desempenho de aplicações (APM) com dados relacionados no Configuration Management Database (CMDB). Ele exibe ambos em um único fluxo de trabalho no Espaço de operações de serviços (SOW).
Visão geral Observabilidade de serviços
Observabilidade de serviços exibe métricas de integridade no SOW relacionadas a um determinado serviço. As métricas podem ser ingeridas de um sistema APM externo e exibidas ao lado das métricas para itens de configuração relacionados no CMDB.
- Dynatrace
- New Relic
- MySQL
- PostgreSQL
Depois de conectar uma instância do APM a Observabilidade de serviços, mapeie os serviços registrados em CMDB para as métricas de APM usando marcadores existentes nos dados de APM.
Com este mapeamento de dados, Observabilidade de serviços pode exibir métricas em um só lugar de entidades de APM associadas ao seu serviço, como um host ou banco de dados, junto com informações de ICs relacionados. Os operadores usam as métricas de APM, informações de IC relacionadas e informações contextuais úteis, como incidentes atuais e alertas relacionados ao serviço, para entender a integridade do serviço.
Por exemplo, digamos que você use Dynatrace para monitorar o serviço de check-out e as métricas do banco de dados e do host usem o marcador check-out-service para denotar solicitações provenientes desse serviço. Ao mapear o IC de serviço de check-out para os dados de APM marcados com check-out-service, Observabilidade de serviços recupera métricas desses bancos de dados, hosts e ICs relacionados ao serviço e os exibe juntos. Os operadores podem identificar problemas em entidades relacionadas ao serviço e restringir o processo de mitigação sem precisar sair do SOW.
Observabilidade de serviços usuários
| Usuário | Descrição |
|---|---|
| Administrador do sistema | Os administradores do sistema configuram usuários e equipes, registram serviços a serem monitorados, conectam Observabilidade de serviços a APMs e mapeiam esses serviços para esses dados. Eles também podem exibir os dados no SOW |
| Administrador | Observabilidade de serviços Os administradores podem registrar serviços únicos a serem monitorados. Eles também podem exibir os dados no SOW. |
| Operador/gerente de operações | Os operadores usam Observabilidade de serviços ao fazer a triagem de incidentes no SOW. Eles podem exibir métricas básicas de integridade de um serviço, junto com incidentes, alertas e mudanças relacionados. Eles podem obter informações mais detalhadas navegando até a guia Observabilidade para exibir métricas de serviço adicionais, junto com métricas de entidades relacionadas, como um host ou banco de dados. |
Fluxo de trabalho do Observabilidade de serviços
Os administradores configuram Observabilidade de serviços registrando serviços, conectando métricas de APM e mapeando os serviços para esses dados. Os operadores usam Observabilidade de serviços para determinar se outra entidade relacionada está causando problemas apresentados pelo desempenho do serviço.
Como administrador do sistema, você:
- Determine os serviços a serem monitorados por Observabilidade de serviços com base na criticidade dos negócios e registre esses serviços.
- Conecte instâncias de APM existentes a Observabilidade de serviços.
- Mapeie serviços registrados com dados de métrica de APM com base em marcadores baseados em APM usados nesses dados.
Como operador ou gerente, você:
- Identifique um problema com um serviço enquanto trabalha no SOW, por exemplo, em um alerta, no painel Serviço ou Lista expressano , navegue até a página Detalhes do serviço.
- Exiba as métricas gerais de integridade do serviço, junto com incidentes, alertas e mudanças relacionados. Se uma das métricas não estiver íntegra, navegue até a guia Observabilidade.
- Visualize métricas de serviço mais detalhadas, bem como informações de entidades relacionadas, para iniciar a investigação de causa raiz. Ao descobrir que o problema está mais abaixo na pilha do sistema, identifique a propriedade dessa entidade para iniciar a correção.
Benefícios do Observabilidade de serviços
| Benefício | Recurso | Usuários |
|---|---|---|
Centralize sinais críticos e una fluxos de trabalho para aumentar a agilidade e a confiabilidade:
|
. | Administradores |
| Aumente a eficiência e reduza o tempo médio de resolução (MTTR) exibindo métricas combinadas de entidades associadas a um serviço para determinar o raio de alcance e a propriedade de um incidente. | Exibir métricas de integridade de serviço | Operadores |
| Veja as mudanças relacionadas ao sistema e os alertas associados a um serviço em um só lugar. | Exibir a integridade geral do serviço. | Operadores |