Exploração do Gestão de confiabilidade de serviços
Gestão de confiabilidade de serviços (SRM) fornece uma experiência guiada de autoatendimento para que as equipes gerenciem de forma autônoma a integridade de seus serviços técnicos. A experiência é criada usando a aplicação Espaço de operações de serviços e combina recursos de ITOM e ITSM em um único fluxo de trabalho de operações de serviços.
Visão geral SRM
- Use escalações de plantão para responder a problemas identificados pelo monitoramento e alertas de ITOM em tempo hábil.
- Reduza o atrito de configuração com o autoatendimento guiado para integrar equipes distribuídas com dados separados, acesso capacitado e governança mínima da TI central.
Quando SRM está ativado, vários plug-ins e aplicações também são instalados. Para obter mais informações, consulte Plug-ins ou aplicações instaladas com Integridade do ITOM.
SRM usuários
| Usuários | Descrição | Contém as funções |
|---|---|---|
| administrador |
Um administrador de ServiceNow é responsável pela administração, o desenvolvimento, a operação, a formação e a manutenção da plataforma da ServiceNow. Responsável pela instalação e pode executar a configuração da Central de administração da Espaço de operações de serviços de SRM. |
Todos |
| Administrador [srm_admin] Nota: Não a função de administrador da ServiceNow |
Os administradores de SRM podem gerenciar configurações e definições de conta e usuários. Os administradores podem executar as funções a seguir:
|
|
| Gerente [srm_manager] | Os gerentes supervisionam uma equipe de SREs. Os gerentes atribuem SREs à programação da equipe de plantão, monitoram seu desempenho, criam procedimentos para lidar com incidentes e desenvolvem soluções. Os gerentes garantem a resiliência em todos os sistemas e fluxos de trabalho de DevOps. Os gerentes podem executar as seguintes ações dentro do contexto de suas respectivas equipes:
|
Respondente |
| Respondente [srm_responder] |
Um Engenheiro de Confiabilidade de Serviço (SRE) que usa SRM para executar tarefas diárias. Os respondentes são os indivíduos que estão de plantão e diagnosticam e corrigem incidentes. Os respondentes só podem acessar as configurações das quais fazem parte. Eles só podem acessar os alertas ou incidentes para os quais têm permissão. Os SREs podem executar as seguintes ações no contexto de suas equipes:
|
Herda 17 funções, incluindo as seguintes:
|
Para obter mais informações, consulte SRM funções e responsabilidades.
Fluxo de trabalho do SRM
- As equipes de produto em TI ou linhas de negócios fornecem continuamente novos serviços técnicos e de aplicações. Exemplo: novo portal de faturamento do cliente.
- Junto com Gestão de SLO, as equipes têm acesso para se implementarem no SRM para registrar esses serviços e definir objetivos de nível de serviço (SLO) para garantir resultados de negócios. Exemplo: disponibilidade mensal de 95% para o portal de faturamento.
- As integrações de monitoramento são configuradas pelas equipes para coletar a integridade em tempo real desses serviços. Exemplo: observabilidade de nuvem.
- O monitoramento cria alertas de impacto do indicador de nível de serviço (SLI) quando os serviços estão com desempenho insuficiente. A automação agrupa e aprimora. Exemplo: a latência do portal de faturamento excede 7 s.
- Quando os alertas indicam uma indisponibilidade ou uma degradação que afeta o cliente, os incidentes são criados e as notificações de plantão notificam os recursos da equipe apropriados. Exemplo: uma equipe de SRE de faturamento é notificada por telefone sobre um problema de latência no portal de faturamento.
- Depois que os incidentes são diagnosticados e corrigidos de forma colaborativa, os itens de ação para melhorar a resiliência são capturados. Exemplo: a equipe de faturamento decide adicionar mais capacidade ao servidor web.
- A gestão revisa continuamente o desempenho do SLO, ajuda a evitar mudanças quando o limite de erros está esgotado e prioriza iniciativas de melhoria para serviços com desempenho insuficiente.
Benefícios das SRM
| Benefício | Recurso | Usuários |
|---|---|---|
| Experiência baseada em equipe | Trabalhando com equipes da SRM | Respondente, gerente e administrador de confiabilidade de serviço |
| Registro de serviço | Como trabalhar com serviços da SRM | Respondente, gerente e administrador de confiabilidade de serviço |
| Integrações pré-criadas | Trabalhando com integrações da SRM | Respondente, gerente e administrador de confiabilidade de serviço |
| Medir a integridade do serviço | Trabalhando com o Métricas de confiabilidade | Respondente, gerente e administrador de confiabilidade de serviço |
| Cobertura de plantão | Criar programação de plantão da SRM | Respondente, gerente e administrador de confiabilidade de serviço |
| Corrigir incidentes e alertas de gravidade alta | Trabalhando com tarefas de confiabilidade SRM | Respondente, gerente e administrador de confiabilidade de serviço |