ITOM서비스 운영 작업 공간의 경보 자동화

  • 릴리스 버전: Yokohama
  • 업데이트 날짜 2025년 01월 30일
  • 읽기3분
  • 경보 자동화는 조직이 증가하는 경보와 복잡한 IT 인프라를 처리할 때 매우 중요합니다. 수동 경보 처리는 느리고 오류가 발생하기 쉬우며 비효율적이기 때문에 자동화 시스템의 필요성이 강조됩니다. 자동화를 통해 평균 경보 해결 시간을 단축하고, 서비스 안정성을 개선하고, 인력 자원의 규모를 개선할 수 있습니다.

    경보 자동화는 중앙 집중화된 관리자 역할과 분산된 팀 역할을 모두 지원합니다. 이렇게 하면 자격을 갖춘 팀이 셀프 서비스를 제공하고 자체 경보 자동화를 만들 수 있습니다. 예를 들어 SRE(사이트 안정성 엔지니어)에 대한 액세스 권한을 부여하는 것을 고려할 수 있습니다. 팀 구성원은 다른 팀에 영향을 주지 않고 자신의 팀과 자신의 경보에 대한 자동화를 관리할 수 있습니다.

    클래식 경험에 익숙한 사용자를 위해 경보 자동화는 이벤트 규칙, 태그 기반 클러스터링 정의 및 경보 관리 규칙에 대한 더 쉬운 사용자 인터페이스와 더 나은 팀 지원을 제공합니다. 일부 고급 기능은 현재 클래식 환경의 관리자만 사용할 수 있습니다. 이 두 환경은 동일한 백엔드 테이블을 사용합니다. 가장 편리한 환경을 사용할 수 있으며, 한 환경을 변경하면 다른 환경도 업데이트됩니다.

    그림 1. 경보 자동화 페이지
    보강, 그룹화 또는 에스컬레이션 및 알림을 위해 자동화를 생성하는 옵션이 있는 경보 자동화 페이지입니다.

    경보 자동화 유형

    현재 서비스 운영 작업 공간 ITOM은 다음과 같은 유형의 자동화를 제공합니다.

    1. 자동화 무시: 관련이 없거나 가양성 경보를 줄이고, 시끄러운 알림을 필터링하여 경보 피로를 효율적으로 관리하고, 팀이 중요한 문제에 집중할 수 있도록 합니다.
    2. 자동화 보강: 상황별 정보로 원시 경보를 개선하여 더 많은 정보와 실행 가능한 정보를 제공합니다. 간단히 말해서, 여기에는 모니터링 도구에서 생성된 원시 이벤트를 가져와서 자동화된 그룹화 및 응답을 지원하기 위해 공통 및 표준 형식으로 변환하는 것이 포함됩니다.
    3. 그룹 자동화: 여러 관련 경보를 하나의 기본 경보로 그룹화하여 경보 노이즈를 줄이고 근본 원인을 식별합니다.
    4. 자동화 대응: 적절한 이해 관계자에게 통지하여 경보에 자동으로 대응하거나, 필요에 따라 에스컬레이션하거나, 정정 작업을 실행합니다. 심각도 또는 유형을 기준으로 경보를 에스컬레이션하는 방법과 시기를 결정합니다. 외부 공급업체 시스템과 통합하여 케이스, 알림을 생성하거나 정정 작업을 실행합니다.

    경보 자동화 프로세스 흐름

    모니터링 시스템에서 통합 시작 패드를 사용하여 ServiceNow로 경보 또는 이벤트를 보내는 것으로 시작할 수 있습니다. 여기서 관리자는 ServiceNow와 모니터링 도구 간의 연결을 설정합니다. 이러한 통합을 통해 모니터링되는 데이터를 수집하여 외부 공급업체 소스에서 이벤트를 생성할 수 있습니다.

    ServiceNow에서 경보를 수신하면 페이지에 표시된 순서대로 경보 자동화가 실행됩니다. 첫째, 노이즈를 줄이기 위해 경보를 무시합니다. 다음으로, 추가 컨텍스트로 경보를 보강한 다음, 추가된 컨텍스트를 사용하여 경보를 그룹화합니다. 마지막으로, 정정을 에스컬레이션하거나 실행하여 경보에 대응합니다. 각 유형에 대해 여러 자동화가 있을 수 있습니다. 각 자동화는 특정 트리거 조건에 따라 실행되며 특정 작업을 실행합니다. 경보는 수신될 때만 자동화됩니다. 이전 경보에는 자동화를 적용하지 않습니다.

    경보 보강 단계에서 관리자는 경보에서 필요한 필드를 추가하거나 추출하여 신속한 해결을 위한 필수 정보를 제공합니다. 이렇게 하면 효과적인 인시던트 응답에 필요한 모든 관련 세부 정보가 경보에 포함됩니다. 관리자는 경보를 수정하고 정규화하여 컨텍스트를 추가합니다. 이렇게 하면 경보의 상관 관계가 향상되어 패턴과 잠재적 위협을 더 쉽게 식별할 수 있습니다.

    그런 다음 미리 정의된 기준에 따라 보강되고 구성된 경보가 그룹화되어 관련 경보가 통합됩니다. 이렇게 하면 경보 피로가 줄어들고 효율적인 수정이 용이해집니다. 마지막으로, 에스컬레이션된 경보는 다양한 채널을 통해 이해 관계자에게 알림을 트리거하여 중요한 경보에 적시에 전달하고 응답할 수 있도록 합니다.

    다음 다이어그램은 프로세스 흐름을 보여줍니다.
    그림 2. 경보 자동화: 노이즈 감소 및 해결 시간 단축
    노이즈를 줄이고 해결 시간을 개선하기 위해 경보 자동화가 작동하는 방법에 대한 다이어그램입니다.

    이 포괄적인 경보 자동화 프로세스는 경보 노이즈를 줄이고, 평균 해결 시간(MTTR)을 개선하고, 서비스 신뢰성을 향상시키고, 직원 생산성을 높일 수 있습니다.