이벤트 관리 운영자를 위한 경보의 개요

  • 릴리스 버전: Australia
  • 업데이트 날짜 2026년 03월 12일
  • 소요 시간: 3분
  • 이벤트 관리 운영자는 이벤트에서 경보가 생성되는 방식, 경보에서 확인할 사항, 경보를 그룹화하는 방법을 이해해야 합니다.

    튜토리얼의 이벤트 관리 첫 번째 단원입니다.

    레슨 1

    개요 아이콘

    이벤트 및 경보의 개요

    단원 2 BS 개요 아이콘

    애플리케이션 서비스의 개요

    제3과 개요 운영자 아이콘

    이벤트 관리 운영자 작업 공간

    제4과 운영자가 하는 일의 개요 아이콘

    운영자가 하는 일

    조직에는 이미 Microsoft SCOM(System Center Operations Manager), Nagios, SolarWinds 등의 이벤트 모니터링 도구가 있습니다. 컴퓨터가 다운되거나 데이터베이스 오류가 발생하는 경우처럼 네트워크에서 문제가 발생하면 이벤트 모니터링 도구는 인스턴스 ServiceNow이벤트를 보냅니다. 애플리케이션은 이벤트 관리 관리자가 구성한 설정에 따라 이벤트를 처리한 다음 경보를 생성합니다. 경보는 조치가 필요하다는 것을 나타내는 표시기입니다.

    그림 1. 경보 생성
    운영자 뷰 이벤트 관리

    운영자의 이벤트 관리 역할은 경보를 확인하고, 조직에서 구현되는 방식 이벤트 관리 에 따라 근본적인 문제를 해결하기 위한 조치를 취하거나 해결할 수 있는 사람에게 알리는 것입니다. 이 튜토리얼의 뒷부분에서는 일반적인 경보 관리 프로세스의 단계를 볼 수 있습니다.

    경보 우선순위 및 심각도

    경보의 가장 일반적인 두 가지 특징은 우선순위와 심각도입니다.
    • 경보의 우선순위 는 애플리케이션 서비스에 미치는 영향의 중요도를 확인하는 데 도움이 되는 점수입니다. 경보 우선순위 점수는 여러 요인에 따라 결정됩니다. 이벤트 관리 관리자는 애플리케이션이 우선순위를 계산하는 데 사용하는 알고리즘 이벤트 관리 을 구성할 수 있습니다.
    • 경보의 심각도 는 근본적인 문제의 심각성을 나타내는 지표입니다. 조직의 이벤트 모니터링 도구는 일반적으로 이벤트를 사용하여 심각도 값을 보내며, 이 값은 경보를 통해 전달됩니다. 이 튜토리얼에서 보게 될 기본 심각도 유형은 다음과 같습니다.
      심각도 설명

      자원 아이콘 중요

      자원이 작동하지 않거나 중요한 문제가 곧 발생합니다.

      기능 아이콘 주요

      주요 기능에 심각한 장애가 있거나 성능이 저하되었습니다.

      경미 아이콘 경미

      중요하지 않은 부분적 기능 손실 또는 성능 저하가 발생했습니다.

      경고 아이콘 경고

      자원이 여전히 작동하는 경우에도 주의가 필요합니다.

      확인 아이콘 확인

      심각도 없음. 경보가 생성됩니다. 자원이 여전히 작동하고 있습니다.

      지우기 아이콘 지우기

      경보에 대한 조치가 더 이상 필요 없습니다.

    상관 경보

    일부 경보는 서로 관련되어 있습니다. 예를 들어 라우터가 다운되면 라우터에 연결된 서버마다 하나씩 별도의 경보가 생성될 수 있습니다. 이러한 모든 경보는 서로 관련되어 있거나 상관관계가 있습니다. 상관 관계가 있는 경보를 관리하는 데 도움이 되도록 자동으로 경보를 그룹화하고, 이벤트 관리 맨 위에 기본 경보라고 하는 루트 경보 하나가 있고 기본 경보 아래에 보조 경보라고 하는 기타 관련 경보가 있는 2수준 계층 구조를 설정할 수 있습니다. 경보를 볼 때 기본적으로 기본 경보가 눈에 잘 보이게 표시되므로 보조 경보의 방해를 받지 않고 어떤 경보에 집중해야 하는지 알 수 있습니다.

    이 예에서는 라우터가 네트워크에서 다운되면 연결된 서버가 다른 라우터에 도달할 수 없다고 가정하여 연결된 서버의 네트워크 통신도 영향을 받습니다. 라우터 중단은 기본 경보가 되고 서버에서 생성된 경보는 라우터 경보 아래에서 상관관계가 지정된 보조 경보입니다.

    그림 2. 보조 경보 생성
    상관 경보

    조직의 이벤트 관리 구현 방식에 따라 관리자가 설정하는 상관관계 규칙에 따라 경보가 자동으로 그룹화될 수 있습니다. 또한 인스턴스는 이러한 규칙에 따라 경보의 상관관계를 개선하는 방법을 배울 수 있습니다. 운영자는 여전히 상관관계의 정확성을 확인하고, 필요한 경우 추가 경보와 기본 경보의 상관관계를 수동으로 지정해야 합니다. 이 작업을 수행하는 방법은 튜토리얼의 뒷부분에서 배웁니다.

    이 튜토리얼에서는 수동으로 경보의 상관관계를 지정하는 방법을 배웁니다.

    경보 플래핑

    경보는 플래핑이 가능합니다. 즉, 빠른 속도로 연속해서 여러 개의 열기-닫기 이벤트를 가질 수 있습니다. 플래핑은 근본적인 이벤트가 진짜인지 아닌지를 알 수 없음을 나타냅니다 이벤트 관리 . 이벤트는 CI 구성 방식에 대한 작은 문제 또는 네트워크 중단처럼 큰 문제를 나타낼 수 있습니다.

    그림 3. 경보 플래핑
    CPU 사용량

    예를 들어 웹 서비스를 호스팅하는 서버의 활성 프로세스가 너무 많으면 과도한 CPU 사용에 대한 이벤트가 트리거될 수 있습니다. 웹 서비스 요청에 따라 CPU 사용량이 급격하게 변할 수 있으므로 여러 이벤트가 트리거되어 경보가 플래핑 상태로 전환될 수 있습니다. 운영자가 서버를 다시 시작하는 인시던트를 만들거나, 다른 사람이 CPU를 다시 구성하거나, 장치의 하드웨어를 변경해야 할 수 있습니다.

    또 다른 예로 네트워크 케이블이 느슨하게 연결되어 일시적인 네트워크 중단이 반복적으로 발생하는 경우가 있습니다. 관리자가 구성하는 임계치가 이러한 종류의 경보 이벤트 관리 에 최적이 아닐 수 있으며 플래핑 경보로 간주합니다.

    튜토리얼 계속 진행

    다음 강좌로 진행합니다. 이벤트 관리 운영자용 애플리케이션 서비스