경보 분석 및 해결 상태 로그 분석

  • 릴리스 버전: Yokohama
  • 업데이트 날짜 2025년 01월 29일
  • 읽기2분
  • 근본 원인을 파악하기 위해 로그 데이터를 조사하여 경보를 분석하고 해결합니다 상태 로그 분석 . 그런 다음 근본적인 문제를 해결하기 위한 조치를 취하십시오.

    경보 분석 및 해결 상태 로그 분석 개요

    운영자는 에 의해 상태 로그 분석생성된 경보를 분석하고 해결할 책임이 있습니다. 는 경보를 만들 때 HLA 경보의 심각도, 영향을 받는 CI(구성 항목), 예외와 연결된 로그 데이터, 영향을 받는 서비스를 검토합니다. 예외를 둘러싼 로그를 조사하여 근본 원인을 식별하려고 합니다. 로그 뷰어를 사용하여 타임스탬프 또는 범위별로 경보 로그를 찾아보고 차트에서 예외 로그 라인의 빈도를 시각화할 수 있습니다. 또한 로그 관련자를 사용하여 경보 간의 상관 관계를 탐지할 수 있습니다. 경보의 근본 원인을 확인한 후에는 문제를 해결하는 데 필요한 단계를 수행하여 시스템 상태를 보장하고 서비스 중단을 최소화합니다. 예를 들어, 문제 해결에 도움이 될 수 있는 정보를 제공하기 위해 자체 지식베이스(KB) 문서를 경보에 추가할 수 있습니다.

    그림 1. 경보 해결 워크플로우
    • 개요 탭에서 경보 정정 로그 분석 시작

      경보 개요 탭에서 경보 정정 프로세스를 상태 로그 분석 시작합니다. 이 탭은 경보, 예외 동작과 관련된 로그 데이터, 경보와 연관된 CI 및 경보의 영향을 받는 서비스에 대한 정보를 제공합니다.

    • 예외 주변의 로그 분석

      이상 징후 주변의 로그를 검토하여 결함 있는 시스템의 상태에 대한 단서를 찾습니다. 이 정보는 문제의 근본 원인 범위를 좁히는 데 도움이 될 수 있습니다.

    • 로그 뷰어에서 경보에 대한 로그 검토

      로그 뷰어 탭을 사용하여 타임스탬프 또는 시간 범위별로 경보 로그를 찾아보고 기간 내의 예외 빈도를 시각화합니다. 지정된 시간 범위에 걸쳐 로그 데이터에 대한 포괄적인 뷰를 제공하여 근본 원인을 조사하는 데 도움이 됩니다.

    • 로그 관련자를 사용하여 로그 데이터의 관계 식별

      경보 간의 관계를 식별하면 경보가 더 큰 문제의 일부인지 여부를 확인하는 데 도움이 됩니다.

    • 경보에 KB 문서 추가

      예를 들어, 에서 생성한 상태 로그 분석경보에 자신의 지식베이스(KB) 문서를 추가하여 문제를 해결하는 데 도움이 될 수 있는 정보를 제공합니다.

    경보 생성과 관련된 작업

    아래에 설명된 작업을 수행하여 경보를 생성하고 우선순위를 지정하고, 예외를 식별하고, 중요하지 않은 문제에 대한 경보를 삭제하여 노이즈를 줄이는 방법을 상태 로그 분석 제어할 수 있습니다.