경보 영향 계산
영향 계산은 CI, 서비스, 경보 및 경보 그룹에 대한 중단 규모를 보여줍니다. 시스템은 영향 규칙 및 CI 관계와 같은 요소를 사용하여 생성된 경보의 심각도를 계산합니다. 심각도는 영향 트리, 애플리케이션 서비스 맵 및 대시보드에 표시됩니다.
- 영향 규칙
- 관련된 활성 경보 수입니다.
- 영향을 받은 CI의 과거 기록입니다.
- 특정 애플리케이션 서비스에 대한 CI 간의 관계입니다.
- CI 요소에 네트워크 또는 저장소 장치가 포함되는지 여부
- 유지관리 상태의 CI에 대한 경보는 영향 계산에서 제외됩니다.주:
- CI는 활성 변경 요청이 예약된 경우뿐만 아니라 CI의 상태 필드가 유지관리 중으로 설정된 경우에도 유지관리 중인 것으로 간주됩니다.
- 자식 CI가 유지관리에 포함되면 상위 CI도 유지관리에 배치됩니다.
- 기본적으로 영향도는 작동 중인 모든 애플리케이션 서비스에 대해 계산됩니다. 그러나 시스템에서는 서비스 클래스 또는 개별 애플리케이션 서비스별로 영향 계산을 필터링할 수 있습니다. 자세한 내용은 영향 계산을 위한 테이블 또는 클래스 추가 CMDB 및 영향 계산을 위해 애플리케이션 서비스 추가 문서를 참조하십시오.
서비스 간에 연결이 있으면 한 서비스가 다른 서비스에 미치는 영향도 계산됩니다.
영향을 계산하는 방법
영향 계산은 애플리케이션 서비스의 CI 관계에 따라 다릅니다. 변경 요청, 네트워크 경로, 저장소 경로 및 관련 CI와 같은 추가 요인은 모두 영향 계산에 영향을 줍니다.
- 서비스
- 다음 영향 계산 플로우는 중단이 네트워크 또는 네트워크 저장소에 영향을 미치지 않는 경보에 대해 작동합니다. 이벤트 관리 은 다음 단계를 수행합니다.
- 서비스 맵을 생성합니다. 서비스 구성 항목 연결 [svc_ci_assoc] 및 CI 관계 [cmdb_rel_ci] 테이블을 사용하여 애플리케이션 서비스에서 하위-상위 관계를 만듭니다.
- 서비스에서 CI로의 CMDB 경로가 없지만 svc_ci_assoc 테이블에 연결이 나타나면 애플리케이션 서비스와 CI 사이에 종속 관계를 표시합니다. 그렇지 않으면 연결 없음을 표시합니다.
- 애플리케이션 서비스의 경우, 서비스에 할당된 CI가 CMDB의 서비스에도 연결되어 있으면 맵은 CMDB에 나타나는 대로 CI 간의 계층 구조를 유지합니다. CI 서비스 할당은 양식의 애플리케이션 서비스 서비스 구성 항목 연결 섹션에 나타납니다. CMDB의 서비스에 연결되어 있지 않으면 CI가 맵의 애플리케이션 서비스 바로 아래에 나타납니다.
- 영향 트리를 만듭니다. 중단 규모를 100% 다운됨, 60% 영향을 받음, 40% 손상됨 또는 20% 손상됨으로 표시합니다. 둘 이상의 클러스터에 있는 항목이 영향을 받을 경우 영향은 100% 다운됨입니다.
- 변경 요청 및 유지관리 중 상태
CI에 대해 활성 변경 요청이 예정되어 있거나 CI 설치 상태 가 유지관리 중인 경우 영향을 받는 CI의 모든 경보가 영향 계산에서 제외됩니다. 또한 경보 탭은 해당하는 모든 경보를 일시적으로 숨깁니다. 영향 트리에는 CI가 (유지관리 중) 메모와 함께 녹색으로 표시 됩니다. 영향 트리와 서비스 맵에서 CI를 임시로 녹색으로 표시합니다.
주:- CI는 활성 변경 요청이 예약된 경우뿐만 아니라 CI의 상태 필드가 유지관리 중으로 설정된 경우에도 유지관리 중인 것으로 간주됩니다.
- 자식 CI가 유지관리에 포함되면 상위 CI도 유지관리에 배치됩니다.
서비스의 경우 서비스의 CI에 대한 모든 경보도 경보 탭에서 숨겨집니다. 전체 서비스는 영향 트리에 녹색으로 표시됩니다. 활성 변경 요청이 있는 호스트의 경우, 호스트 애플리케이션은 하나의 단위로 간주됩니다. 모든 하위 애플리케이션은 변경 요청이 더 이상 활성 상태가 되지 않을 때까지 호스트와 동일한 방식으로 처리됩니다. 자세한 내용은 다음 문서를 참조하십시오 유지관리 중인 CI에 대해 경보가 작동하는 방식.
- 네트워크 경로
- 네트워크 중복성을 고려하여 별도의 이벤트 관리 영향 계산을 사용합니다. 애플리케이션 서비스에서 네트워크 토폴로지 또는 경로 변경 내용을 볼 수 있습니다. 다음 영향 계산 플로우는 네트워크 경로에 영향을 주는 경보에 대해 작동합니다. 이벤트 관리 은 다음 단계를 수행합니다.
- 영향을 받는 네트워크에 대한 애플리케이션 서비스 맵을 생성합니다.
- 경보의 호스트 ID 및 대상 IP 정보와 네트워크 경로 [sa_network_paths] 테이블의 네트워크 경로를 사용합니다.
- 구성 항목 [cmdb_ci] 테이블에서 파생되는 네트워크 경로의 요소를 사용합니다. 또한 요소에 대한 인프라 경로[sa_infra_path_assoc] 테이블에서 경로에 연결된 요소를 사용합니다.
- 관계를 설정합니다. 애플리케이션 CI는 CI 관계 [cmdb_rel_ci] 테이블에 정의된 경로에 있는 요소에 대해 Depends on::Used by 관계를 갖습니다. 관계에서 애플리케이션 CI는 상위이고 네트워크 경로의 요소는 자식입니다.
- 경로의 각 일반 요소에 대해 별도의 심각도를 계산합니다. 경로의 각 일반 요소는 상위 항목(경로가 시작된 애플리케이션 CI까지)에 자체 심각도를 기여합니다.
- 영향을 받는 CI의 심각도를 한 수준 낮춰서 중복 규칙을 사용하여 경로의 모든 중복 요소를 계산합니다. 예를 들어 심각도 Critical가 인 경우 중복 규칙은 심각도를 한 수준씩 낮춥니다 Major.
- 영향 트리를 만듭니다. 중단 규모를 100% 다운됨, 60% 영향을 받음, 40% 손상됨 또는 20% 손상됨으로 표시합니다. 둘 이상의 클러스터에 있는 항목이 영향을 받을 경우 영향은 100% 다운됨입니다.
- 영향을 받는 네트워크에 대한 애플리케이션 서비스 맵을 생성합니다.
- 저장소 경로
- 저장 장치 중복성을 고려하여 별도의 이벤트 관리 영향 계산을 사용합니다. 애플리케이션 서비스에서 네트워크 저장소 토폴로지가 변경되면 영향 트리 업데이트를 볼 수 있습니다. 이벤트 관리 는 저장소 CI를 포함하는 경보에 대해 다음 단계를 수행합니다.
- 영향을 받는 저장 장치에 대한 애플리케이션 서비스 맵을 생성합니다.
- sa_fs_to_storage_path 테이블에서 저장 장치를 사용합니다. 저장 장치 정의는 경로의 파일 시스템 정보를 사용합니다.
- 구성 항목 [cmdb_ci] 테이블에서 파생되는 저장소 경로의 요소를 사용합니다. 또한 요소에 대한 인프라 경로 [sa_infra_path_assoc] 테이블에서 경로에 연결된 요소를 사용합니다.
- 관계를 설정합니다. 애플리케이션 CI는 CI 관계 [cmdb_rel_ci] 테이블에 정의된 경로에 있는 요소에 대해 Depends on::Used by 관계를 갖습니다. 관계에서 애플리케이션 CI는 상위이고 저장소 경로의 요소는 자식입니다.
- 경로의 각 일반 요소에 대해 별도의 심각도를 계산합니다. 경로의 각 일반 요소는 상위 항목(원래 애플리케이션 CI까지 경로)에 자체 심각도를 기여합니다.
- 중복 규칙을 사용하여 영향을 받는 CI의 심각도를 한 수준 낮추는 방법으로 경로의 중복 요소를 계산합니다. 예를 들어 심각도 Critical가 인 경우 중복 규칙은 한 수준씩 낮아집니다 Major.
- 영향 트리를 만듭니다. 중단 규모를 100% 다운됨, 60% 영향을 받음, 40% 손상됨 또는 20% 손상됨으로 표시합니다. 둘 이상의 클러스터에 있는 항목이 영향을 받을 경우 영향은 100% 다운됨입니다.
- 영향을 받는 저장 장치에 대한 애플리케이션 서비스 맵을 생성합니다.
- 관련 CI
CI에 대해 경보가 생성되면 관련 CI에 대해 추가 영향 계산이 실행됩니다. 예를 들어 추가 영향 계산은 실제로 애플리케이션 서비스의 일부가 아닌 CI에 대한 애플리케이션 서비스 종속성에 대해 실행됩니다. 이러한 관련 CI는 서비스의 일부로 검색되지 않습니다. 대신 인프라 관계 정의에 따라 관련 CI가 지정됩니다.
다음 영향 계산 플로우는 애플리케이션 서비스 외부에서 고려되는 관련 CI에 대한 종속성이 있는 CI의 경보에 대해 작동합니다. 이벤트 관리 은 다음 단계를 수행합니다.- 애플리케이션 서비스 CI와 관련 CI 간의 관계를 도출합니다. 인프라 관계 [em_impact_infra_rel_def] 테이블의 관계, 영향 규칙 및 기타 데이터를 사용합니다.
- 대시보드의 영향 트리 및 경보 목록에 관련 CI를 추가합니다.이벤트 관리
- 인프라 관계 [em_impact_infra_rel_def] 테이블의 데이터를 사용하여 호스트에 대한 제약 링크를 표시합니다.
- 영향 상태[em_impact_status] 및 경보 이력[em_alert_history] 테이블을 사용하여 상태를 결정합니다.
영향 규칙
영향 계산에 사용되는 영향 규칙은 영향을 받는 CI를 기반으로 중단의 규모 또는 심각도를 예상합니다.- 애플리케이션 클러스터 구성원
- 애플리케이션 클러스터 구성원이 클러스터의 전반적인 영향도에 어떤 영향을 주는지 결정합니다. 예를 들어, 구성원이 셋인 클러스터가 전체 클러스터의 심각도를 중요로 설정하기 위해 90%의 영향을 필요로 하는 경우 각 구성원은 30%의 영향을 받습니다(90을 3으로 나눈 값). 세 구성원 모두가 심각도가 중요인 경우에만 전체 클러스터의 심각도를 중요로 변경할 수 있습니다. 클러스터별로 서로 다른 영향 규칙을 구성할 수 있으므로 하위 CI가 (동일한 하위 CI에 대해) 상위 CI에 대한 영향 전파가 달라질 수 있습니다. 따라서 수동으로 CI 그룹(일명 수동 클러스터)을 생성하고 클러스터 수준에서 클러스터 하위를 향한 다운스트림의 영향 규칙을 구성할 수 있습니다.
그림 2. 클러스터별로 동일한 하위 CI가 상위 클러스터에 영향을 다르게 전파하는 예 위 예에는 두 가지 엔트리포인트가 있습니다. 오른쪽에 있는 Osaka 클러스터에는 CI가 3개 있습니다. 왼쪽에 있는 Tokyo 클러스터에는 CI가 2개 있습니다. Tokyo 및 Osaka 백업 서버는 상위 항목(Tokyo 클러스터 및 Osaka 클러스터)을 공유합니다. 오른쪽 패널에서 Tokyo 클러스터에는 각각 50%의 영향을 미치는 2개의 애플리케이션 클러스터 구성원이 있고 Osaka 클러스터에는 각각 34%의 영향을 미치는 3개의 애플리케이션 클러스터 구성원이 있는 영향 트리를 볼 수 있습니다.
수동 클러스터 구성에는 애플리케이션 영향과 애플리케이션 클러스터 구성원이라는 두 개의 행이 있습니다. 영향 대상 필드가 애플리케이션 서비스가 아닌 상위로 선택되었으므로 하위 항목이 표시됩니다. 애플리케이션 클러스터 구성원 행에서 영향 필드는 2로 구성되어 있습니다. 이는 실패하는 최소 하위 항목 개수(그리고 상위 항목에 실패를 전파하는 최소 개수)가 2개임을 의미합니다. Osaka 클러스터는 3으로 구성되어 있습니다. 각 클러스터의 Tokyo 및 Osaka 백업 서버의 비율은 서로 다릅니다(50%와 34%). Tokyo와 Osaka 백업 서버 장애는 '매우 심각'이지만 상위 항목에 미치는 영향은 서로 다릅니다. Osaka 클러스터 실패는 주황색의 중요이지만 Osaka 클러스터는 녹색으로 유지됩니다.
서비스 또는 CI를 클릭하면 이와 관련된 경보가 표시됩니다. 예를 들어 높은 수준의 애플리케이션 서비스를 클릭하면 경보를 선택할 때 이와 연결된 경보가 맵 뷰의 경보 영역에 표시됩니다. 나열된 경보는 선택한 서비스의 경보입니다. 이러한 서비스를 선택하면 하위 서비스에 대한 경보가 나열됩니다.
영향을 선택하면 다음 영향 필드가 표시됩니다.
- 포함
- 포함 관계인 엔터티에 대한 영향을 결정합니다. 이 규칙은 읽기 전용입니다.
- 인프라 의존성
- 인프라 관계에서 CI에 대한 영향 전파의 정의를 결정합니다.
- CI 애플리케이션 서비스
- 애플리케이션 서비스의 일부인 상위 또는 하위 엔터티에 영향도가 적용되는 방식을 결정합니다.
- CI 영향
- 애플리케이션 서비스에 적용됩니다. 서비스 구성원 간의 관계를 결정합니다. 하위 CI에서 상위 CI로의 영향도는 항상 100%입니다. 예를 들어 상위 영향 심각도는 심각도가 가장 높은 하위 CI에서 파생됩니다.
- 애플리케이션의 상위 CI
- 상위 엔터티에 대해서만 영향도를 설정합니다.
- 네트워크 경로
- 기존 네트워크의 일부인 상위 또는 하위 개체에 영향도가 적용되는 방식을 결정합니다.
- OS 클러스터 구성원
- 호스트 클러스터 구성원이 클러스터 구성원의 백분율 또는 수에 따라 전체 클러스터 상태에 어떤 영향을 미치는지 결정합니다. 예를 들어 호스트가 셋인 클러스터가 심각도를 중요로 설정하기 위해 60%의 영향을 필요로 하는 경우 각 구성원은 20%의 영향력을 갖습니다(60을 3으로 나눈 값). 둘 이상의 클러스터 구성원이 심각도 '중요'인 경우에만 전체 클러스터의 심각도를 중요로 변경할 수 있습니다. 또한 전체 클러스터는 다운된 것으로 간주됩니다.
- 스토리지 경로
- 저장소 네트워크의 일부인 상위 또는 하위 개체에 영향도가 적용되는 방식을 결정합니다.
속성
영향 규칙을 구성할 수 있을 뿐만 아니라 영향 계산을 위한 속성을 구성할 수 있습니다.| 속성 이름 | 설명 |
|---|---|
evt_mgmt.impact_calculation.alert_group_support |
경보 그룹 지원을 사용하도록 설정합니다. |
evt_mgmt.impact_maintenance.sleep_time_sec |
CI 유지관리를 확인하는 최소 시간(초): CI의 상태 필드와 CI에 대한 변경 요청 일정을 모두 확인합니다. |
evt_mgmt.impact_calculation.alert_copy_delay |
경보 생성 또는 업데이트 후의 지연으로, 영향 계산 및 그룹화에 사용됩니다. em_alert 테이블에 정의된 늦은 도착이나 느린 비즈니스 규칙을 보상하는 데 사용됩니다. 기본값 = 2000msec. 경보와 이벤트가 한 번에 하나씩 처리될 때 사용됩니다( |
evt_mgmt.impact_calculation.alert_copy_delay_when_alerts_are_processed_in_batch_msec |
경보 생성 또는 업데이트 후의 지연으로, 영향 계산 및 그룹화에 사용됩니다. 테이블에 정의된 늦은 도착이나 느린 비즈니스 규칙을 보상하는 데 사용됩니다em_alert. 기본값 = 30000msec. 트래픽이 많은 대규모 고객 환경에서 경보 및 이벤트가 일괄 처리될 때( |
자세한 내용은 이벤트 관리 - 영향 계산 [KB1157218]을 참조하십시오.