생성형 AI 기반 근본 원인 분석
의 Instance Observer 근본 원인 분석은 문제를 자동으로 탐지하고 요약합니다. 여기에는 대규모 언어 모델(LLM)을 사용한 기본 제공 근본 원인 상관 관계 및 근본 원인 요약이 포함되어 있어 유사한 과거 인시던트를 분석하여 문제 해결 시간을 줄이고, 인시던트 투명성을 개선하고, 생성형 AI 기반 근본 원인 권장 사항을 제공하는 데 도움이 됩니다.
근본 원인 분석(RCA) 개요
RCA는 여러 원격 측정 신호를 분석하여 인시던트의 원인을 자동으로 식별하고 설명합니다. 포함된 신호는 메모리, 데이터베이스, 트랜잭션, 캐시 플러시 및 세션과 관련이 있습니다. 이 분석을 통해 팀은 관련 예외의 상관관계를 지정하고 사람이 읽을 수 있는 요약 및 권장 해결 방법을 생성하여 문제를 더 빨리 탐지하고 더 정확하게 해결할 수 있습니다.
RCA의 이점
- 빠른 신호 그룹화 및 요약을 통해 MTTD(평균 탐지 시간) 또는 MTTR(평균 수리 시간)을 줄입니다.
- 더 빠른 정정 또는 자동화를 위한 실행 가능한 요약입니다.
- 유사한 과거 인시던트를 분석하여 권장하는 해결 방법입니다.
근본 원인 상관 관계(RCC)
RCC 기능은 로그, 메트릭 및 성능 데이터를 지능적으로 분석하여 예외 간의 관계와 종속성을 자동으로 식별합니다. 여러 성능 메트릭에서 신호의 상관관계를 지정하여 최소한의 수동 작업으로 문제의 원인을 신속하게 격리하는 데 도움이 됩니다. 이 상관 관계는 노이즈를 제거하고 신호의 바다에서 가능한 근본 원인을 좁힙니다.
LLM 기반 근본 원인 요약(RCS)
상관 관계가 있는 데이터가 식별되는 즉시 LLM이 호출되어 간결하고 사람이 읽을 수 있는 요약을 생성합니다. LLM은 정형 및 비정형 원격 측정 데이터를 모두 처리하여 가능한 근본 원인과 영향을 받는 구성요소에 대한 명확한 인사이트를 제공합니다.
URL/sys_XXX.do에 대해 ID가 XXXXXX인 트랜잭션이 최대 실행 시간을 초과하여 취소되었습니다. 이 트랜잭션에 걸린 총 시간은 0:04:59.044, 처리 시간은 0:04:59.041, CPU 시간은 0:00:07.775입니다. 트랜잭션이 사용자 XXXX에 의해 시작되었습니다. SQL 시간은 0:00:50.154였으며 4,836개의 쿼리가 실행되었습니다.
URL sys_XXX.do에 대한 총 처리 시간은 1095초입니다. ListRecordDefaultTag에 대한 0:02:37.194의 과도한 처리 시간입니다. 느린 침묵 평가 : __ref__.canRead ()는 0 : 00 : 02.475를 사용했습니다. 많은 양의 데이터가 스트리밍되었습니다: StreamingBytesSizeHandler에 의해 1,048,578바이트. URL sys_XXX.do에 대한 총 처리 시간은 1095초입니다.
LLM 기반 근본 원인 권장 사항(RCR)
Instance Observer는 동일한 인스턴스에 대해 유사한 과거 인시던트를 분석하여 AI 기반 권장 해결 방법을 제공합니다. 시스템은 과거에 성공한 케이스 작업을 참조하여 유사한 문제를 해결하고 가장 가능성이 높은 정정 단계로 제안합니다.
- 맞춤형 안내
- 권장 사항은 과거 해결 이력을 기반으로 인스턴스 및 서비스에 맞게 조정됩니다.
- 케이스 작업 연결
- 이전 케이스 작업을 직접 참조하면 처음부터 시작하지 않고 검증된 수정 사항을 검토할 수 있습니다.
- Human-in-loop 확인
- 권장 사항은 본질적으로 권고입니다. 운영자는 표준 운영 절차(SOP)에 따라 이를 검증하고 적용해야 합니다.
이 구성요소는 인시던트 응답에서의 시행착오를 줄이고 반복되는 패턴에서 지식의 재사용을 보장합니다.
쿼리 검토 SELECT fcr.u_XXXX_approval_status AS fcr_u_w7e_XXX_status, 쿼리 성능을 향상시키기 위해 인덱스를 테이블에 추가하도록 제안된 인시던트 ID CSXXXXXX에서 제안된 솔루션과 유사하게 인덱스를 추가하거나 성능 향상을 위해 다시 작성하여 taskslatable.time_left하고 최적화하십시오.