메트릭 인텔리전스 탐색

  • 릴리스 버전: Yokohama
  • 업데이트 날짜 2025년 01월 30일
  • 읽기2분
  • 를 사용하여 메트릭 인텔리전스 메트릭 데이터를 분석하고 예외를 식별하는 방법에 대해 자세히 알아보십시오.

    메트릭 인텔리전스 개요

    메트릭 인텔리전스 는 잠재적인 서비스 중단을 식별하고 방지하는 데 도움이 됩니다. 기록 메트릭 데이터를 기반으로 이벤트가 메트릭 인텔리전스 캡처하지 못할 수 있는 CI의 예외 동작을 나타냅니다.

    메트릭 인텔리전스 사용자

    표 1. 사용자
    사용자 설명
    이벤트 관리 사용자

    [evt_mgmt_user]

    경보와 경보의 기본 메트릭을 볼 수 있습니다.
    이벤트 관리 관리자

    [evt_mgmt_admin]

    모든 메트릭 정의 및 커넥터 설정을 구성할 수 있습니다.
    운영자

    [evt_mgmt_operator]

    모든 메트릭 정의와 커넥터 설정을 볼 수 있습니다.

    메트릭 인텔리전스 워크플로우

    다음 그림은 메트릭 인텔리전스 애플리케이션 내의 레이아웃 및 데이터 흐름을 보여 줍니다.

    그림 1. 메트릭 인텔리전스 파이프라인
    메트릭 인텔리전스 워크플로우를 개략적으로 설명하는 인포그래픽
    1. 데이터 수집: 에이전트, 타사 커넥터 및 사용자 지정 커넥터(REST)가 서버 및 인프라 구성요소에서 성능 데이터를 수집합니다. 에이전트가 수집한 데이터는 WebSocket을 통해 전달 MID 서버 되고 타사 및 사용자 지정 커넥터에서 수집한 데이터는 커넥터를 통해 전달됩니다 MID 서버 .
    2. 데이터 정규화: 원시 데이터는 메트릭 기준에서 읽을 수 있도록 정규화기에 의해 형식이 지정됩니다.
    3. 데이터 그룹화: 데이터는 배치 관리자에 의해 그룹화되어 인스턴스(Glide)의 REST API로 전송됩니다.
    4. Clotho TSDB로 데이터 전송: REST API는 데이터를 처리하여 Clotho TSDB로 보냅니다.
    5. 모델 생성: 트레이너/학습자 작업이 실행되고 수신된 데이터를 기반으로 모델이 생성됩니다. 예를 들어 작업은 정상적인 CPU 사용량에 대한 임계값이 60%임을 학습할 수 있습니다. 해당 날짜의 데이터와 과거 데이터를 기반으로 매일 새 모델이 생성됩니다(대부분의 모델은 지난 14일 동안의 데이터를 수집함).
    6. 시계열 모델 캐시 DB로의 모델 데이터 전송: 데이터는 인스턴스(Glide)를 통해 시계열 모델 캐시 DB MID 서버 로 전송됩니다. 모델 캐시는 '일반' 모델의 경계를 저장합니다.
    7. 예외 탐지: 정상 범위를 벗어난 데이터는 에 MID 서버 의해 탐지되고 예외 점수로 렌더링됩니다. 예외는 인스턴스에 저장되며 .서비스 운영 작업 공간 예외 탐지가 실시간으로 수행되므로 고객은 즉시 예외를 인식할 수 있습니다.

    메트릭 인텔리전스 이점

    이점 기능 사용자
    자동화된 구성을 활용하여 이벤트 및 메트릭의 자동화된 수집을 통해 시스템의 상태, 성능 및 가용성을 모니터링합니다. 에이전트 클라이언트 수집기 모니터링 NOC 운영자, 이벤트 관리 관리자
    가장 의미 있는 예외만 승격하여 노이즈를 줄입니다.

    예외 경보 보기

    메트릭 규칙 만들기

    이벤트 관리 관리자
    AI 기반 예외 탐지(자율 머신 러닝 비정상 패턴 탐지(사용자 개입 없음) 또는 결정적 경보 규칙 설정(정적 임계치 수동 설정)을 통해 예외를 탐지합니다. 상태 로그 분석가 경보를 생성하는 방법 이벤트 관리 관리자
    원시 메트릭 데이터 시각화를 사용하여 오픈 경보 및 인시던트의 해결 시간을 단축합니다. 메트릭 탐색기 NOC 운영자, 이벤트 관리 관리자