서비스 신뢰성 대시보드의 시각화

  • 릴리스 버전: Australia
  • 업데이트 날짜 2026년 03월 12일
  • 소요 시간: 3분
  • ()SRM의 서비스 신뢰성 대시보드 서비스 신뢰성 관리 에 있는 시각화 및 옵션 목록입니다.

    서비스 상태 차트

    최상위 차트에는 중요, 위험에 처함 및 안정 상태의 서비스 수가 표시됩니다. 상태는 SLO(서비스 수준 목표)에 남아 있는 오류 예산을 기반으로 합니다. 차트를 선택하여 서비스 이름을 보고, 시간 범위를 조정하고, 추가 차트 옵션에 액세스할 수 있습니다.

    주:
    오류 예산은 SLO를 위반하기 전에 서비스가 발생할 수 있는 오류의 양입니다.
    각 시각화에는 지난 12개월 동안의 서비스 수 변화를 보여주는 추세선도 포함됩니다. 더 작은 수치는 일주일 전에 비해 집계가 어떻게 변했는지를 나타냅니다(예: 6월 11일 이후 ↓25(22%)).
    차트 CSDM의 특성 사용 방법
    중요 위험 상태인 서비스 수를 표시합니다. 중요한 서비스의 SLO에 남은 오류 예산이 0%입니다. 오류 예산을 소비한 서비스 수를 보고 즉각적인 주의가 필요한 서비스를 식별합니다.
    위험함 위험에 처한 서비스 수를 표시합니다. 위험에 처한 서비스의 SLO에는 <= 25%의 오류 예산이 남아 있습니다. 얼마나 많은 서비스가 중요 임계치에 접근하고 있는지 모니터링하고 문제를 조기에 찾습니다.
    안정 안정적인 서비스 수를 표시합니다. 안정적인 서비스의 SLO에 오류 예산이 25% 이상 남아 있습니다. 전반적인 서비스 상태에 대한 인사이트를 얻고 시간이 지나도 서비스의 신뢰성이 유지되는지 확인합니다.

    시간 경과에 따른 위험 추세

    라인 차트는 지난 12개월 동안 현금 감소 속도가 높고 오류 예산이 낮은 SLO 수를 추적합니다. 이를 사용하여 반복 패턴과 잠재적인 신뢰성 위험을 찾을 수 있습니다.
    차트 CSDM의 특성 사용 방법
    높은 현금 감소 속도(>=1) 시간 경과에 따라 현금 감소 속도가 >= 1인 SLO 수를 표시합니다. 현금 감소 속도가 높으면 SLO에 연결된 서비스가 규정 준수 기간이 끝나기 전에 오류 예산을 위반할 가능성이 있음을 나타냅니다.

    예를 들어 서비스가 SLO를 충족하는 데 30일이 있지만 15일 만에 오류 예산을 모두 사용하는 경우 현금 감소 속도는 2입니다.

    • 서비스가 오류 예산을 너무 빨리 소비하기 시작하는 시기를 확인하여 위험을 조기에 파악합니다.
    • 시간 경과에 따른 현금 감소 속도를 추적하여 새롭게 발생하거나 반복되는 안정성 문제를 식별합니다.
    • 차트를 가리키면 해당 시점에 현금 감소 속도가 높은 SLO의 수와 백분율을 볼 수 있습니다.
    • 차트를 선택하여 SLO 세부 정보를 보고, 시간 범위를 조정하고, 추가 차트 옵션에 액세스합니다.
    남은 예산 부족(<=25%) 시간 경과에 따라 오류 예산이 낮거나 남아 있지 않은 SLO의 수를 표시합니다.
    • SLO에 근접했거나 위반한 서비스 수를 모니터링합니다.
    • 신뢰성 저하 또는 조사가 필요한 문제 반복을 나타낼 수 있는 상승 추세를 추적합니다.
    • 차트를 가리키면 해당 시점에 오류 예산이 거의 또는 전혀 남아 있지 않은 SLO의 수와 백분율을 볼 수 있습니다.
    • 차트를 선택하여 SLO 세부 정보를 보고, 시간 범위를 조정하고, 추가 차트 옵션에 액세스합니다.

    서비스 수준 목표(SLO) 테이블

    SLO 테이블에는 SRM(서비스 신뢰성 관리)에 정의된 SLA가 나열되며 기본적으로 SLO 이름을 기준으로 정렬됩니다. 테이블을 사용하여 전반적인 안정성을 모니터링하고, 위험에 처한 서비스를 식별하고, 할당된 팀을 찾습니다.

    SLO 테이블에는 기본적으로 다음 열이 포함됩니다. 표시되는 열을 사용자 지정하려면 기어 아이콘을 선택합니다.
    • 이름 - SLO의 이름입니다. 화살표를 선택하여 SLO 이름별로 테이블을 정렬할 수 있으며, 이름을 선택하여 SLO 기록을 볼 수 있습니다.
    • 신뢰성 - SLO의 현재 상태입니다. 예를 들어 안정, 위험함 또는 심각입니다.
    • 측정된 신뢰성 - 서비스의 실제 성과를 보여주는 백분율입니다. 예를 들어, SLO가 99.9%의 성공률이고 해당 월의 실제 성과가 99.7%인 경우 측정된 신뢰성은 99.7%입니다.
    • 목표(백분율) - 대상 SLO 값입니다.
    • 현금 감소 속도 - 서비스가 오류 예산을 얼마나 빨리 소비하고 있는지를 보여주는 숫자 값입니다.
    • 남은 오류 예산 % - 현재 준수 기간에 아직 사용할 수 있는 오류 예산의 백분율입니다.
    • 서비스 - SLO와 연결된 서비스의 이름입니다. 서비스 이름을 선택하여 서비스 기록을 볼 수 있습니다.
    • 할당됨 - 서비스를 담당하는 팀입니다.

    대시보드 필터 및 작업

    서비스 신뢰성 대시보드는 플랫폼 분석으로 구축되며 표준 대시보드 기능을 포함합니다. 대시보드 사용자 지정, 복제 또는 공유에 대한 자세한 내용은 설명서를 참조하십시오 Dashboards in Platform Analytics .
    주:
    서비스 신뢰성 대시보드의 변경 사항은 인스턴스의 모든 SRM 사용자에게 영향을 미칩니다. 개인화된 버전을 만들려면 새 대시보드를 빌드하거나 기존 대시보드를 복제하고 편집합니다. 및 Duplicate a Platform Analytics dashboard에서 자세히 Create a dashboard with the in-line editor 알아보세요.