서비스 관측성 탐색
서비스 관측성 는 운영 팀이 복잡하고 분산된 프로덕션 시스템에서 인시던트를 분류하고 관리하는 데 도움이 됩니다. 외부 APM(애플리케이션 성능 모니터링) 시스템의 구성 관리 데이터베이스(CMDB)원격 분석을 . 둘 다 단일 워크플로우 서비스 운영 작업 공간 로 표시됩니다().SOW
서비스 관측성 개요
서비스 관측성 지정된 서비스와 관련된 상태 메트릭을 SOW 표시합니다. 메트릭은 외부 APM 시스템에서 수집하여 의 관련 구성 항목에 대한 메트릭과 함께 표시할 수 있습니다 CMDB.
- Dynatrace
- New Relic
- MySQL
- PostgreSQL
APM 인스턴스를 서비스 관측성에 연결한 후 APM 데이터의 기존 태그를 사용하여 에 등록된 CMDB 서비스를 APM 메트릭에 매핑합니다.
이 데이터 매핑 서비스 관측성 을 사용하면 호스트나 데이터베이스와 같은 서비스와 연결된 APM 엔터티의 메트릭을 관련 CI의 정보와 함께 한 곳에 표시할 수 있습니다. 운영자는 APM 메트릭, 관련 CI 정보, 유용한 컨텍스트 정보(예: 서비스와 관련된 현재 인시던트 및 경보)를 사용하여 서비스 상태를 이해합니다.
예를 들어 결제 서비스를 모니터링하는 데 사용하고 Dynatrace 데이터베이스 및 호스트의 메트릭은 checkout-service 태그를 사용하여 해당 서비스에서 오는 요청을 나타냅니다. 체크아웃 서비스 CI를 checkout-service서비스 관측성로 태그가 지정된 APM 데이터에 매핑하여 서비스와 관련된 데이터베이스 및 호스트와 CI에 대한 메트릭을 검색한 다음 함께 표시합니다. 운영자는 서비스와 SOW관련된 엔터티의 문제를 정확히 찾아내고 를 종료하지 않고도 완화 프로세스의 범위를 좁힐 수 있습니다.
서비스 관측성 사용자
| 사용자 | 설명 |
|---|---|
| 시스템 관리자 | 시스템 관리자는 사용자와 팀을 구성하고, 모니터링할 서비스를 등록하고, APM에 연결한 서비스 관측성 다음, 이러한 서비스를 해당 데이터에 매핑합니다. 또한 다음에서 데이터를 볼 수도 있습니다. SOW |
| 관리자 | 서비스 관측성 관리자는 모니터링할 단일 서비스를 등록할 수 있습니다. 또한 에서 데이터를 볼 수도 있습니다 SOW. |
| 운영자/운영 관리자 | 운영자는 에서 SOW인시던트를 분류할 때 사용합니다서비스 관측성. 서비스 관리자는 관련 인시던트, 경보 및 변경과 함께 서비스의 기본 상태 메트릭을 볼 수 있습니다. 옵저버블 탭으로 이동하여 호스트나 데이터베이스와 같은 관련 엔터티의 메트릭과 함께 추가 서비스 메트릭을 보면 더 자세한 정보를 얻을 수 있습니다. |
서비스 관측성 워크플로우
관리자는 서비스를 등록하고 APM 메트릭을 연결한 다음 해당 데이터에 서비스를 매핑하여 구성합니다 서비스 관측성 . 운영자는 다른 관련 엔터티가 서비스 성능에 의해 표면화된 문제를 일으키는지 확인하는 데 사용합니다 서비스 관측성 .
시스템 관리자는 다음을 수행합니다.
- 비즈니스 중요도에 따라 모니터링할 서비스 관측성 서비스를 결정한 다음 해당 서비스를 등록합니다.
- 기존 APM 인스턴스를 서비스 관측성에 연결합니다.
- 등록된 서비스를 해당 데이터에 사용되는 APM 기반 태그를 기반으로 APM 메트릭 데이터로 매핑합니다.
운영자 또는 관리자는 다음을 수행합니다.
- 에서 작업하는 SOW동안 서비스 문제를 발견합니다(예: 경보, 서비스 대시보드 등 고속 목록)에서 서비스 상세 정보 페이지로 이동합니다.
- 관련 인시던트, 경보 및 변경 사항과 함께 서비스에 대한 전반적인 상태 메트릭을 봅니다. 메트릭 중 하나가 비정상인 것 같으면 옵저버블 탭으로 이동합니다.
- 더 자세한 서비스 메트릭과 관련 엔터티의 정보를 보고 근본 원인 조사를 시작합니다. 문제가 시스템 스택의 아래쪽에 있음을 발견하면 해당 엔터티의 소유권을 식별하여 정정을 시작합니다.
서비스 관측성 이점
| 이점 | 기능 | 사용자 |
|---|---|---|
중요한 신호를 중앙 집중화하고 워크플로우를 연결하여 민첩성과 안정성을 높입니다.
|
. | 관리자 |
| 서비스와 연결된 엔터티에서 결합된 메트릭을 보고 인시던트의 폭발 반경과 소유권을 확인함으로써 효율성을 높이고 평균 해결 시간(MTTR)을 단축합니다. | 서비스 상태 메트릭 보기 | 연산자 |
| 시스템과 관련된 변경 내용 및 서비스와 관련된 경보를 한 곳에서 확인합니다. | 전체 서비스 상태 보기. | 연산자 |