根本原因相関アラートの構成
根本原因相関 (RCC) アラートを設定して、これらのアラートの根本原因分析 (RCA) レポートの受信を開始します。
始める前に
必要なロール:admin
手順
- 移動先 影響 > プラットフォームヘルス > 監視 > Instance Observer.
- [アラート] メニューから [アラートコンソール] を選択します。
- 本番インスタンスを選択します。
-
[スナップショットを取得] を選択します。
アラートに関する情報がテーブルに一覧表示されます。
-
次のレポートオプションを選択します。
- インスタンス
- 日付範囲
- メトリクス
- オプション:
- セルフサービスアラート
- 診断イベント
- アドオン
-
リストされたオプションを使用して、アラートを微調整します。
例
- トランザクション数の異常が 10 分以上持続する場合、またはトランザクション数の異常を 10 分以上継続して平均から一定数の標準偏差を超え、範囲を上回ったり下回ったりした場合にアラートをトリガーするしきい値を設定します。ジョブ異常は、実行時間に基づいて異常ジョブの上位 X % をターゲットにし、それらのジョブの詳細を追跡します。
- 持続時間をシミュレートしてアラートをテストおよび微調整するか、5 分、10 分、15 分などの例外の期間を選択するか、ジョブの上位 5 %、10 %、または 15 % を選択して、アラートが正しくトリガーされることを確認します。必要に応じてアラートしきい値を調整し、意味のあるアクション可能なアラートがシステムから提供されていることを確認します。
- 要件に基づいて、メール通知、SMS メッセージ、統合のいずれかの適切なアラート送信方法を選択します。
- システムによって生成されるアラートを継続的に監視します。検出された異常を定期的に確認して根本的な原因を把握し、適切な措置 (潜在的な問題の調査やさらなる分析の実行など) を取ります。