異常アラートの構成
Instance Observer で過去のパターンのメトリクスの外れ値に基づいて異常アラートを構成します。
始める前に
必要なロール:admin
手順
- 移動先 影響 > プラットフォームヘルス > 監視 > Instance Observer.
-
[パフォーマンス] メニューから、[トランザクション/応答時間 (Transactions/Response Times)] を選択します。
-
次のレポートオプションを選択します。
- インスタンス
- メトリクス
- 日付範囲
- オプション:
- セルフサービスアラート (Self Service Alerts)
- 診断イベント
- アドオン
-
[スナップショットを取得 (Get Snapshot)] を選択します。
注:レポートとチャートで利用可能なオプション:
- データポイントを選択して他のアクションを表示するか、エントリを削除します。
- 右クリックしてデータポイントを分離します。
- チャートを選択してドラッグし、ドリルダウンします。
- PNG、SVG、または CSV ファイルにダウンロードするか、インスタンスでトランザクションを表示します。
- レポートタイプを変更します。
-
リストされたオプションを使用して、アラートを微調整します。
- たとえば、トランザクション数の異常が 10 分以上持続する場合、または平均からの一定の標準偏差を 10 分以上継続して超えており、範囲を上回ったり下回ったりした場合にアラートをトリガーするしきい値を設定します。ジョブ異常は、実行時間に基づいて異常なジョブの上位 X % を対象とし、これらのジョブの詳細を追跡します。
- 持続時間をシミュレーションしてアラートをテストおよび微調整するか、異常の期間として 5 分、10 分、15 分などを選択するか、ジョブの上位 5 %、10 %、または 15 % を選択して、アラートが正しくトリガーされることを確認します。必要に応じてアラートしきい値を調整し、意味のある実用的なアラートがシステムから提供されるようにします。
- 要件に基づいて適切なアラート送信方法を選択します。これにはメール通知、SMS メッセージ、統合などがあります。
- システムによって生成されるアラートを継続的に監視します。検出された異常を定期的に確認して根本的な原因を把握し、適切な措置 (潜在的な問題の調査やさらなる分析の実行など) を取ります。