RCC アラートの構成

  • リリースバージョン: Yokohama
  • 更新日 2025年01月30日
  • 所要時間:1分
  • Instance Observer RCC によって実行される根本原因分析に基づいて、根本原因相関 (RCC) アラートを構成します。

    始める前に

    必要なロール:admin

    手順

    1. 次のように移動する。 影響 > プラットフォームヘルス > 監視 > Instance Observer.
    2. [ アラート ] メニューから [アラートコンソール] を選択します。
    3. 本番インスタンスを選択します。
    4. [スナップショットを取得 (Get Snapshot)] を選択します。
      アラートの情報がテーブルに一覧表示されます。
    5. 次のレポートオプションを選択します。
      • インスタンス
      • 日付範囲
      • メトリクス
      • オプション:
        • セルフサービスアラート (Self Service Alerts)
        • 診断イベント
      • アドオン
    6. リストされたオプションを使用して、アラートを微調整します。
      • たとえば、トランザクション数の異常が 10 分以上持続する場合、または平均からの一定の標準偏差を 10 分以上継続して超えており、範囲を上回ったり下回ったりした場合にアラートをトリガーするしきい値を設定します。ジョブ異常は、実行時間に基づいて異常なジョブの上位 X % を対象とし、これらのジョブの詳細を追跡します。
      • 持続時間をシミュレーションしてアラートをテストおよび微調整するか、異常の期間として 5 分、10 分、15 分などを選択するか、ジョブの上位 5 %、10 %、または 15 % を選択して、アラートが正しくトリガーされることを確認します。必要に応じてアラートしきい値を調整し、意味のある実用的なアラートがシステムから提供されるようにします。
      • 要件に基づいて適切なアラート送信方法を選択します。これにはメール通知、SMS メッセージ、統合などがあります。
      • システムによって生成されるアラートを継続的に監視します。検出された異常を定期的に確認して根本的な原因を把握し、適切な措置 (潜在的な問題の調査やさらなる分析の実行など) を取ります。