異常検出

  • リリースバージョン: Australia
  • 更新日 2026年03月12日
  • 所要時間:3分
  • Instance Observer は、本番インスタンスの Impact Total パッケージのパフォーマンスチャートで、周期的なメトリクスまたは非周期的なメトリクスの異常をプロアクティブに検出します。異常は、過去のパターンに基づくメトリクスの外れ値を表します。すべての異常が問題を表すわけではありませんが、異常が発生していることがわかるため、重大度を判断し、それに応じてアラートを設定します。

    周期的なメトリクスは、同じ順序で定期的に繰り返されるイベント、または一定期間で定期的に繰り返されるイベントの完全なセットとして発生します。非周期的なメトリクスとは、不定期に繰り返されるか、またはランダムで予測しにくい期間で繰り返されるメトリクスです。異常とは、普通ではないデータポイント、珍しいデータポイント、または予想されるデータのパターンや分布に適合しないデータポイントであり、外れ値とも呼ばれます。

    追跡対象の 5 つの周期的なメトリクスは次のとおりです。
    • トランザクション数:インスタンス全体での UI_TYPE という内部タイプの UI トランザクションの合計数。
    • サーバーの応答時間UI_TYPE トランザクションの平均実行時間。
    • SQL 応答時間:アプリケーション層で測定され、報告されたデータベース平均応答時間。応答時間はクエリがデータベースに送信されたときに開始し、応答が受信されたときに終了します。
    • セマフォ平均 (Semaphore Mean):1 分間に同時処理されるエンドユーザートランザクションの平均数。
    • ノードメモリ最大値 (Node Memory Max):履歴内の特定のデータポイントにおけるノードあたりの使用中メモリの最大値 (MB)。通常、この値は 1000 MB から 2048 MB の範囲内です。
    [異常] タブのチャート
    • X 軸は時間を表し、Y 軸は選択した日付範囲の実際のメトリクスを表します。たとえば折れ線グラフには、時間の経過に伴うトランザクション数の値が表示されます。異常はグラフ上に赤色で示され、データでの異常の発生を表します。赤色のマークの位置は、異常の検出に使用される基準またはアルゴリズムによって異なります。
    • 範囲は、過去のデータセットパターンに基づくメトリクスの正規分布の上限と下限を表します。
    • 平均線は、特定の時点での逸脱と比較するためのメトリクスの 4 週間平均値を表します。

    ジョブ異常検出

    ジョブ異常チャートには、同時実行されているスケジュール済みジョブの 1 時間ごとの数が示され、その上に 1 時間ごとの平均トランザクション数のメトリクスが表示されます。チャート内で 1 つまたは複数の異常ジョブが含まれている棒は、赤色で強調表示されます。棒グラフの詳細リンクを選択すると、ジョブレベルの詳細が表示されます。

    [ジョブ詳細] には、1 時間ごとのスケジュール済みジョブの数と、そのインスタンスの平均トランザクション数が表示されます。

    スケジュール済みジョブの異常チャート

    1 時間ごとのスケジュール済みジョブの数から、任意の時間における個別の繰り返しジョブにドリルダウンし、さらに過去 7 日間における同じジョブの実行パターンにドリルダウンします。これは、通常は完了までにかかる時間が一定であるジョブの実行時間が急激に増減するという、パフォーマンスの問題が発生している可能性がある状況で、このようなジョブのエンドツーエンドの根本原因分析を行う際に役立ちます。

    特定の日付にドリルダウンした後のジョブ詳細。
    スケジュール済みジョブの基準
    ジョブがスケジュール済みジョブと見なされるには、次の基準のうち 1 つ以上を満たしている必要があります。
    • ジョブがそれぞれの曜日に少なくとも 1 回実行される。
    • 過去 4 週間においてジョブが毎週少なくとも 1 回実行された。
    平均トランザクション数の計算
    各曜日において 1 時間ごとに、過去 4 週間の同じ曜日および同じ時間のトランザクション数の合計の平均が算出されます。たとえば、過去 4 回の月曜日から 4 時間分のトランザクション数の合計を取得し、最終的な計算のために値の平均を算出します。
    ジョブ異常の識別
    過去 4 週間において、ジョブが実行されていた 1 時間ごとに、標準偏差値を使用して平均期間が算出されます。これは、標準偏差値に 5 を乗算した結果に平均値を加算したものです。
    この値はその時間のジョブの上限となります。ジョブが 4 回目の 1 時間にわたり実行されており、過去 4 週間のジョブの平均期間がその時点で 10 分であり、標準偏差の値が 2 分の場合、上限は 10 + (5*2) = 20 分になります。
    現在実行中のジョブの実行に 20 分以上かかっている場合、そのジョブは異常として識別されます。

    異常への対応

    すべての異常が問題を表すわけではありませんが、外れ値は過去のパターンに基づいて検出されます。検出された異常の重大度を分析した後に、分析結果に応じてアラートを設定します。アラートの詳細については、「異常アラートの構成」を参照してください。