長い保留中のジョブのジョブ詳細を分析する
事前定義された遅延しきい値に違反するジョブを特定して対処することで、ジョブの遅延に先手を打つことができます。長い保留中のジョブのアラートカードは、遅延期間別に保留中のジョブを追跡するため、下流のワークフローに影響を与えて SLA を満たさない前に保留中のジョブを処理できます。
始める前に
必要なロール:admin
ジョブ詳細機能は、階層レベルに関係なくすべてのユーザーが利用できます。
このタスクについて
インスタンスオブサーバーのジョブ監視機能が新しいテレメトリで拡張され、ジョブの動作をより深く分析できるようになりました。既存の IO ジョブパフォーマンス機能は、ジョブ実行、異常、およびリソースを大量に消費する上位のジョブ (実行時間で上位 2,000) の詳細な分析をすでにサポートしています。
新しいテレメトリは、スケジュールされているが、準備完了状態またはキュー状態のままで、実行フェーズに移行していない保留中のジョブに対処します。
ジョブがスタックする理由は次のとおりです。
- 新しいジョブを獲得するためのリソースが不足しています
- 実行を何らかでブロックしています
- 新しいジョブを開始できません
必要なもの:
- 保留中のジョブが期限切れになっている経過時間の可視化。
- それらに対処するためのアラート。スタックしたジョブを再スケジュールまたは終了して、インスタンスの健全性を維持します。
長い処理待ちのジョブアラートは、処理待ちのジョブに関する分数レベルのテレメトリを提供し、処理待ちのジョブの数と平均して期限切れまでの時間 (分) をインスタンスレベルで示します。
このテレメトリは、保留中のジョブ以外にも、ジョブの実行にかかる時間だけでなく、どのジョブがまったく実行されていないか、どのくらいの時間が遅延しているかを知るのにも役立ちます。
手順
次のタスク
保留中のジョブのアラートカードを設定することもできます。詳細については、「ジョブの優先度別の長い処理待ちのジョブアラートを構成します」を参照してください。