ヘルスログアナリティクスの例外動作のタイプ
CI またはサービスでの例外動作は、重要な問題を示している可能性があります。たとえば、特定タイプのメッセージの頻度または数の急増は、問題を示している可能性があります。
予期される動作のモデルをビルドするために、 ヘルスログアナリティクス ログストリームを監視して、さまざまな期間にわたるパターン、メトリクス、およびゲージのベースラインを学習します。期間としては、1 時間単位、毎日、毎週、または無制限を設定できます。学習したモデルから逸脱する動作は、例外動作と見なされます。
ログプロパティのタイプ
- パターン
- パターンとは、テキスト、時間、または関係で繰り返される値またはレートのことです。
- メーター (Meter)
- メータープロパティは、数値またはテキスト値です。たとえば、ステータスコード、応答コード、アクション、パターンなどがあります。
- ゲージ
- ゲージプロパティには、継続的に報告される数値があります。ゲージプロパティは、リソースを消費する操作を表します。たとえば、CPU 使用率、メモリ使用率、応答時間などです。
ヘルスログアナリティクスでの異常の表示方法
例外カードには、アラートの原因となった例外アクティビティが表示されます。チャートには次の情報が表示されます。
- 最近の例外アクティビティ
- 予想される動作 (学習したベースライン)
- 1 日前のベースライン値
- 前週のベースライン値
この例では、特定のログパターンのベースラインレート (1 分あたりの平均イベント数) が追跡されます。この通常は非アクティブなログがイベントのスパイクを生成すると、システムはベースラインからの逸脱を検出し、アラートを生成します。図 : 1. 例外カード
例外の種類
| 動作 | 説明 |
|---|---|
| 新しい動作 (New behavior) | これまでになかったパターン。[新しい動作 (New behavior)] アラートタイプでは、グラフは表示されません。 |
| シグナルデッド/停止 (Signal dead/Stopped appearing) | ソースからのすべてのパターンまたはログデータが停止しています。少なくとも 5 分間シグナルがありません。 |
| シグナルアライブ/再開 (Signal alive/Appearing again) | 「デッド」ソースからのパターンまたはログデータが再開されています。1 時間のベースラインでは、1 分あたり 1 回を下回るパターンは「停止」です。 |
| 平均超えまたは平均未満の例外 (Anomaly above average or below average) | メトリクスがパターン、メーターまたはゲージ (キーワードメトリクスや重大度メトリクスなど) の場合に、予想されるベースライン動作から逸脱しているアクティビティ。 |
| ベースライン参照の増減 (Baseline reference increase or decrease) | 1 時間または 1 週間のベースラインと比較した、ログプロパティの値またはボリュームの増減。 |
| 重大度とキーワードアラートの相関 (Correlation of severity and keyword alerts) | 重大度レベルまたはキーワードのボリュームの増加。 |