ソリューション用の TF-IDF の設定
用語頻度逆ドキュメント頻度 (TF-IDF) エンコーディングを、 予測インテリジェンスの分類、クラスタリング、または類似性ソリューションに適用します。
始める前に
注:
ML ソリューションの詳細設定の構成はオプションです。これらの設定のいずれかを構成する場合は、ソリューションで有効にしているテクノロジーについて十分な情報を入手し、そのテクノロジーが提供するものからメリットを得るユースケースがあることを確認してください。詳細については、「https://www.servicenow.com/community/intelligence-ml-articles/dive-deeper-with-clustering-advanced-parameters/ta-p/2695847」を参照してください。
- 分類、クラスタリング、または類似性ソリューション定義を作成するか、既存の定義を使用します。
- 必要なロール:admin または ml_admin
このタスクについて
予測インテリジェンス は、分類および類似性フレームワークでデフォルトで段落ベクトル単語埋め込みを使用します。これは、主に人間が判読可能なコンテンツで構成されるデータを処理するのに非常に効果的です。ただし、TF-IDF は、ログファイルのアラートやエラーメッセージなど、マシンで生成されたコンテンツを含むレコードに対して、より優れた予測結果を返す可能性があります。ソリューションが処理しているデータの種類に適した詳細設定を選択します。
注:
TF-IDF を構成する手順はすべてのモデル フレームワークで同じですが、クラスタリング ソリューション定義の TF-IDF サポートは、Professional サブスクリプションがある場合にのみ適用されます。