Konfigurieren Sie den Connect-Komponenten-Algorithmus und die Levenshtein-Distanzmethode für eine Clustering-Lösung
Wenden Sie die Codierung der Verbindungskomponente konfigurieren und der Levenshtein-Distanzmethode an, um das Training für Ihre Clustering-Lösungen zu optimieren.
Vorbereitungen
Hinweis:
Die Konfiguration von erweiterten Einstellungen für ML-Lösungen ist optional. Wenn Sie Einstellungen dieser Art konfigurieren, stellen Sie sicher, dass Sie gut über die Technologie informiert sind, die Sie in der Lösung aktivieren, und dass Sie einen Anwendungsfall haben, der von der Technologie profitiert. Weitere Informationen finden Sie unter https://www.servicenow.com/community/intelligence-ml-articles/dive-deeper-with-clustering-advanced-parameters/ta-p/2695847.
- Erstellen und trainieren Sie eine Clustering-Lösungsdefinition, oder verwenden Sie eine vorhandene.
- Erforderliche Rolle: admin oder ml_admin
Warum und wann dieser Vorgang ausgeführt wird
Zum Trainieren von Clusterlösungen haben Sie die folgenden drei Optionen.
- Verwenden Sie den Standard-K-Means-Algorithmus.
- Verwenden Sie den optionalen Lösungsparameter DB-Scan mit der euklidischen Abstandsmethode als Metrik.
- Verwenden Sie die optionalen Lösungsparameter DB-Scan, Minimale Nachbaranzahl und Levenshtein-Abstand. Die Connect-Komponente wird von DBSScan und der Mindestanzahl von Nachbarmitgliedern aktiviert und unterstützt sowohl auf Absatzvektoren basierenden Text als auch auf Levenshtein-Abstand basierenden Text. Wenn Sie Ihre Lösung mit der Levenshtein-Abstandsmethode trainieren, müssen Sie in Ihrer Clustering-Lösung keinen Wortkorpus verwenden.
In diesem Beispielszenario trainieren Sie Ihre Lösungsdefinition mithilfe der oben genannten dritten Option.