Ihr Modell testen und veröffentlichen
Bewerten Sie die Leistung Ihres NLU -Modells, um Bereiche mit Verbesserungspotenzial zu identifizieren. Veröffentlichen Sie dann Ihr Modell, um es für andere Anwendungen wie Virtual Agentverfügbar zu machen.
Zusammenfassung der Nutzung
Testen Sie Ihr Virtual Agent - oder KI-Suche -Modell anhand seiner Standardtestreihe, um zu sehen, wie das Modell reagiert. Testergebnisse enthalten Informationen, mit denen Sie Ihr Modell verbessern können.
Um Ihr Modell zu testen, navigieren Sie zu . Wählen Sie die Registerkarte für die Anwendung Ihres Modells und dann den Namen des Modells aus. Wählen Sie auf der Karte Modell testen und veröffentlichen die Option Ansichtsphase aus .
Übersicht
Die Phase „ Modell testen und veröffentlichen “ wird standardmäßig auf der Seite „ Übersicht “ geöffnet. Schaltflächen für Neuen Test ausführen und Modell veröffentlichen befinden sich hier.
DieÜbersicht enthält Informationen zu einem vorherigen Testlauf, wobei die Testergebnisse in Balkendiagrammen zusammengefasst werden.
Wenn Sie frühere Testläufe haben, können Sie diese anzeigen, indem Sie in der Liste Testausführungsdatum auswählen.
Um Detailinformationen für die Testergebnistabelle anzuzeigen, wählen Sie die Registerkarte Detaillierte Ergebnisse. Jede Testäußerung wird mit ihrer Vorhersage unter Detaillierte Ergebnisseaufgelistet.
Testergebnisse verstehen
Die Testergebnisse zeigen, wie Ihr Modell auf die Äußerungen im Testsatz reagiert hat.
| Prozentsatz | Beschreibung |
|---|---|
| Richtig | Der Prozentsatz der Äußerungen, für die Ihr Modell die Absicht richtig vorhergesagt hat. Wenn das Modell für Äußerungen, die als Nicht relevantmarkiert sind, keine Absicht vorhersagt, wird dieses Ergebnis als Richtig gezählt. |
| Richtig unter mehreren | Für Äußerungen, für die mehr als eine Absicht vorhergesagt wurde. Der Prozentsatz der Äußerungen, für die das Modell die Absicht oder die Absichten richtig vorhergesagt hat, aber auch Absichten vorhergesagt hat, die nicht zur Äußerung gehörten. |
| Verfehlt | Der Prozentsatz der Äußerungen, für die Ihr Modell keine Absicht vorhergesagt hat, obwohl eine Absicht erwartet wurde. |
| Falsch | Der Prozentsatz der Äußerungen, für die Ihr Modell eine falsche Absicht vorhergesagt hat. |
Tests können sich auf den Konfidenzschwellenwert des Modells auswirken. Der Konfidenzschwellenwert bestimmt, wie sicher ein Modell sein muss, um eine Absicht für eine Äußerung vorherzusagen. Weitere Informationen zu Konfidenzschwellenwerten finden Sie unter NLU-Modelleinstellungen.
Informationen zu Äußerungen, für die keine Absicht vorhergesagt werden darf, finden Sie unter Erkennung von Irrelevanz in NLU.
Modell veröffentlichen.
Weitere Informationen zum Veröffentlichen Ihres Modells finden Sie unter Veröffentlichen Sie Ihr NLU -Modell.
Batch-Tests für mehrfache Modelle
In der Phase Modell testen und veröffentlichen testen Sie Ihr Modell anhand seiner Standardtestreihe. Mit Batch-Tests für mehrere Modelle können Sie mit anderen Testsätzen testen, mehrere Modelle gleichzeitig testen und Ihre Testergebnisse anzeigen. Um Batch-Tests für mehrere Modelle zu verwenden, navigieren Sie zu .
Weitere Informationen finden Sie unter Batch-Tests für mehrfache Modelle.
Weitere Informationen zum Testprozess finden Sie unter Ihr Modell testen.