Aktivieren Sie den Angriffsschutz für generative KI

Yokohama Enable AI

Release

yokohama

ft:locale

de-DE

ft:publication_title

Yokohama Enable AI

ft:clusterId

platai

bundleId

platai

workflow

Platform

Aktivieren Sie den Angriffsschutz für generative KI

Freigeben Version: Yokohama

Aktualisiert 30. Januar 2025

1 Minute Lesedauer

Aktivieren Sie den Angriffsschutz für die Protokollierung, und fügen Sie die Option zum Blockieren von anstößigen Inhalten in KI-generierten Texten und Konversationen hinzu.

Vorbereitungen

Erforderliche Rolle: sn_generative_ai.nsa_admin

Warum und wann dieser Vorgang ausgeführt wird

Generative KI ist probabilitybasiert, was bedeutet, dass Ausgaben auf Wahrscheinlichkeiten basieren und die doppelte Verwendung derselben Eingabe nicht garantiert, dass die Ausgabe identisch ist. Einige der von KI generierten Materialien könnten aufgrund von Toxizität, Geschlechtsverkehr oder einer anderen anstößigen Stimmung möglicherweise unerwünscht sein. Mit Now Assist Guard können Sie jegliches Material protokollieren, das als anstößig erkannt wird. Wenn Sie möchten, können Sie auch anstößiges Material blockieren, damit Anwender den generierten Inhalt nicht sehen. Stattdessen wird eine Meldung angezeigt, dass anstößiges Material erkannt und blockiert wurde.

Weitere Informationen finden Sie unter Now Assist-Beschützer.

Protokolle können zur Überprüfung exportiert werden. Eine Anleitung hierzu finden Sie unter Now Assist-Manager-Protokolle exportieren.

Prozedur

Navigieren zu Alle > Now Assist Admin > Einstellungen.
Wählen Sie im Seitenbereich das aus Now Assist Guardian > Anstößigkeit Registerkarte
Wechseln Sie zur Registerkarte Für Sie verfügbar, um zu sehen, aus welchen Workflows Sie auswählen können.
Wenn Sie bereits Schutzmaßnahmen für Offensivität aktiviert haben, werden sie auf der Registerkarte Aktiv angezeigt.
Wählen Sie Aktivieren für den Workflow, für den Sie den Angriffsschutz aktivieren möchten.
Wählen Sie Ihre Auswirkungserkennung aus.
Now Assist-Schutz protokolliert, wenn anstößige Inhalte erkannt oder generiert werden, wenn der Angriffsschutz aktiviert ist. Sie können auch auswählen, ob Sie den Inhalt für den Anwender blockieren möchten. Wenn Sie den Inhalt blockieren, wird dem Benutzer eine standardisierte Nachricht angezeigt, in der erläutert wird, dass anstößiges Material blockiert wurde, anstatt was generiert wurde.
Wählen Sie Speichern.

Ergebnisse

Der Offensivitätsschutz von Now Assist Guard ist in Ihrer Instanz für den von Ihnen ausgewählten Workflow aktiviert.

Nächste Maßnahme

Sie können den Angriffsschutz für alle Now Assist-Anwendungen aktivieren, die Sie in Ihrer Instanz aktiviert haben. Wenn Sie die Auswirkung auf die Erkennung ändern möchten, können Sie weitere Optionen ( “ ) in der Liste der aktiven Workflows auswählen und Bearbeitenwählen.

Sie können den Angriffsschutz für Ihren Workflow jederzeit deaktivieren, indem Sie weitere Optionen auswählen und Deaktivierenwählen.