Aktivieren Sie den Angriffsschutz für generative KI

  • Freigeben Version: Yokohama
  • Aktualisiert 30. Januar 2025
  • 1 Minute Lesedauer
  • Aktivieren Sie den Angriffsschutz für die Protokollierung, und fügen Sie die Option zum Blockieren von anstößigen Inhalten in KI-generierten Texten und Konversationen hinzu.

    Vorbereitungen

    Erforderliche Rolle: sn_generative_ai.nsa_admin

    Warum und wann dieser Vorgang ausgeführt wird

    Generative KI ist probabilitybasiert, was bedeutet, dass Ausgaben auf Wahrscheinlichkeiten basieren und die doppelte Verwendung derselben Eingabe nicht garantiert, dass die Ausgabe identisch ist. Einige der von KI generierten Materialien könnten aufgrund von Toxizität, Geschlechtsverkehr oder einer anderen anstößigen Stimmung möglicherweise unerwünscht sein. Mit Now Assist Guard können Sie jegliches Material protokollieren, das als anstößig erkannt wird. Wenn Sie möchten, können Sie auch anstößiges Material blockieren, damit Anwender den generierten Inhalt nicht sehen. Stattdessen wird eine Meldung angezeigt, dass anstößiges Material erkannt und blockiert wurde.

    Weitere Informationen finden Sie unter Now Assist-Beschützer.

    Protokolle können zur Überprüfung exportiert werden. Eine Anleitung hierzu finden Sie unter Now Assist-Manager-Protokolle exportieren.

    Prozedur

    1. Navigieren zu Alle > Now Assist Admin > Einstellungen.
    2. Wählen Sie im Seitenbereich das aus Now Assist Guardian > Anstößigkeit Registerkarte
    3. Wechseln Sie zur Registerkarte Für Sie verfügbar, um zu sehen, aus welchen Workflows Sie auswählen können.

      Wenn Sie bereits Schutzmaßnahmen für Offensivität aktiviert haben, werden sie auf der Registerkarte Aktiv angezeigt.

    4. Wählen Sie Aktivieren für den Workflow, für den Sie den Angriffsschutz aktivieren möchten.
    5. Wählen Sie Ihre Auswirkungserkennung aus.

      Now Assist-Schutz protokolliert, wenn anstößige Inhalte erkannt oder generiert werden, wenn der Angriffsschutz aktiviert ist. Sie können auch auswählen, ob Sie den Inhalt für den Anwender blockieren möchten. Wenn Sie den Inhalt blockieren, wird dem Benutzer eine standardisierte Nachricht angezeigt, in der erläutert wird, dass anstößiges Material blockiert wurde, anstatt was generiert wurde.

      Offensivitäts-Schutzmaßnahmen für Now Assist-Beschützer mit ausgewählter Option „Nur protokollieren“.

    6. Wählen Sie Speichern.

    Ergebnisse

    Der Offensivitätsschutz von Now Assist Guard ist in Ihrer Instanz für den von Ihnen ausgewählten Workflow aktiviert.

    Nächste Maßnahme

    Sie können den Angriffsschutz für alle Now Assist-Anwendungen aktivieren, die Sie in Ihrer Instanz aktiviert haben. Wenn Sie die Auswirkung auf die Erkennung ändern möchten, können Sie weitere Optionen ( Symbol „Weitere Optionen“ ) in der Liste der aktiven Workflows auswählen und Bearbeitenwählen.

    Sie können den Angriffsschutz für Ihren Workflow jederzeit deaktivieren, indem Sie weitere Optionen auswählen und Deaktivierenwählen.