프롬프트 삽입 공격 보호 구성

호주 플랫폼 보안

Release

australia

ft:locale

ko-KR

ft:publication_title

호주 플랫폼 보안

ft:clusterId

psec

bundleId

psec

workflow

Platform

프롬프트 삽입 공격 보호 구성

릴리스 버전: Australia

업데이트 날짜 2025년 07월 31일

소요 시간: 1분

프롬프트 삽입 공격 탐지를 활성화 또는 비활성화하여 인스턴스의 모든 생성형 AI 애플리케이션과 AI 생성 텍스트 및 대화를 악의적인 입력 및 의도하지 않은 모델 동작으로부터 보호합니다.

시작하기 전에

필요한 역할: sn_generative_ai.nsa_admin

이 태스크 정보

프롬프트 삽입 공격은 누군가가 LLM의 초기 지침을 재정의하여 의도하지 않은 동작을 일으키려고 시도하는 사이버 보안 공격의 한 유형입니다. Now Assist 가디언 는 프롬프트 삽입 시도가 모델에 도달하기 전에 탐지하여 구성에 따라 기록하거나 응답을 차단합니다. 공격이 탐지될 때 AI 생성 응답을 로깅하는 것 외에도 차단하도록 프롬프트 삽입 탐지 가드레일을 구성할 수도 있습니다.

검토를 위해 로그를 익스포트할 수 있습니다. 자세한 내용은 Now Assist 보호자 로그 익스포트를 참조하십시오.

프로시저

다음으로 이동 모두 > Now Assist 관리자 > 설정.
측면 패널에서 Now Assist 보호자 > 프롬프트 삽입.
프 롬프트 삽입 토글을 선택하여 프롬프트 삽입 탐지를 활성화합니다.
프롬프트 삽입이 탐지될 때 작업 선택 섹션에서 다음 옵션 중 하나를 선택하여 탐지된 공격을 처리합니다.
- 사용자에게 모델 응답을 표시하면서 요청 및 대화를 기록하려면 출력 기록을 선택합니다.
- 모델 응답을 차단하고 요청 및 대화를 기록하려면 응답 차단을 선택하고 출력을 기록합니다.
프롬프트 삽입을 확인할 공격 심각도 수준 선택 섹션에서 프롬프트 삽입을 확인할 심각도 수준을 선택합니다.
- 주입 또는 조작 시도의 사소한 힌트라도 플래그를 지정하려면 낮음을 선택합니다.
- 지우거나 보통의 프롬프트 삽입 시도를 플래그로 지정하려면 보통을 선택합니다.
- 높은 확실성 프롬프트 삽입 시도만 플래그하려면 높음을 선택합니다.
저장을 선택합니다.

결과

프롬프트 삽입 탐지는 모든 생성 AI 워크플로우에 대해 인스턴스에 구성됩니다. Now Assist 가디언 은 선택한 심각도 수준에 따라 프롬프트 삽입 시도를 탐지하고 구성한 작업에 따라 응답합니다.