생성형 AI에 대한 불쾌한 콘텐츠 보호 활성화

호주 플랫폼 보안

Release

australia

ft:locale

ko-KR

ft:publication_title

호주 플랫폼 보안

ft:clusterId

psec

bundleId

psec

workflow

Platform

생성형 AI에 대한 불쾌한 콘텐츠 보호 활성화

릴리스 버전: Australia

업데이트 날짜 2025년 07월 31일

소요 시간: 2분

불쾌한 콘텐츠 탐지를 활성화하여 기술 및 워크플로우에서 Now Assist 생성된 불쾌한 콘텐츠를 기록하거나 차단합니다.

시작하기 전에

필요한 역할: sn_generative_ai.nsa_admin

이 태스크 정보

생성형 AI 출력은 확률론적이며, 이는 동일한 입력이 다른 출력을 생성할 수 있음을 의미합니다. AI 생성 콘텐츠 중 일부는 유해하거나, 성차별적이거나, 기타 유해한 언어를 포함하여 불쾌감을 줄 수 있습니다. Now Assist 가디언 는 입력 및 출력 모두에서 불쾌한 콘텐츠를 탐지하고 탐지되면 이벤트를 로깅합니다. 또한 불쾌한 내용을 차단하도록 구성하여 사용자에게 생성된 응답 대신 표준 오류 메시지를 볼 수 있습니다.

주:

불쾌한 콘텐츠 탐지는 특정 Now Assist 기술 및 워크플로우에만 적용됩니다. 일부 애플리케이션에만 Now Assist 사용할 수 있는 것은 아닙니다. 불쾌한 콘텐츠 탐지를 지원하는 기술 목록에 대한 자세한 내용은 Now Assist 보호자를 참조하십시오.

검토를 위해 로그를 익스포트할 수 있습니다. 자세한 내용은 Now Assist 보호자 로그 익스포트를 참조하십시오.

프로시저

다음으로 이동 모두 > Now Assist 관리자 > 설정.
측면 패널에서 Now Assist 보호자 > 불쾌한 콘텐츠 탐지 탭.
사용 가능 탭으로 이동하여 선택할 수 있는 워크플로우를 확인합니다.

이미 활성화된 불쾌한 콘텐츠 가드레일이 활성 탭에 표시됩니다.
불쾌한 콘텐츠 탐지를 활성화할 워크플로우에 대해 활성화를 선택합니다.
불쾌한 콘텐츠가 탐지될 때 작업 선택 섹션에서 다음 옵션 중 하나를 선택합니다.
- 불쾌한 콘텐츠가 탐지되었을 때 콘텐츠를 기록하면서 사용자에게 콘텐츠를 표시하려면 출력 기록을 선택합니다. 불쾌감을 주는 콘텐츠는 여전히 사용자에게 표시됩니다.
- 이벤트를 기록하고 컨텐츠가 사용자에게 표시되지 않도록 하려면 응답 차단을 선택하고 출력을 기록합니다. 대신 표준 오류 메시지가 표시됩니다.
불쾌한 콘텐츠를 확인할 콘텐츠 심각도 수준 선택 섹션에서 다음 옵션 중 하나를 선택합니다.
- 불쾌한 콘텐츠에 대한 약간의 힌트라도 플래그를 지정하려면 낮음을 선택합니다.
- 불쾌한 콘텐츠의 표시를 해제하려면 보통을 선택합니다.
- 매우 불쾌감을 주는 콘텐츠에만 플래그를 지정하려면 높음을 선택합니다.
저장 및 활성화를 선택합니다.
저장을 선택합니다.

결과

선택한 워크플로우에 대한 인스턴스에서 불쾌한 콘텐츠 탐지 가드레일이 활성화되어 있습니다. 불쾌한 콘텐츠가 탐지되거나 생성되면 이벤트가 기록됩니다.

다음에 수행할 작업

지원되는 Now Assist 각 애플리케이션 및 워크플로우에 대해 개별적으로 불쾌한 콘텐츠 탐지를 활성화할 수 있습니다. 불쾌한 콘텐츠 보호를 활성화하려는 각 워크플로우에 대해 이 작업을 반복합니다.

활성 워크플로우에 대한 탐지 영향을 변경하려면 추가 옵션( 을 선택합니다. 아이콘을 선택한 다음 편집을 선택합니다.

워크플로우에 대한 불쾌한 콘텐츠 탐지를 비활성화하려면 활성 워크플로우 목록에서 추가 옵션(아이콘을 선택한 다음 비활성화를 선택합니다.