생성형 AI에 대한 불쾌한 콘텐츠 보호 활성화

  • 릴리스 버전: Australia
  • 업데이트 날짜 2025년 07월 31일
  • 소요 시간: 2분
  • 불쾌한 콘텐츠 탐지를 활성화하여 기술 및 워크플로우에서 Now Assist 생성된 불쾌한 콘텐츠를 기록하거나 차단합니다.

    시작하기 전에

    필요한 역할: sn_generative_ai.nsa_admin

    이 태스크 정보

    생성형 AI 출력은 확률론적이며, 이는 동일한 입력이 다른 출력을 생성할 수 있음을 의미합니다. AI 생성 콘텐츠 중 일부는 유해하거나, 성차별적이거나, 기타 유해한 언어를 포함하여 불쾌감을 줄 수 있습니다. Now Assist 가디언 는 입력 및 출력 모두에서 불쾌한 콘텐츠를 탐지하고 탐지되면 이벤트를 로깅합니다. 또한 불쾌한 내용을 차단하도록 구성하여 사용자에게 생성된 응답 대신 표준 오류 메시지를 볼 수 있습니다.
    주:
    불쾌한 콘텐츠 탐지는 특정 Now Assist 기술 및 워크플로우에만 적용됩니다. 일부 애플리케이션에만 Now Assist 사용할 수 있는 것은 아닙니다. 불쾌한 콘텐츠 탐지를 지원하는 기술 목록에 대한 자세한 내용은 Now Assist 보호자를 참조하십시오.

    검토를 위해 로그를 익스포트할 수 있습니다. 자세한 내용은 Now Assist 보호자 로그 익스포트를 참조하십시오.

    프로시저

    1. 다음으로 이동 모두 > Now Assist 관리자 > 설정.
    2. 측면 패널에서 Now Assist 보호자 > 불쾌한 콘텐츠 탐지 탭.
    3. 사용 가능 탭으로 이동하여 선택할 수 있는 워크플로우를 확인합니다.

      이미 활성화된 불쾌한 콘텐츠 가드레일이 활성 탭에 표시됩니다.

    4. 불쾌한 콘텐츠 탐지를 활성화할 워크플로우에 대해 활성화를 선택합니다.
    5. 불쾌한 콘텐츠가 탐지될 때 작업 선택 섹션에서 다음 옵션 중 하나를 선택합니다.
      • 불쾌한 콘텐츠가 탐지되었을 때 콘텐츠를 기록하면서 사용자에게 콘텐츠를 표시하려면 출력 기록을 선택합니다. 불쾌감을 주는 콘텐츠는 여전히 사용자에게 표시됩니다.
      • 이벤트를 기록하고 컨텐츠가 사용자에게 표시되지 않도록 하려면 응답 차단을 선택하고 출력을 기록합니다. 대신 표준 오류 메시지가 표시됩니다.

      "출력 기록" 작업 및 "낮음" 심각도 수준을 선택한 경우의 불쾌한 콘텐츠 가드레일입니다.

    6. 불쾌한 콘텐츠를 확인할 콘텐츠 심각도 수준 선택 섹션에서 다음 옵션 중 하나를 선택합니다.
      • 불쾌한 콘텐츠에 대한 약간의 힌트라도 플래그를 지정하려면 낮음을 선택합니다.
      • 불쾌한 콘텐츠의 표시를 해제하려면 보통을 선택합니다.
      • 매우 불쾌감을 주는 콘텐츠에만 플래그를 지정하려면 높음을 선택합니다.
    7. 저장 및 활성화를 선택합니다.
    8. 저장을 선택합니다.

    결과

    선택한 워크플로우에 대한 인스턴스에서 불쾌한 콘텐츠 탐지 가드레일이 활성화되어 있습니다. 불쾌한 콘텐츠가 탐지되거나 생성되면 이벤트가 기록됩니다.

    다음에 수행할 작업

    지원되는 Now Assist 각 애플리케이션 및 워크플로우에 대해 개별적으로 불쾌한 콘텐츠 탐지를 활성화할 수 있습니다. 불쾌한 콘텐츠 보호를 활성화하려는 각 워크플로우에 대해 이 작업을 반복합니다.

    활성 워크플로우에 대한 탐지 영향을 변경하려면 추가 옵션( 추가 옵션 아이콘)을 선택합니다. 아이콘을 선택한 다음 편집을 선택합니다.

    워크플로우에 대한 불쾌한 콘텐츠 탐지를 비활성화하려면 활성 워크플로우 목록에서 추가 옵션(추가 옵션 아이콘)아이콘을 선택한 다음 비활성화를 선택합니다.