사용자 지정 보호자 생성
LLM으로 전송된 요청을 모니터링하고 탐지할 사용자 지정 보호자를 생성합니다.
시작하기 전에
기본 제공 업체에 대한 연결 및 자격 증명 별칭을 구성합니다. 자세한 내용은 연결 및 자격 증명 별칭 생성 문서를 참조하십시오.
필요한 역할: 관리자
프로시저
- 다음으로 이동 모두그런 다음 필터에 sys_generative_ai_custom_guardian_transformer_list.do 를 입력하여 생성형 AI 사용자 지정 보호자 변환기 [sys_generative_ai_custom_guardian_transformer_list.do] 테이블로 이동합니다.
- 새로 만들기를 선택합니다.
- 이름 필드에 사용자 지정 보호자의 이름을 입력합니다.
-
요청 변환기 스크립트를 생성합니다.
-
요청 변환기 파일에서 ECMAScript 2021(ES12) 모드 켜 기 토글을 활성화하여 스크립트를 만듭니다.
다음 예제에서는 사용자 지정 보호자 요청 구조에 대한 요청 변환기 스크립트를 보여줍니다.
((function(inputs) { /* inputs structure: { prompt: object, The textual content that needs to be evaluated with guardian threshold_setting: object connection_attributes: object } write code here to construct the request body and any custom headers needed using the inputs object. */ // construct body using the inputs like input.prompt and so on. var body = {}; //construct headers using the inputs var headers = {}; return { body: body, headers: headers }; })(inputs);
-
요청 변환기 파일에서 ECMAScript 2021(ES12) 모드 켜 기 토글을 활성화하여 스크립트를 만듭니다.
- 활성 옵션을 선택합니다.
-
응답 변환기 스크립트를 생성합니다.
-
응답 변환기 파일에서 ECMAScript 2021(ES12) 모드 켜기 토글을 활성화하여 스크립트를 만듭니다.
다음 예제에서는 사용자 지정 보호자 응답 구조에 대한 응답 변환기 스크립트를 보여줍니다.
(function(inputs) { /* write code here to transform the custom guardian response into standard guardian response format expected by platform inputs structure: { response_body: object, threshold_setting: object } */ // write code here to populate the response object. var guardianResponse = {}; //Set flagged to true, if the guardian has flagged the text. Categories are optional and are for logging purpose only // if transformer setting is Prompt Injection, expected response format: {security:{flagged:false,categories:[]}} // if transformer setting is Offensiveness, expected response format: {safety:{flagged:false,categories:[]}} // if transformer setting is ALL, expected response format: {safety:{flagged:false,categories:[]},security:{flagged:false,categories:[]}} return guardianResponse; })(inputs);
-
응답 변환기 파일에서 ECMAScript 2021(ES12) 모드 켜기 토글을 활성화하여 스크립트를 만듭니다.
-
보호자 설정 필드에서 원하는 가드레일을 선택합니다.
- 불쾌한 콘텐츠와 프롬프트 삽입을 함께 탐지하려면 모두 를 선택합니다.
- 불쾌감을 주거나 유해한 콘텐츠를 탐지하려면 불쾌한 콘텐츠를 선택합니다.
- 프 롬프트 삽입 을 선택하여 프롬프트 공격을 탐지할 수 있습니다.
주:LLM이 단일 요청에서 불쾌한 콘텐츠와 프롬프트 삽입을 모두 평가할 수 있는 경우 모두를 선택합니다. 그렇지 않은 경우 각 불쾌한 콘텐츠 및 프롬프트 삽입에 대해 별도의 가드레일 기록을 생성합니다. - 연결 및 자격 증명 별칭 필드에서 사용자 지정 보호자와 통합할 별칭을 선택합니다.
- 제출을 선택합니다.
-
사용자 지정 보호자 토큰 제한을 설정합니다.
- 다음으로 이동 모두 > 시스템 정의 > 테이블.
- 생성형 AI 통제 설정 데이터 [sys_gen_ai_control_setting_data] 테이블을 선택합니다.
- 관련 링크 섹션에서 목록 표시를 선택합니다.
- 생성형 AI 통제 데이터 열에서 사용자 지정 보호자 토큰 제한 기록을 검색합니다.
-
요청당 최대 토큰 수로 사용자 지정 보호자 토큰 제한 기록의 값 필드를 업데이트합니다.
토큰 제한은 가드레일이 단일 평가에서 처리할 수 있는 최대 토큰 수를 정의합니다. 요청 콘텐츠가 이 제한을 초과하면 콘텐츠가 더 작은 부분으로 분할됩니다. 각 부품은 가드레일 규칙에 따라 별도로 평가됩니다.
예를 들어 토큰 제한이 1,000이고 요청 컨텐츠가 2,500개인 경우 시스템은 이를 세 부분으로 분할하고 각각을 개별적으로 평가합니다.