Zing 인덱스 및 검색 딕셔너리 속성

  • 릴리스 버전: Zurich
  • 업데이트 날짜 2025년 07월 31일
  • 소요 시간: 6분
  • 다음 딕셔너리 속성은 Zing이 테이블을 인덱싱하거나 검색 결과의 순위를 지정하는 방식에 영향을 줍니다.

    인덱스 및 검색 딕셔너리 속성

    Zing은 테이블 또는 필드 수준에서 설정된 딕셔너리 속성을 사용하여 다음 설정을 구성합니다.
    • 인덱싱 동작
    • 검색 결과 순위
    • BM25 관련성 순위 알고리즘
    표 1. Zing 인덱스 및 검색 딕셔너리 속성
    이름 데이터 유형 적용 대상 V3 또는 V4에 적용 설명 레이블 재인덱싱이 필요하십니까? 루트 테이블만
    attachment_index 부울 테이블 모두 예일 경우 테이블의 첨부 파일이 검색을 위해 인덱싱됩니다. 첨부 파일 인덱스 아니오
    no_text_index 부울 모두 모두 필드의 이 속성은 필드가 텍스트 인덱스에 포함되지 않도록 합니다. 텍스트 인덱스 없음 아니오
    text_index _attachment_body _weight 부동 테이블 V4 첨부 파일의 본문에서 찾은 검색어에 제공할 고려 사항(가중치, 부동 소수점 값)을 지정합니다. 가중치 값이 검색 결과 관련성에 미치는 영향에 대한 자세한 내용은 을 참조하십시오 Zing은 세 가지 구성요소를 사용하여 문서 점수를 계산합니다.. 텍스트 인덱스 첨부 파일 본문 가중치 아니오
    text_index _attachment_displayed 부울 테이블 모두 텍스트 검색 결과에 첨부 파일을 표시합니다. 텍스트 인덱스 첨부 파일 표시됨 아니오 아니오
    text_index_attachment _title_weight 부동 테이블 V4 첨부 파일 제목에 있는 검색어에 제공할 고려 사항(가중치, 부동 소수점 값)을 지정합니다. 가중치 값이 검색 결과 관련성에 미치는 영향에 대한 자세한 내용은 을 참조하십시오 Zing은 세 가지 구성요소를 사용하여 문서 점수를 계산합니다.. 텍스트 인덱스 첨부 파일 제목 가중치 아니오
    text_index _auto_stop 부울 테이블 모두 스톱 워드를 자동으로 식별하고 인덱싱하지 않습니다. text_index_auto_stop_threshold에 지정된 임계치를 기준으로 합니다. 텍스트 인덱스 자동 중지
    text_index_auto _stop_threshold int 테이블 모두 단어가 자동으로 스톱 워드가 되는 임계치(정수, 발생 횟수)입니다. text_index_auto_stop 참조하십시오. 텍스트 인덱스 자동 중지 임계치
    text_index_default _partial_matching_rule 문자열 테이블 모두 부분 일치 규칙 구성을 위한 문자열입니다. 입력은 다음을 기반으로 해야 합니다. 인덱싱된 테이블의 쿼리 모드 변경. 텍스트 인덱스 기본 부분 일치 규칙 아니오
    text_index _default_query_mode 문자열 테이블 모두 쿼리 모드 구성을 위한 문자열입니다. 입력은 다음을 기반으로 해야 합니다. 인덱싱된 테이블의 쿼리 모드 변경 텍스트 인덱스 기본 쿼리 모드 아니오
    text_index _disable_synonym 부울 테이블 모두 TRUE는 동의어 및 검색어에 대한 검색을 비활성화합니다. 텍스트 인덱스 동의어 사용 안 함 아니오
    text_index _enable_idf 부울 테이블 V3 TRUE이면 TF-IDF점수 매기기를 사용할 수 있습니다. 텍스트 인덱스 IDF 사용 아니오
    text_index _filter_junk 부울 테이블 모두 기본적으로 TRUE인 FALSE는 테이블에 대한 정크 필터를 사용하지 않도록 설정합니다. 기본적으로 Zing은 2자리 숫자와 단일 문자 단어를 인덱싱하거나 검색하지 않습니다(중국어 또는 일본어 문자가 아닌 경우). 정크 필터를 사용하지 않도록 설정한 후 인덱스를 재생성합니다. 이 속성으로 인해 테이블 인덱스가 커집니다. 최적의 성능을 위해 필요한 경우가 아니면 적용하지 마십시오. 텍스트 인덱스 필터 정크
    text_index _filter_query 테이블의 encodedQuery 테이블 모두 특정 필터 조건과 일치하는 행을 인덱싱하려는 경우 이 특성을 사용합니다. 속성 값은 테이블의 encodedQuery여야 합니다. 인덱스 필터 아니오
    text_index_filterable 부울 모두 이 특성이 true로 설정된 필드가 변경되면 다시 인덱싱하도록 행이 평가됩니다(필드 자체를 인덱싱할 수 없는 경우에도). 필터링 가능 인덱스 아니오
    text_index_include _stop_word 부울 테이블 모두 이 테이블에서 스톱 워드를 인덱싱해야 하는 경우 이 특성을 true로 설정합니다. 텍스트 인덱스 스톱 워드 포함
    text_index_scorer_bm25_b 부동 테이블 V4 이 특성은 BM25 알고리즘에 사용되는 b 매개 변수입니다. text_index_scorer_bm25_b 참조하십시오. bm25_b 아니오
    text_index_scorer_bm25_k1 부동 테이블 V4 이 특성은 BM25 알고리즘에 사용되는 K1 매개 변수입니다. text_index_scorer_bm25_k1 참조하십시오. bm25_k1 아니오
    text_index_tags 문자열 테이블 모두 인덱싱하려는 태그 유형에 따라 특정 문자열(empty/everyone_only/all_shared)로 설정해야 합니다. 텍스트 인덱스 태그 아니오
    text_index_tokenizer _language 문자열 테이블 모두 일본어로 토큰화를 지원해야 하는 경우 "ja"(큰 따옴표 제외)를 입력합니다. 텍스트 인덱스 토크나이저 언어
    text_index_translations 부울 테이블 모두 존재하거나 예인 경우 번역된 문자열이 추가될 때 인덱스가 다시 계산되도록 합니다. 수정하려면 sys-admin 역할이 필요합니다. 번역되는 인덱싱된 필드와 번역이 있고 인덱싱 중인 필드에 대해 자동으로 설정됩니다. 기본값이 true인 glide.i18n.force_index 시스템 속성이 이 속성을 재정의합니다. 텍스트 인덱스 번역 아니오
    text_search_and_or_limit int 테이블 모두 전역 속성을 재정의하는 테이블 수준 사용자 지정 속성 text_search_and_or_limit 추가합니다. 텍스트 검색 및 또는 제한 아니오 아니오
    ts_language 문자열 모두 특정 언어의 텍스트 인덱싱만 허용하기 위해 추가되었습니다. 텍스트 검색 언어 아니오
    ts_multi_value_field _splitter 문자열 모두 한 필드가 다중 값 필드인 경우 이 속성의 필드에 스플리터를 추가하여 값의 인덱스 위치를 분산합니다. 예를 들어 multi:value를 구분하려면 이 속성에 :를 입력합니다. 텍스트 검색 다중 값 필드 스플리터
    ts_weight int 모두 텍스트 검색을 위한 필드에서 일치 항목의 상대적 중요도를 제어합니다. 가중치 값이 검색 결과 관련성에 미치는 영향에 대한 자세한 내용은 을 참조하십시오 Zing은 세 가지 구성요소를 사용하여 문서 점수를 계산합니다.. 필드에 대한 텍스트 검색 가중치를 설정하는 방법에 대한 자세한 내용은 문서를 참조하십시오 필드의 상대적 가중치 설정. 텍스트 검색 가중치 아니오 아니오

    no_text_index

    고객 서비스 및 지원 다양한 필드 유형에 대한 no_text_index 옵션을 설정하는 방법에 대한 지침은 사이트의 KB0859922Now Support 참조하십시오.

    text_index_scorer_bm25_b

    이 사전 특성은 BM25 알고리즘의 일부입니다. 이 속성은 검색 결과에서 문서 길이의 중요도에 영향을 줍니다. 이 속성이 0이면 길이에 방향이 없습니다. 이 경우 두 단어로 구성된 문서는 1000단어로 구성된 문서와 동등하게 평가됩니다. 매우 짧은 문서는 종종 긴 문서보다 가중치가 낮습니다. 기본값은 0.75입니다.

    text_index_scorer_bm25_k1

    이 사전 특성은 BM25 알고리즘의 일부입니다. 이 속성은 용어 빈도 포화 특성을 결정하는 데 도움이 됩니다. 즉, 문서에 검색어를 표시하면 문서의 관련성이 높아지지만 숫자가 증가함에 따라 증가의 영향은 줄어듭니다. 예를 들어 문서에서 검색어가 10번 발생하면 검색어가 한 번만 나오는 문서보다 관련성이 더 높습니다. 그러나 검색어가 100번 발생한 문서는 10번 발생한 문서보다 10배 더 영향력이 크지 않을 수 있습니다. 관련성은 최대 효과 점근선에 접근합니다. 속성 값이 높을수록 여러 번 발생하는 최대 효과는 낮아집니다. 일반적인 값은 1.25에서 2.0 사이입니다.