Zing 인덱스 및 검색 딕셔너리 속성

Xanadu Now Platform 관리

Release

xanadu

ft:locale

ko-KR

ft:publication_title

Xanadu Now Platform 관리

ft:clusterId

platadm

bundleId

platadm

workflow

Platform

Zing 인덱스 및 검색 딕셔너리 속성

릴리스 버전: Xanadu

업데이트 날짜 2024년 08월 01일

소요 시간: 6분

다음 딕셔너리 속성은 Zing이 테이블을 인덱싱하거나 검색 결과의 순위를 매기는 방식에 영향을 줍니다.

인덱스 및 검색 딕셔너리 속성

Zing은 테이블 또는 필드 수준에서 설정된 딕셔너리 속성을 사용하여 다음 설정을 구성합니다.

인덱싱 동작
검색 결과 순위
BM25 관련성 순위 알고리즘

표 1. Zing 인덱스 및 검색 딕셔너리 속성
이름	데이터 유형	적용 대상	V3 또는 V4에 적용	설명	레이블	재인덱싱이 필요하십니까?	루트 테이블만
attachment_index	부울	테이블	모두	예일 경우 검색 목적으로 테이블의 첨부 파일이 인덱싱됩니다.	첨부 파일 인덱스	예	아니오
no_text_index	부울	모두	모두	필드의 이 속성은 필드가 텍스트 인덱스에 포함되지 않도록 합니다.	텍스트 인덱스 없음	예	아니오
text_index _attachment_body _weight	뜨다	테이블	V4	첨부 파일 본문에서 찾은 검색어에 제공할 고려 사항(가중치, 부동 소수점 값)을 지정합니다. 가중치 값이 검색 결과 관련성에 미치는 영향에 대한 자세한 내용은 을 참조하십시오 Zing은 다음 세 가지 구성요소를 사용하여 문서 점수를 계산합니다.	텍스트 인덱스 첨부 파일 본문 가중치	아니오	예
text_index _attachment_displayed	부울	테이블	모두	텍스트 검색 결과에 첨부 파일을 표시합니다.	텍스트 인덱스 첨부 파일 표시됨	아니오	아니오
text_index_attachment _title_weight	뜨다	테이블	V4	첨부 파일 제목에 있는 검색어에 대한 고려 사항(가중치, 부동 소수점 값)을 지정합니다. 가중치 값이 검색 결과 관련성에 미치는 영향에 대한 자세한 내용은 을 참조하십시오 Zing은 다음 세 가지 구성요소를 사용하여 문서 점수를 계산합니다.	텍스트 인덱스 첨부 파일 제목 가중치	아니오	예
text_index _auto_stop	부울	테이블	모두	스톱 워드를 자동으로 식별하고 색인을 생성하지 않습니다. text_index_auto_stop_threshold에 지정된 임계치를 기준으로 합니다.	텍스트 인덱스 자동 중지	예	예
text_index_auto _stop_threshold	int	테이블	모두	단어가 자동으로 스톱 워드가 되는 임계치(정수, 발생 횟수)입니다. text_index_auto_stop 참조.	텍스트 인덱스 자동 중지 임계치	예	예
text_index_default _partial_matching_rule	문자열	테이블	모두	부분 일치 규칙 구성을 위한 문자열입니다. 입력은 다음을 기반으로 해야 합니다. 인덱싱된 테이블의 쿼리 모드를 변경합니다.	텍스트 인덱스 기본 부분 일치 규칙	아니오	예
text_index _default_query_mode	문자열	테이블	모두	쿼리 모드 구성을 위한 문자열입니다. 입력은 다음을 기반으로 해야 합니다 . 인덱싱된 테이블의 쿼리 모드 변경	텍스트 인덱스 기본 쿼리 모드	아니오	예
text_index _disable_synonym	부울	테이블	모두	TRUE는 동의어와 검색어를 검색할 수 없도록 설정합니다.	텍스트 인덱스 동의어 사용 안 함	아니오	예
text_index _enable_idf	부울	테이블	V3	TRUE는 TF-IDF점수를 사용하도록 설정합니다.	텍스트 인덱스 IDF 사용	아니오	예
text_index _filter_junk	부울	테이블	모두	기본적으로 TRUE이면 FALSE는 테이블에 대한 정크 필터를 사용하지 않도록 설정합니다. 기본적으로 Zing은 2자리 숫자와 단일 문자 단어(중국어 또는 일본어 문자 제외)를 인덱싱하거나 검색하지 않습니다. 정크 필터를 비활성화한 후 인덱스를 다시 생성합니다. 이 속성으로 인해 테이블 인덱스가 커집니다. 최적의 성능을 위해 필요한 경우가 아니면 적용하지 마십시오.	텍스트 인덱스 필터 정크	예	예
text_index _filter_query	테이블의 encodedQuery	테이블	모두	특정 필터 조건과 일치하는 행을 인덱싱하려는 경우 이 특성을 사용합니다. 속성 값은 테이블에서 encodedQuery여야 합니다.	인덱스 필터	예	아니오
text_index_filterable	부울	열	모두	이 특성이 true로 설정된 필드가 변경되면 필드 자체를 인덱싱할 수 없는 경우에도 행의 재인덱싱이 평가됩니다.	필터링 가능한 인덱스	예	아니오
text_index_include _stop_word	부울	테이블	모두	이 테이블에서 스톱 워드를 인덱싱해야 하는 경우 이 특성을 true로 설정합니다.	텍스트 인덱스 스톱 워드 포함	예	예
text_index_scorer_bm25_b	뜨다	테이블	V4	이 특성은 BM25 알고리즘에 사용되는 b 매개 변수입니다. text_index_scorer_bm25_b 참조.	bm25_b	아니오	예
text_index_scorer_bm25_k1	뜨다	테이블	V4	이 특성은 BM25 알고리즘에 사용되는 K1 매개 변수입니다. text_index_scorer_bm25_k1 참조.	bm25_k1	아니오	예
text_index_tags	문자열	테이블	모두	인덱싱하려는 태그 유형에 따라 특정 문자열: 비어 있음/everyone_only/all_shared로 설정해야 합니다.	텍스트 인덱스 태그	예	아니오
text_index_tokenizer _language	문자열	테이블	모두	일본어로 토큰화를 지원해야 하는 경우 "ja"(큰따옴표 제외)를 입력합니다.	텍스트 인덱스 토크나이저 언어	예	예
text_index_translations	부울	테이블	모두	존재하거나 예일 경우 번역된 문자열이 추가될 때 인덱스를 강제로 다시 계산합니다. 수정하려면 sys-admin 역할이 필요합니다. 번역된 인덱싱된 필드와 번역을 포함하고 인덱싱 중인 필드에 대해 자동으로 설정됩니다. glide.i18n.force_index 시스템 속성(기본값은 true)이 이 속성을 재정의합니다.	텍스트 인덱스 번역	예	아니오
text_search_and_or_limit	int	테이블	모두	전역 속성을 재정의하는 테이블 수준 사용자 지정 속성 text_search_and_or_limit 추가합니다.	텍스트 검색 및/또는 제한	아니오	아니오
ts_language	문자열	열	모두	특정 언어의 텍스트 인덱싱만 허용하도록 추가되었습니다.	텍스트 검색 언어	예	아니오
ts_multi_value_field _splitter	문자열	열	모두	한 필드가 다중 값 필드인 경우 이 속성의 필드에 스플리터를 추가하여 값의 인덱스 위치를 분산합니다. 예를 들어, multi:value를 구분하려면 이 속성에 :를 입력합니다.	텍스트 검색 다중 값 필드 스플리터	예	예
ts_weight	int	열	모두	텍스트 검색 필드에서 일치 항목의 상대적 중요도를 제어합니다. 가중치 값이 검색 결과 관련성에 미치는 영향에 대한 자세한 내용은 을 참조하십시오 Zing은 다음 세 가지 구성요소를 사용하여 문서 점수를 계산합니다. 필드에 대한 텍스트 검색 가중치를 설정하는 방법에 대한 자세한 내용은 을 참조하십시오 필드의 상대적 가중치 설정.	텍스트 검색 가중치	아니오	아니오

no_text_index

다양한 필드 유형에 대한 no_text_index 옵션을 설정하는 방법에 대한 지침은 고객 서비스 및 지원 사이트의 KB0859922Now Support 참조하세요.

text_index_scorer_bm25_b

이 사전 특성은 BM25 알고리즘의 일부입니다. 이 속성은 검색 결과에서 문서 길이의 중요도에 영향을 줍니다. 이 속성이 0이면 길이에 베어링이 없습니다. 이 경우 두 단어로 구성된 문서는 1000단어로 구성된 문서와 동등하게 평가됩니다. 매우 짧은 문서는 종종 긴 문서보다 가중치가 낮습니다. 기본값은 0.75입니다.

text_index_scorer_bm25_k1

이 사전 특성은 BM25 알고리즘의 일부입니다. 이 속성은 용어 빈도 채도 특성을 결정하는 데 도움이 됩니다. 즉, 검색어가 문서에 나타나면 문서의 관련성이 높아지지만 숫자가 증가함에 따라 증가의 영향이 줄어듭니다. 예를 들어 문서에서 검색어가 10번 발생하면 검색어가 하나만 있는 문서보다 관련성이 높습니다. 그러나 검색어가 100번 나오는 문서는 10번 나오는 문서보다 영향력이 10배 더 크지 않을 수 있습니다. 관련성은 최대 효과 점근선에 접근합니다. 속성 값이 높을수록 다중 발생의 최대 효과는 낮아집니다. 일반적인 값은 1.25 - 2.0 사이입니다.