Zing 인덱스 및 검색 딕셔너리 속성
다음 딕셔너리 속성은 Zing이 테이블을 인덱싱하거나 검색 결과의 순위를 지정하는 방식에 영향을 줍니다.
인덱스 및 검색 딕셔너리 속성
Zing은 테이블 또는 필드 수준에서 설정된 딕셔너리 속성을 사용하여 다음 설정을 구성합니다.
- 인덱싱 동작
- 검색 결과 순위
- BM25 관련성 순위 알고리즘
| 이름 | 데이터 유형 | 적용 대상 | V3 또는 V4에 적용 | 설명 | 레이블 | 재인덱싱이 필요하십니까? | 루트 테이블만 |
|---|---|---|---|---|---|---|---|
| attachment_index | 부울 | 테이블 | 모두 | 예일 경우 테이블의 첨부 파일이 검색을 위해 인덱싱됩니다. | 첨부 파일 인덱스 | 예 | 아니오 |
| no_text_index | 부울 | 모두 | 모두 | 필드의 이 속성은 필드가 텍스트 인덱스에 포함되지 않도록 합니다. | 텍스트 인덱스 없음 | 예 | 아니오 |
| text_index _attachment_body _weight | 부동 | 테이블 | V4 | 첨부 파일의 본문에서 찾은 검색어에 제공할 고려 사항(가중치, 부동 소수점 값)을 지정합니다. 가중치 값이 검색 결과 관련성에 미치는 영향에 대한 자세한 내용은 을 참조하십시오 Zing은 세 가지 구성요소를 사용하여 문서 점수를 계산합니다.. | 텍스트 인덱스 첨부 파일 본문 가중치 | 아니오 | 예 |
| text_index _attachment_displayed | 부울 | 테이블 | 모두 | 텍스트 검색 결과에 첨부 파일을 표시합니다. | 텍스트 인덱스 첨부 파일 표시됨 | 아니오 | 아니오 |
| text_index_attachment _title_weight | 부동 | 테이블 | V4 | 첨부 파일 제목에 있는 검색어에 제공할 고려 사항(가중치, 부동 소수점 값)을 지정합니다. 가중치 값이 검색 결과 관련성에 미치는 영향에 대한 자세한 내용은 을 참조하십시오 Zing은 세 가지 구성요소를 사용하여 문서 점수를 계산합니다.. | 텍스트 인덱스 첨부 파일 제목 가중치 | 아니오 | 예 |
| text_index _auto_stop | 부울 | 테이블 | 모두 | 스톱 워드를 자동으로 식별하고 인덱싱하지 않습니다. text_index_auto_stop_threshold에 지정된 임계치를 기준으로 합니다. | 텍스트 인덱스 자동 중지 | 예 | 예 |
| text_index_auto _stop_threshold | int | 테이블 | 모두 | 단어가 자동으로 스톱 워드가 되는 임계치(정수, 발생 횟수)입니다. text_index_auto_stop 참조하십시오. | 텍스트 인덱스 자동 중지 임계치 | 예 | 예 |
| text_index_default _partial_matching_rule | 문자열 | 테이블 | 모두 | 부분 일치 규칙 구성을 위한 문자열입니다. 입력은 다음을 기반으로 해야 합니다. 인덱싱된 테이블의 쿼리 모드 변경. | 텍스트 인덱스 기본 부분 일치 규칙 | 아니오 | 예 |
| text_index _default_query_mode | 문자열 | 테이블 | 모두 | 쿼리 모드 구성을 위한 문자열입니다. 입력은 다음을 기반으로 해야 합니다. 인덱싱된 테이블의 쿼리 모드 변경 | 텍스트 인덱스 기본 쿼리 모드 | 아니오 | 예 |
| text_index _disable_synonym | 부울 | 테이블 | 모두 | TRUE는 동의어 및 검색어에 대한 검색을 비활성화합니다. | 텍스트 인덱스 동의어 사용 안 함 | 아니오 | 예 |
| text_index _enable_idf | 부울 | 테이블 | V3 | TRUE이면 TF-IDF점수 매기기를 사용할 수 있습니다. | 텍스트 인덱스 IDF 사용 | 아니오 | 예 |
| text_index _filter_junk | 부울 | 테이블 | 모두 | 기본적으로 TRUE인 FALSE는 테이블에 대한 정크 필터를 사용하지 않도록 설정합니다. 기본적으로 Zing은 2자리 숫자와 단일 문자 단어를 인덱싱하거나 검색하지 않습니다(중국어 또는 일본어 문자가 아닌 경우). 정크 필터를 사용하지 않도록 설정한 후 인덱스를 재생성합니다. 이 속성으로 인해 테이블 인덱스가 커집니다. 최적의 성능을 위해 필요한 경우가 아니면 적용하지 마십시오. | 텍스트 인덱스 필터 정크 | 예 | 예 |
| text_index _filter_query | 테이블의 encodedQuery | 테이블 | 모두 | 특정 필터 조건과 일치하는 행을 인덱싱하려는 경우 이 특성을 사용합니다. 속성 값은 테이블의 encodedQuery여야 합니다. | 인덱스 필터 | 예 | 아니오 |
| text_index_filterable | 부울 | 열 | 모두 | 이 특성이 true로 설정된 필드가 변경되면 다시 인덱싱하도록 행이 평가됩니다(필드 자체를 인덱싱할 수 없는 경우에도). | 필터링 가능 인덱스 | 예 | 아니오 |
| text_index_include _stop_word | 부울 | 테이블 | 모두 | 이 테이블에서 스톱 워드를 인덱싱해야 하는 경우 이 특성을 true로 설정합니다. | 텍스트 인덱스 스톱 워드 포함 | 예 | 예 |
| text_index_scorer_bm25_b | 부동 | 테이블 | V4 | 이 특성은 BM25 알고리즘에 사용되는 b 매개 변수입니다. text_index_scorer_bm25_b 참조하십시오. | bm25_b | 아니오 | 예 |
| text_index_scorer_bm25_k1 | 부동 | 테이블 | V4 | 이 특성은 BM25 알고리즘에 사용되는 K1 매개 변수입니다. text_index_scorer_bm25_k1 참조하십시오. | bm25_k1 | 아니오 | 예 |
| text_index_tags | 문자열 | 테이블 | 모두 | 인덱싱하려는 태그 유형에 따라 특정 문자열(empty/everyone_only/all_shared)로 설정해야 합니다. | 텍스트 인덱스 태그 | 예 | 아니오 |
| text_index_tokenizer _language | 문자열 | 테이블 | 모두 | 일본어로 토큰화를 지원해야 하는 경우 "ja"(큰 따옴표 제외)를 입력합니다. | 텍스트 인덱스 토크나이저 언어 | 예 | 예 |
| text_index_translations | 부울 | 테이블 | 모두 | 존재하거나 예인 경우 번역된 문자열이 추가될 때 인덱스가 다시 계산되도록 합니다. 수정하려면 sys-admin 역할이 필요합니다. 번역되는 인덱싱된 필드와 번역이 있고 인덱싱 중인 필드에 대해 자동으로 설정됩니다. 기본값이 true인 glide.i18n.force_index 시스템 속성이 이 속성을 재정의합니다. | 텍스트 인덱스 번역 | 예 | 아니오 |
| text_search_and_or_limit | int | 테이블 | 모두 | 전역 속성을 재정의하는 테이블 수준 사용자 지정 속성 text_search_and_or_limit 추가합니다. | 텍스트 검색 및 또는 제한 | 아니오 | 아니오 |
| ts_language | 문자열 | 열 | 모두 | 특정 언어의 텍스트 인덱싱만 허용하기 위해 추가되었습니다. | 텍스트 검색 언어 | 예 | 아니오 |
| ts_multi_value_field _splitter | 문자열 | 열 | 모두 | 한 필드가 다중 값 필드인 경우 이 속성의 필드에 스플리터를 추가하여 값의 인덱스 위치를 분산합니다. 예를 들어 multi:value를 구분하려면 이 속성에 :를 입력합니다. | 텍스트 검색 다중 값 필드 스플리터 | 예 | 예 |
| ts_weight | int | 열 | 모두 | 텍스트 검색을 위한 필드에서 일치 항목의 상대적 중요도를 제어합니다. 가중치 값이 검색 결과 관련성에 미치는 영향에 대한 자세한 내용은 을 참조하십시오 Zing은 세 가지 구성요소를 사용하여 문서 점수를 계산합니다.. 필드에 대한 텍스트 검색 가중치를 설정하는 방법에 대한 자세한 내용은 문서를 참조하십시오 필드의 상대적 가중치 설정. | 텍스트 검색 가중치 | 아니오 | 아니오 |
no_text_index
고객 서비스 및 지원 다양한 필드 유형에 대한 no_text_index 옵션을 설정하는 방법에 대한 지침은 사이트의 KB0859922Now Support 참조하십시오.
text_index_scorer_bm25_b
이 사전 특성은 BM25 알고리즘의 일부입니다. 이 속성은 검색 결과에서 문서 길이의 중요도에 영향을 줍니다. 이 속성이 0이면 길이에 방향이 없습니다. 이 경우 두 단어로 구성된 문서는 1000단어로 구성된 문서와 동등하게 평가됩니다. 매우 짧은 문서는 종종 긴 문서보다 가중치가 낮습니다. 기본값은 0.75입니다.
text_index_scorer_bm25_k1
이 사전 특성은 BM25 알고리즘의 일부입니다. 이 속성은 용어 빈도 포화 특성을 결정하는 데 도움이 됩니다. 즉, 문서에 검색어를 표시하면 문서의 관련성이 높아지지만 숫자가 증가함에 따라 증가의 영향은 줄어듭니다. 예를 들어 문서에서 검색어가 10번 발생하면 검색어가 한 번만 나오는 문서보다 관련성이 더 높습니다. 그러나 검색어가 100번 발생한 문서는 10번 발생한 문서보다 10배 더 영향력이 크지 않을 수 있습니다. 관련성은 최대 효과 점근선에 접근합니다. 속성 값이 높을수록 여러 번 발생하는 최대 효과는 낮아집니다. 일반적인 값은 1.25에서 2.0 사이입니다.