Zing 인덱스 및 검색 딕셔너리 속성
다음 딕셔너리 속성은 Zing이 테이블을 인덱싱하거나 검색 결과의 순위를 지정하는 방식에 영향을 줍니다.
인덱스 및 검색 딕셔너리 속성
Zing은 테이블 또는 필드 수준에서 설정된 딕셔너리 속성을 사용하여 다음 설정을 구성합니다.
- 인덱싱 동작
- 검색 결과 순위
- BM25 관련성 순위 지정 알고리즘
| 이름 | 데이터 유형 | 적용 대상 | V3 또는 V4에 적용 | 설명 | 레이블 | 다시 인덱싱해야 합니까? | 루트 테이블만 |
|---|---|---|---|---|---|---|---|
| attachment_index | 부울 | 테이블 | 모두 | 예일 경우 테이블의 첨부 파일이 검색 목적으로 인덱싱됩니다. | 첨부 파일 인덱스 | 예 | 아니오 |
| no_text_index | 부울 | 모두 | 모두 | 필드의 이 속성은 필드가 텍스트 인덱스에 포함되지 않도록 합니다. | 텍스트 인덱스 없음 | 예 | 아니오 |
| text_index _attachment_body _weight | 부동 | 테이블 | V4 | 첨부 파일 본문에서 찾은 검색어에 대한 고려 사항(가중치, 부동 소수점 값)을 지정합니다. 가중치 값이 검색 결과 관련성에 미치는 영향에 대한 자세한 내용은 다음 문서를 참조하십시오 Zing은 세 가지 구성요소를 사용하여 문서 점수를 계산합니다.. | 텍스트 인덱스 첨부 파일 본문 가중치 | 아니오 | 예 |
| text_index _attachment_displayed | 부울 | 테이블 | 모두 | 텍스트 검색 결과에 첨부 파일을 표시합니다. | 텍스트 인덱스 첨부 파일이 표시됨 | 아니오 | 아니오 |
| text_index_attachment _title_weight | 부동 | 테이블 | V4 | 첨부 파일 제목에서 찾은 검색어에 제공할 고려도(가중치, 부동 소수점 값)를 지정합니다. 가중치 값이 검색 결과 관련성에 미치는 영향에 대한 자세한 내용은 다음 문서를 참조하십시오 Zing은 세 가지 구성요소를 사용하여 문서 점수를 계산합니다.. | 텍스트 인덱스 첨부 파일 제목 가중치 | 아니오 | 예 |
| text_index _auto_stop | 부울 | 테이블 | 모두 | 스톱 워드를 자동으로 식별하고 인덱싱하지 않습니다. text_index_auto_stop_threshold에 지정된 임계치를 기준으로 합니다. | 텍스트 인덱스 자동 중지 | 예 | 예 |
| text_index_auto _stop_threshold | 정수 | 테이블 | 모두 | 단어가 자동으로 스톱 워드가 되기 위한 임계치(정수, 발생 횟수)입니다. text_index_auto_stop 참조. | 텍스트 인덱스 자동 중지 임계치 | 예 | 예 |
| text_index_default _partial_matching_rule | 문자열 | 테이블 | 모두 | 부분 일치 규칙 구성을 위한 문자열입니다. 입력은 다음을 기반으로 해야 합니다. 인덱싱된 테이블의 쿼리 모드 변경. | 텍스트 인덱스 기본 부분 일치 규칙 | 아니오 | 예 |
| text_index _default_query_mode | 문자열 | 테이블 | 모두 | 쿼리 모드 구성을 위한 문자열입니다. 입력은 다음을 기반으로 해야 합니다. 인덱싱된 테이블의 쿼리 모드 변경 | 텍스트 인덱스 기본 쿼리 모드 | 아니오 | 예 |
| text_index _disable_synonym | 부울 | 테이블 | 모두 | TRUE는 검색어뿐만 아니라 동의어에 대한 검색을 비활성화합니다. | 텍스트 인덱스 동의어 사용 안 함 | 아니오 | 예 |
| text_index _enable_idf | 부울 | 테이블 | V3 | TRUE는 TF-IDF점수 매기기를 활성화합니다. | 텍스트 인덱스 IDF 사용 | 아니오 | 예 |
| text_index _filter_junk | 부울 | 테이블 | 모두 | 기본적으로 TRUE이고, FALSE는 테이블에 대한 정크 필터를 비활성화합니다. 기본적으로 Zing은 2자리 숫자와 단일 문자 단어(중국어 또는 일본어 문자가 아닌 경우)를 인덱싱하거나 검색하지 않습니다. 정크 필터를 사용하지 않도록 설정한 후 인덱스를 재작성합니다. 이 속성으로 인해 테이블 인덱스가 더 커집니다. 최적의 성능을 얻으려면 필요한 경우가 아니면 적용하지 마십시오. | 텍스트 인덱스 정크 필터 | 예 | 예 |
| text_index _filter_query | 테이블의 encodedQuery | 테이블 | 모두 | 특정 필터 조건과 일치하는 행을 인덱싱하려는 경우 이 속성을 사용합니다. 속성 값은 테이블의 encodedQuery여야 합니다. | 인덱스 필터 | 예 | 아니오 |
| text_index_filterable | 부울 | 열 | 모두 | 이 속성이 true 로 설정된 필드가 변경되면 필드 자체를 인덱싱할 수 없는 경우에도 행이 다시 인덱싱되도록 평가됩니다. | 인덱스 필터링 가능 | 예 | 아니오 |
| text_index_include _stop_word | 부울 | 테이블 | 모두 | 이 테이블에서 스톱 워드를 인덱싱해야 하는 경우 이 속성을 예로 설정하십시오. | 텍스트 인덱스 스톱 워드 포함 | 예 | 예 |
| text_index_scorer_bm25_b | 부동 | 테이블 | V4 | 이 속성은 BM25 알고리즘에 사용되는 b 매개변수입니다. text_index_scorer_bm25_b 참조. | bm25_b | 아니오 | 예 |
| text_index_scorer_bm25_k1 | 부동 | 테이블 | V4 | 이 속성은 BM25 알고리즘에 사용되는 K1 매개변수입니다. text_index_scorer_bm25_k1 참조. | bm25_k1 | 아니오 | 예 |
| text_index_tags | 문자열 | 테이블 | 모두 | 인덱싱하려는 태그의 유형에 따라 특정 문자열: 비어 있음/everyone_only/all_shared으로 설정해야 합니다. | 텍스트 인덱스 태그 | 예 | 아니오 |
| text_index_tokenizer _language | 문자열 | 테이블 | 모두 | 일본어로 토큰화를 지원해야 하는 경우 "ja"(큰따옴표 제외)를 넣습니다. | 텍스트 인덱스 토크나이저 언어 | 예 | 예 |
| text_index_translations | 부울 | 테이블 | 모두 | 존재하거나 예인 경우 번역된 문자열이 추가될 때 인덱스를 강제로 다시 계산합니다. 수정하려면 sys-admin 역할이 필요합니다. 번역된 인덱싱된 필드와 번역이 있고 인덱싱 중인 필드에 대해 자동으로 설정됩니다. 기본값이 true인 glide.i18n.force_index 시스템 속성이 이 속성을 재정의합니다. | 텍스트 인덱스 번역 | 예 | 아니오 |
| text_search_and_or_limit | 정수 | 테이블 | 모두 | 전역 속성을 재정의하는 테이블 수준 사용자 지정 속성 text_search_and_or_limit을 추가합니다. | 텍스트 검색 및/또는 제한 | 아니오 | 아니오 |
| ts_language | 문자열 | 열 | 모두 | 특정 언어의 텍스트 인덱싱만 허용하기 위해 추가되었습니다. | 텍스트 검색 언어 | 예 | 아니오 |
| ts_multi_value_field _splitter | 문자열 | 열 | 모두 | 한 필드가 다중 값 필드인 경우 이 속성의 필드에 스플리터를 추가하여 값의 인덱스 위치를 분산합니다. 예를 들어 multi:value를 구분하려면 이 속성에 :을 입력합니다. | 텍스트 검색 다중 값 필드 스플리터 | 예 | 예 |
| ts_weight | 정수 | 열 | 모두 | 텍스트 검색 필드에서 일치 항목의 상대적 중요도를 제어합니다. 가중치 값이 검색 결과 관련성에 미치는 영향에 대한 자세한 내용은 다음 문서를 참조하십시오 Zing은 세 가지 구성요소를 사용하여 문서 점수를 계산합니다.. 필드에 대한 텍스트 검색 가중치를 설정하는 방법에 대한 자세한 내용은 다음 문서를 참조하십시오 필드의 상대적 가중치 설정. | 텍스트 검색 가중치 | 아니오 | 아니오 |
no_text_index
다양한 필드 유형에 대한 no_text_index 옵션 설정에 대한 지침은 고객 서비스 및 지원 사이트의 Now SupportKB0859922 참조하십시오.
text_index_scorer_bm25_b
이 딕셔너리 속성은 BM25 알고리즘의 일부입니다. 이 속성은 검색 결과에서 문서 길이의 중요도에 영향을 줍니다. 이 속성이 0이면 길이에 베어링이 없습니다. 이 경우 두 단어로 구성된 문서는 1000단어로 구성된 문서와 동등하게 평가됩니다. 매우 짧은 문서는 종종 긴 문서보다 가중치가 낮습니다. 기본값은 0.75입니다.
text_index_scorer_bm25_k1
이 딕셔너리 속성은 BM25 알고리즘의 일부입니다. 이 속성은 용어 빈도 포화 특성을 결정하는 데 도움이 됩니다. 즉, 문서에 검색어가 표시되면 문서의 관련성이 증가하지만 숫자가 증가함에 따라 증가 영향은 줄어듭니다. 예를 들어 문서에서 검색어가 10번 발생하는 경우 한 번만 발생하는 문서보다 관련성이 높습니다. 하지만 검색어가 100번 발생하는 문서는 10번 검색어가 있는 문서보다 영향력이 10배는 아닐 수 있습니다. 관련성은 최대 효과 점근선에 접근합니다. 속성 값이 높을수록 여러 번의 최대 효과는 낮아집니다. 일반적인 값은 1.25 - 2.0 사이입니다.