Zing 인덱스 및 검색 딕셔너리 속성
다음 딕셔너리 속성은 Zing이 테이블을 인덱싱하거나 검색 결과의 순위를 매기는 방식에 영향을 줍니다.
인덱스 및 검색 딕셔너리 속성
Zing은 테이블 또는 필드 수준에서 설정된 딕셔너리 속성을 사용하여 다음 설정을 구성합니다.
- 인덱싱 동작
- 검색 결과 순위
- BM25 관련성 순위 알고리즘
| 이름 | 데이터 유형 | 적용 대상 | V3 또는 V4에 적용 | 설명 | 레이블 | 재인덱싱이 필요하십니까? | 루트 테이블만 |
|---|---|---|---|---|---|---|---|
| attachment_index | 부울 | 테이블 | 모두 | 예일 경우 검색 목적으로 테이블의 첨부 파일이 인덱싱됩니다. | 첨부 파일 인덱스 | 예 | 아니오 |
| no_text_index | 부울 | 모두 | 모두 | 필드의 이 속성은 필드가 텍스트 인덱스에 포함되지 않도록 합니다. | 텍스트 인덱스 없음 | 예 | 아니오 |
| text_index _attachment_body _weight | 뜨다 | 테이블 | V4 | 첨부 파일 본문에서 찾은 검색어에 제공할 고려 사항(가중치, 부동 소수점 값)을 지정합니다. 가중치 값이 검색 결과 관련성에 미치는 영향에 대한 자세한 내용은 을 참조하십시오 Zing은 다음 세 가지 구성요소를 사용하여 문서 점수를 계산합니다. | 텍스트 인덱스 첨부 파일 본문 가중치 | 아니오 | 예 |
| text_index _attachment_displayed | 부울 | 테이블 | 모두 | 텍스트 검색 결과에 첨부 파일을 표시합니다. | 텍스트 인덱스 첨부 파일 표시됨 | 아니오 | 아니오 |
| text_index_attachment _title_weight | 뜨다 | 테이블 | V4 | 첨부 파일 제목에 있는 검색어에 대한 고려 사항(가중치, 부동 소수점 값)을 지정합니다. 가중치 값이 검색 결과 관련성에 미치는 영향에 대한 자세한 내용은 을 참조하십시오 Zing은 다음 세 가지 구성요소를 사용하여 문서 점수를 계산합니다. | 텍스트 인덱스 첨부 파일 제목 가중치 | 아니오 | 예 |
| text_index _auto_stop | 부울 | 테이블 | 모두 | 스톱 워드를 자동으로 식별하고 색인을 생성하지 않습니다. text_index_auto_stop_threshold에 지정된 임계치를 기준으로 합니다. | 텍스트 인덱스 자동 중지 | 예 | 예 |
| text_index_auto _stop_threshold | int | 테이블 | 모두 | 단어가 자동으로 스톱 워드가 되는 임계치(정수, 발생 횟수)입니다. text_index_auto_stop 참조. | 텍스트 인덱스 자동 중지 임계치 | 예 | 예 |
| text_index_default _partial_matching_rule | 문자열 | 테이블 | 모두 | 부분 일치 규칙 구성을 위한 문자열입니다. 입력은 다음을 기반으로 해야 합니다. 인덱싱된 테이블의 쿼리 모드를 변경합니다. | 텍스트 인덱스 기본 부분 일치 규칙 | 아니오 | 예 |
| text_index _default_query_mode | 문자열 | 테이블 | 모두 | 쿼리 모드 구성을 위한 문자열입니다. 입력은 다음을 기반으로 해야 합니다 . 인덱싱된 테이블의 쿼리 모드 변경 | 텍스트 인덱스 기본 쿼리 모드 | 아니오 | 예 |
| text_index _disable_synonym | 부울 | 테이블 | 모두 | TRUE는 동의어와 검색어를 검색할 수 없도록 설정합니다. | 텍스트 인덱스 동의어 사용 안 함 | 아니오 | 예 |
| text_index _enable_idf | 부울 | 테이블 | V3 | TRUE는 TF-IDF점수를 사용하도록 설정합니다. | 텍스트 인덱스 IDF 사용 | 아니오 | 예 |
| text_index _filter_junk | 부울 | 테이블 | 모두 | 기본적으로 TRUE이면 FALSE는 테이블에 대한 정크 필터를 사용하지 않도록 설정합니다. 기본적으로 Zing은 2자리 숫자와 단일 문자 단어(중국어 또는 일본어 문자 제외)를 인덱싱하거나 검색하지 않습니다. 정크 필터를 비활성화한 후 인덱스를 다시 생성합니다. 이 속성으로 인해 테이블 인덱스가 커집니다. 최적의 성능을 위해 필요한 경우가 아니면 적용하지 마십시오. | 텍스트 인덱스 필터 정크 | 예 | 예 |
| text_index _filter_query | 테이블의 encodedQuery | 테이블 | 모두 | 특정 필터 조건과 일치하는 행을 인덱싱하려는 경우 이 특성을 사용합니다. 속성 값은 테이블에서 encodedQuery여야 합니다. | 인덱스 필터 | 예 | 아니오 |
| text_index_filterable | 부울 | 열 | 모두 | 이 특성이 true로 설정된 필드가 변경되면 필드 자체를 인덱싱할 수 없는 경우에도 행의 재인덱싱이 평가됩니다. | 필터링 가능한 인덱스 | 예 | 아니오 |
| text_index_include _stop_word | 부울 | 테이블 | 모두 | 이 테이블에서 스톱 워드를 인덱싱해야 하는 경우 이 특성을 true로 설정합니다. | 텍스트 인덱스 스톱 워드 포함 | 예 | 예 |
| text_index_scorer_bm25_b | 뜨다 | 테이블 | V4 | 이 특성은 BM25 알고리즘에 사용되는 b 매개 변수입니다. text_index_scorer_bm25_b 참조. | bm25_b | 아니오 | 예 |
| text_index_scorer_bm25_k1 | 뜨다 | 테이블 | V4 | 이 특성은 BM25 알고리즘에 사용되는 K1 매개 변수입니다. text_index_scorer_bm25_k1 참조. | bm25_k1 | 아니오 | 예 |
| text_index_tags | 문자열 | 테이블 | 모두 | 인덱싱하려는 태그 유형에 따라 특정 문자열: 비어 있음/everyone_only/all_shared로 설정해야 합니다. | 텍스트 인덱스 태그 | 예 | 아니오 |
| text_index_tokenizer _language | 문자열 | 테이블 | 모두 | 일본어로 토큰화를 지원해야 하는 경우 "ja"(큰따옴표 제외)를 입력합니다. | 텍스트 인덱스 토크나이저 언어 | 예 | 예 |
| text_index_translations | 부울 | 테이블 | 모두 | 존재하거나 예일 경우 번역된 문자열이 추가될 때 인덱스를 강제로 다시 계산합니다. 수정하려면 sys-admin 역할이 필요합니다. 번역된 인덱싱된 필드와 번역을 포함하고 인덱싱 중인 필드에 대해 자동으로 설정됩니다. glide.i18n.force_index 시스템 속성(기본값은 true)이 이 속성을 재정의합니다. | 텍스트 인덱스 번역 | 예 | 아니오 |
| text_search_and_or_limit | int | 테이블 | 모두 | 전역 속성을 재정의하는 테이블 수준 사용자 지정 속성 text_search_and_or_limit 추가합니다. | 텍스트 검색 및/또는 제한 | 아니오 | 아니오 |
| ts_language | 문자열 | 열 | 모두 | 특정 언어의 텍스트 인덱싱만 허용하도록 추가되었습니다. | 텍스트 검색 언어 | 예 | 아니오 |
| ts_multi_value_field _splitter | 문자열 | 열 | 모두 | 한 필드가 다중 값 필드인 경우 이 속성의 필드에 스플리터를 추가하여 값의 인덱스 위치를 분산합니다. 예를 들어, multi:value를 구분하려면 이 속성에 :를 입력합니다. | 텍스트 검색 다중 값 필드 스플리터 | 예 | 예 |
| ts_weight | int | 열 | 모두 | 텍스트 검색 필드에서 일치 항목의 상대적 중요도를 제어합니다. 가중치 값이 검색 결과 관련성에 미치는 영향에 대한 자세한 내용은 을 참조하십시오 Zing은 다음 세 가지 구성요소를 사용하여 문서 점수를 계산합니다. 필드에 대한 텍스트 검색 가중치를 설정하는 방법에 대한 자세한 내용은 을 참조하십시오 필드의 상대적 가중치 설정. | 텍스트 검색 가중치 | 아니오 | 아니오 |
no_text_index
다양한 필드 유형에 대한 no_text_index 옵션을 설정하는 방법에 대한 지침은 고객 서비스 및 지원 사이트의 KB0859922Now Support 참조하세요.
text_index_scorer_bm25_b
이 사전 특성은 BM25 알고리즘의 일부입니다. 이 속성은 검색 결과에서 문서 길이의 중요도에 영향을 줍니다. 이 속성이 0이면 길이에 베어링이 없습니다. 이 경우 두 단어로 구성된 문서는 1000단어로 구성된 문서와 동등하게 평가됩니다. 매우 짧은 문서는 종종 긴 문서보다 가중치가 낮습니다. 기본값은 0.75입니다.
text_index_scorer_bm25_k1
이 사전 특성은 BM25 알고리즘의 일부입니다. 이 속성은 용어 빈도 채도 특성을 결정하는 데 도움이 됩니다. 즉, 검색어가 문서에 나타나면 문서의 관련성이 높아지지만 숫자가 증가함에 따라 증가의 영향이 줄어듭니다. 예를 들어 문서에서 검색어가 10번 발생하면 검색어가 하나만 있는 문서보다 관련성이 높습니다. 그러나 검색어가 100번 나오는 문서는 10번 나오는 문서보다 영향력이 10배 더 크지 않을 수 있습니다. 관련성은 최대 효과 점근선에 접근합니다. 속성 값이 높을수록 다중 발생의 최대 효과는 낮아집니다. 일반적인 값은 1.25 - 2.0 사이입니다.