기타 레이블 제거
분류 모델의 노이즈를 줄이고 학습 데이터에서 레이블이 "기타"인 레코드를 제거하여 예측 정확도를 향상시킵니다. 배포 빈도가 1% 미만인 기록입니다.
시작하기 전에
필요한 역할: ml_admin 또는 admin
이 태스크 정보
이 옵션을 true로 설정하면 총 데이터 분포의 1% 미만인 기록은 교육에서 제외됩니다. 이러한 기록은 인터페이스에서 "기타"로 레이블이 지정됩니다. 1% 임계치는 수정할 수 없습니다.
다음 절차를 사용하여 솔루션 정의 양식에 이 옵션을 추가할 수 있습니다. 또는 스크립트를 사용하여 이 옵션을 추가할 수 있습니다.
스크립트를 사용하여 이 옵션을 추가하려면 다음을 수행합니다.
config.removeOthersLabel(true);JSON 형식:
{
"remove_others_label": true
}
프로시저
결과
이 설정은 솔루션 양식의 고급 솔루션 설정 탭에 행으로 나타납니다.
다음에 수행할 작업
솔루션을 다시 교육합니다.