레이블에 포함시키는 데 필요한 최소 기록
모델 교육에 포함할 데이터 세트에서 레이블이 가져야 하는 최소 레코드 수에 대한 임계치를 설정합니다.
시작하기 전에
데이터 세트에 분류에 적합한 레이블 값이 포함되어 있는지 확인합니다.
필요한 역할: ml_admin 또는 admin
이 태스크 정보
이 고급 옵션은 자주 발생하지 않는 레이블을 제거하는 데 도움이 됩니다. 이 최소 임계값을 설정하면 과적합 및 신뢰할 수 없는 예측을 줄일 수 있습니다.
구성하려면 최소 기록 수에 대한 숫자를 제공합니다. 최소값보다 레코드 수가 적은 클래스 값은 교육 세트에서 삭제됩니다. 교육 전에 삭제된 클래스 값은 예측에 표시할 수 없습니다.
스크립트를 사용하여 이 옵션을 추가하려면 다음을 수행합니다.
config.setMinLabelCount(50);JSON 형식:
{
"min_label_count": 50
}
프로시저
결과
이 설정은 솔루션 양식의 고급 솔루션 설정 탭에 행으로 나타납니다.
다음에 수행할 작업
솔루션을 다시 교육합니다.