분류 솔루션 생성 및 교육

  • 릴리스 버전: Washingtondc
  • 업데이트 날짜 2024년 02월 01일
  • 읽기6분
  • 분류 솔루션을 교육하는 데 사용되는 기록, 예측을 트리거하는 필드, 솔루션을 재교육하려는 빈도를 지정합니다.

    시작하기 전에

    • 사용자 지정 스톱 워드 목록을 만듭니다.
    • 필요한 역할: admin 또는 ml_admin

    이 태스크 정보

    예측 인텔리전스 은 원본 데이터가 이러한 유형의 암호화로 보호되는 교육 솔루션을 지원합니다.
    • FDE(전체 디스크 암호화).
    • 열 수준 암호화. Column Level Encryption을 사용하는 경우 sharedservice.worker 사용자에게 암호화에 사용된 것과 동일한 암호화 모듈 역할이 있는지 확인합니다.
    주:
    예측 인텔리전스 는 Edge Encryption으로 원본 데이터를 암호화하는 교육 솔루션을 지원하지 않습니다.

    예측 모델은 학습에 사용하는 데이터에 따라 성능이 달라집니다. 적절한 교육 기록을 선택하려면 사용할 기록 값의 현재 품질뿐만 아니라 테이블 데이터베이스 딕셔너리를 숙지해야 합니다.

    지원하려는 각 예측 모델에 대해 별도의 솔루션 정의 기록을 만들어야 합니다. 컨텍스트 메뉴에서 솔루션 정의 복사를 클릭하여 솔루션 정의 기록과 해당 구성을 새 양식에 복사할 수 있습니다. 새 레코드를 사용하면 전체 솔루션 정의를 재구성하지 않고도 추가 솔루션을 업데이트할 수 있습니다.

    주:
    교육 데이터 세트에 레코드가 30개 미만인 클래스는 솔루션 교육에서 제외됩니다. 솔루션이 학습되고 완료되면 제외된 클래스가 ML 솔루션 양식의 솔루션 통계 섹션에 나열됩니다.

    솔루션 교육에서 제외된 모든 클래스는 교육된 솔루션의 ML 솔루션 양식에 있는 솔루션 통계 섹션에 나열됩니다.

    프로시저

    1. 다음으로 이동 모두 > Predictive Intelligence > 분류 > 솔루션 정의레이블이 표시됩니다.
    2. 분류 정의 목록에서 새로 만들기를 클릭합니다.
    3. 빈 분류 정의 양식에서 다음 지침에 따라 이러한 필드를 구성합니다.
      필드
      레이블 솔루션 기록의 고유한 이름을 입력합니다.
      이름 시스템은 사용자가 입력한 레이블 값을 기반으로 이 읽기 전용 필드의 값을 생성합니다.
      Word 말뭉치

      솔루션과 관련된 기존 단어 말뭉치를 선택합니다. 예를 들어, 이 사용 사례에서는 지난 3개월 동안의 인시던트와 같은 제목이 있는 단어 말뭉치를 선택합니다.

      관련 단어 말뭉치가 없는 경우 먼저 단계에 따라 단어 말뭉치를 만듭니다 . 단어 말뭉치가 완료되면 분류 정의 양식의 단어 말뭉치 필드에서 단어 말뭉치를 선택할 수 있습니다.

      주:
      단어 말뭉치는 Utah에서 시작하여 처음으로 구현하는 예측 인텔리전스 고객에게는 필수 필드가 아닙니다. 미리 학습된 모델이 대신 사용됩니다.
      테이블 시스템에서 예측할 대상 기록이 포함된 테이블을 선택합니다.
      출력 필드

      예측 모델을 설정할 값이 있는 필드를 선택합니다.

      일반적으로 좋은 출력 필드에는 이러한 특성이 있습니다.
      • 선택 필드 또는 유한한 가능한 값 집합이 있는 문자열 필드입니다.
      • 입력 필드와 인과 관계가 있습니다.

      예를 들어, 기본 인시던트 범주화 솔루션 정의는 범주 필드를 출력 필드로 사용합니다.

      필드

      솔루션에서 예측을 생성하는 데 사용할 입력 필드를 선택합니다.

      입력 필드는 예측 솔루션이 성공하는 데 필요한 분류 정보를 포함할 수 있는 기록 내의 필드입니다. 예를 들어 인시던트 기록을 분류하기 위한 올바른 클래스를 예측하는 경우 예측은 클래스를 참조하는 텍스트가 포함된 기록을 수집해야 합니다. 대부분의 기록은 간단한 설명 필드에 상황별 텍스트가 있으므로 일반적으로 사용하기에 좋은 입력 필드입니다. 해결 메모를 입력 필드로 사용할 수도 있습니다. 인시던트의 세부 메모에서 인시던트 클래스를 참조할 수도 있습니다.

      일반적으로 좋은 입력 필드에는 이러한 특성이 있습니다.
      • 사용자는 기록을 만들 때 이 필드를 사용할 수 있습니다.
      • 필드 데이터 유형은 문자열, 참조, 선택 또는 HTML일 수 있습니다. 필드에서 제공하는 정보가 많을수록 솔루션에서 더 자주 예측할 수 있으며 예측이 더 자주 정확해집니다.
      • 필드에 기본값이 있으며 비워둘 수 없습니다.

      모든 기본 솔루션 정의는 간단한 설명 필드를 사용합니다.

      필터

      Add Filter Condition(필터 조건 추가)을 클릭하여 훈련 중인 레코드에 조건을 적용합니다.

      예를 들어 인시던트 분류 솔루션 정의는 [Created][on][Last 12 months] AND [Active][is][false] AND [State][is one of][Resolved | 휴관일]

      솔루션을 교육하려면 필터가 하나 이상의 레코드를 반환해야 합니다. 필터가 레코드를 반환하지 않으면 학습용 레코드가 반환될 때까지 업데이트합니다.
      주:
      좋은 솔루션을 학습하기 위해 권장되는 레코드 수는 30,000개에서 300,000개 사이입니다. 300,000개가 넘는 레코드를 제출하면 가장 최근 레코드 300,000개가 솔루션을 교육하는 데 사용됩니다 데이터베이스에서 인증된 레코드만 사용하십시오.
      솔루션은 학습에 사용하는 데이터에 따라 달라집니다. 일반적으로 좋은 필터에는 이러한 특성이 있습니다.
      • 교육 기록에는 비활성 상태이며 해결됨 또는 종결됨과 같이 표준 프로세스 내에서 작업 완료를 나타내는 작업 상태가 있습니다.
      • 교육 기록에는 대상 필드에 대한 올바른 값만 포함되어 있습니다. 신뢰할 수 없는 대상 필드 값이 있는 기록을 필터링합니다. 예를 들어, 할당 그룹/범주를 예측하는 중이고 이력 인시던트 데이터에 더 이상 사용되지 않는 할당 그룹/범주가 있는 경우 필터를 추가하여 교육에서 이러한 인시던트 기록을 제거합니다.
      • 교육 기록에는 솔루션에서 예측하려는 각 대상 필드 값의 예가 여러 개 포함되어 있습니다.
      • 교육 기록에는 입력 필드의 일반적인 변형이 포함됩니다.

      하드 코딩된 날짜를 필터로 사용하지 마세요. 이러한 필터는 솔루션을 재교육할 때 모든 재교육 전에 수동으로 업데이트하지 않으면 업데이트되지 않습니다. 대신 지난 3개월, 지난 6개월, 지난 12개월과 같은 상대 날짜 필터를 사용하십시오.

      처리 언어 솔루션 정의에서 학습하려는 데이터 세트의 지배적 언어를 선택합니다. 데이터 세트 언어가 이탈리아어인 경우 이탈리아어를 선택합니다. 또한 기본적으로 모든 데이터 세트에 영어 처리가 적용됩니다. 예를 들어, 이탈리아어를 선택하면 시스템이 데이터를 영어와 이탈리아어로 처리합니다.
      주:
      처리 중이라는 용어는 솔루션 교육의 일부로 사용되는 언어별 단계를 나타냅니다. 예를 들면 단어 토큰화, 스톱 워드 제거, 어간 추출 등입니다.
      스톱 워드 처리 언어를 선택하면 시스템이 자동으로 동일한 언어를 사용하는 스톱 워드 목록을 추가합니다. 예를 들어, 처리 언어가 이탈리아어인 경우 기본 이탈리아어 스톱 워드 목록이 나타납니다. 기본 영어 스톱 워드 목록도 선택 항목에 나타납니다. 사용자 지정 스톱 워드 목록을 만드는 경우 스톱 워드 필드에서 선택하고 솔루션에 추가할 수 있습니다.
      교육 빈도
      시스템이 필터와 일치하는 기록을 기반으로 솔루션을 다시 생성하는 빈도를 선택합니다. 옵션은 다음과 같습니다.
      • 한 번 실행
      • 30일 마다
      • 60일마다
      • 90일 마다
      • 120일 마다
      • 180일 마다
      주:
      분류 솔루션 교육에 필요한 최소 기록 수는 10,000개로 설정됩니다.

      기본적으로 시스템에서 교육을 한 번 실행합니다. 이 연습에서는 허용 가능한 범위와 정확도 값을 제공할 때까지 필요한 만큼 솔루션 정의를 검토하고 업데이트할 시간이 제공됩니다.

      솔루션 정의가 상당히 안정적이면 시간이 지남에 따라 데이터가 노화되어 예측 모델의 정확도가 저하될 수 있으므로 예약된 교육을 고려하십시오.

      주:
      ML 스케줄러는 인스턴스가 커밋할 수 있는 교육의 수를 24시간 동안 인스턴스당 50개의 새로운 ML 교육 요청으로 제한합니다. 새 교육 요청이 24시간 내에 50개를 초과하는 경우에도 이 제한에서 예약된 재교육 요청, 클러스터링 업데이트 및 유사성 업데이트가 제외됩니다.
    4. 솔루션 정의에 대한 적절한 컨텍스트 메뉴 옵션 또는 버튼을 클릭합니다.
      옵션설명
      저장 또는 저장 및 교육 솔루션 정의 기록을 저장하여 나중에 반환하거나 교육을 위해 저장하고 제출할 수 있습니다.
      제출 또는 제출 및 교육 솔루션 정의 기록을 만들고 제출하거나 제출하고 교육합니다.
    5. 교육용 솔루션을 제출한 경우에는 교육 활성화 창에서 확인을 클릭하여 확인합니다.
      • 가장 가까운 교육 서비스를 사용하여 솔루션 교육이 예약됩니다. 교육이 완료되면 시스템에서 알림을 전송하며, 이 알림에는 교육에서 발생했을 수 있는 모든 오류가 포함됩니다. 다른 사용자가 예측 인텔리전스 알림 범주를 구독할 수 있습니다. 교육이 완료되면 시스템에서 솔루션을 첨부 레코드로 업로드합니다.
      • 거품형 차트는 솔루션 양식의 솔루션 시각화 탭을 채워 솔루션에서 다루는 각 클래스의 예상 정밀도와 범위를 보여줍니다. 거품의 크기는 클래스에 속한 기록의 %(분포)를 나타냅니다. 거품을 가리키면 예상 범위, 예상 정확도 및 분포를 볼 수 있습니다.
      솔루션에서 다루는 각 클래스의 예상 정밀도 및 범위입니다.

    다음에 수행할 작업

    솔루션의 솔루션 통계 탭의 클래스 신뢰도 섹션에서 학습된 솔루션 정밀도 및 범위 통계를 검토합니다.

    솔루션의 테스트 솔루션 탭에서 간단한 설명과 같은 입력 필드의 값을 입력하여 예측 출력을 테스트할 수 있습니다.

    간단한 설명과 같이 입력 필드의 값을 입력하여 예측에 대한 입력으로 사용한 기록의 예측 출력을 테스트하는 방법