회귀 솔루션 생성 및 교육
온도 또는 주가와 같은 숫자 출력을 예측하기 위해 기록 데이터를 사용하여 솔루션을 교육합니다. 예를 들어 회귀를 사용하여 인시던트 또는 케이스를 해결하는 데 걸리는 시간을 예측할 수 있습니다.
시작하기 전에
필요한 역할: ml_admin 또는 admin
이 태스크 정보
- 평균 절대 오차 (MAE) - 실제 값에서 예측된 값의 평균 편차를 측정합니다. 이 지표는 규모가 대상과 동일하기 때문에 이해하기 쉽기 때문에 유용합니다. 그러나 MAE는 무제한이므로 모델 간에 비교하기가 어렵습니다.
- 대칭평균 절대백분율 오차 (SMAPE)는 예측값과 실제값의 편차를 백분율로 나타낸 값입니다. SMAPE는 값 범위가 0에서 100 사이라는 점을 제외하고는 MAE의 제한된 버전입니다. SMAPE 값이 낮을수록 모델 정확도가 좋습니다.
- 범위 정확도 는 예측 범위 사이의 실제 값의 백분율입니다. 즉, 예측의 상한과 하한 사이의 범위입니다. 예를 들어, 5개의 실제 값 중 4개가 예측 범위 내에 있는 경우 범위 정확도는 80%입니다.
- 평균 간격 너비 는 예측의 상한과 하한 간의 차이입니다. 이 메트릭은 간격이 얼마나 유익한지 설명합니다. 평균 너비가 작을수록 모델이 더 좋습니다.
예측을 할 때 회귀를 사용하면 예측 간격(범위)에 대한 신뢰도 수준을 지정할 수도 있습니다.
이 예제 절차에서는 회귀 솔루션 정의를 만들고 학습시켜 클라우드 데이터베이스를 복원하는 데 걸리는 시간을 예측합니다.
프로시저
다음에 수행할 작업
이 예제 시나리오에서는 솔루션 정의에서 ML 솔루션을 생성했습니다. 솔루션 통계, 테스트 솔루션 및 솔루션 정의 탭은 ML 솔루션의 관련 링크 섹션에 나타납니다.
솔루션 통계 탭에서 솔루션에서 생성된 포인트 추정치 및 범위(예측 간격) 통계를 검토합니다.
솔루션의 테스트 솔루션 탭에서 원본 데이터센터, 대상 데이터센터 및 데이터베이스 크기와 같은 입력 필드에 값을 입력하여 예측에 대한 입력으로 사용한 레코드에 대한 예측 출력을 테스트할 수 있습니다. 기본 예측 신뢰도 수준인 95를 사용하거나 0과 100 사이의 다른 수준을 입력할 수 있습니다. 95를 값으로 사용하는 것은 시스템에서 실제 예측이 예측 간격 내에 있으리라고 95% 신뢰한다는 뜻입니다. 예측 출력을 찾으려면 테스트 실행 버튼을 클릭합니다.
테스트를 실행하면 예측 출력 통계가 나타납니다. 화면의 포인트 추정치는 한 시점의 단일 값입니다. 예를 들어 데이터베이스 복원을 완료하는 데 134.47초가 걸립니다. 화면의 하한과 상한은 범위 정확도 값을 나타냅니다. 예를 들어 데이터베이스 복원을 완료하는 데 84.53초에서 185.41초가 걸립니다.