회귀 솔루션 생성 및 교육
온도 또는 주가와 같은 숫자 출력을 예측하기 위해 기록 데이터를 사용하여 솔루션을 교육합니다. 예를 들어 회귀를 사용하여 인시던트 또는 케이스를 해결하는 데 걸리는 시간을 예측할 수 있습니다.
시작하기 전에
필요한 역할: ml_admin 또는 admin
이 태스크 정보
- MAE(평균 절대 오차 )는 실제 값에서 예측된 값의 평균 편차를 측정합니다. 이 메트릭은 규모가 대상의 규모와 동일하기 때문에 이해하기 쉽기 때문에 유용합니다. 그러나 MAE는 무제한이므로 모델 간에 비교하기가 어렵습니다.
- 대칭평균 절대백분율오차 (SMAPE)는 예측된 편차에서 실제까지의 편차에 대한 백분율 값입니다. SMAPE는 0에서 100 사이의 값 범위를 갖는 것을 제외하고는 MAE의 경계 버전입니다. SMAPE 값이 낮을수록 모델 정확도가 좋습니다.
- 범위 정확도 는 예측된 범위 간 실제 값의 백분율입니다. 즉, 예측의 상한과 하한 사이의 범위입니다. 예를 들어 실제 값 5개 중 4개가 예측 범위 내에 있는 경우 범위 정확도는 80%입니다.
- 평균 간격 너비 는 예측의 상한과 하한 간의 차이입니다. 이 메트릭은 간격이 얼마나 유익한지 설명합니다. 평균 너비가 작을수록 모델이 더 좋습니다
예측을 할 때 회귀를 사용하면 예측 간격(범위)에 대한 신뢰도 수준을 지정할 수도 있습니다.
이 예시 절차에서는 클라우드 데이터베이스를 재개하는 데 걸리는 시간을 예측하는 회귀 솔루션 정의를 만들고 학습시킵니다.
프로시저
다음에 수행할 작업
이 예시 시나리오에서는 솔루션 정의에서 ML 솔루션을 생성했습니다. 솔루션 통계, 테스트 솔루션 및 솔루션 정의 탭은 ML 솔루션의 관련 링크 섹션에 나타납니다.
솔루션 통계 탭에서 솔루션에서 생성된 포인트 추정치 및 범위(예측 구간) 통계를 검토합니다.
솔루션의 테스트 솔루션 탭에서 소스 데이터센터, 대상 데이터센터 및 데이터베이스 크기와 같은 입력 필드 값을 입력하여 예측에 대한 입력으로 사용한 기록에 대한 예측 출력을 테스트할 수 있습니다. 기본 예측 신뢰도 수준인 95를 사용하거나 0과 100 사이의 다른 수준을 입력할 수 있습니다. 95를 값으로 사용하는 것은 시스템에서 실제 예측이 예측 간격 내에 있으리라고 95% 신뢰한다는 뜻입니다. 예측 출력을 찾으려면 테스트 실행 버튼을 클릭합니다.
테스트를 실행하면 예측 출력 통계가 나타납니다. 화면의 포인트 추정치는 한 시점의 단일 값입니다. 예를 들어 데이터베이스 복원을 완료하는 데 134.47초가 걸립니다. 화면의 하한 및 상한은 범위 정확도 값을 나타냅니다. 예를 들어 데이터베이스 복원을 완료하는 데 84.53초에서 185.41초가 걸립니다.