데이터 검색 API에 대한 참조
DataPatternValidator - matches(문자열 패턴, 문자열 입력)
입력이 regex(regular expression) 패턴과 일치하는지 확인합니다.
표 1. 매개변수
| 이름 |
유형 |
설명 |
| pattern |
문자열 |
정규 표현식 패턴 |
| 입력 |
문자열 |
일치시킬 입력 데이터 |
표 2. 반환
| 유형 |
설명 |
| 부울 |
입력이 패턴과 일치하면 true를 반환하고, 그렇지 않으면 false를 반환합니다. |
코드 예제
var datapatternValidatorApi = new sn_data_discovery_api.DataPatternValidator();
var pattern = '\\b[0-3]?[0-9]/[0-3]?[0-9]/(?:[0-9]{2})?[0-9]{2}\\b';
var input = '09/09/2023';
var output = datapatternValidatorApi.matches(pattern, input);
if (output) {
gs.info('pattern found!');
} else {
gs.info('pattern not found');
}
DataPatternValidator - isValid(문자열 패턴)
지정된 패턴이 올바른 정규 표현식인지 확인합니다.
표 3. 매개변수
| 이름 |
유형 |
설명 |
| pattern |
문자열 |
정규 표현식 패턴 |
표 4. 반환
| 유형 |
설명 |
| 부울 |
표현식이 유효한 정규 표현식이면 true를 반환하고, 그렇지 않으면 false를 반환합니다. |
코드 예제
var datapatternValidatorApi = new sn_data_discovery_api.DataPatternValidator();
var pattern = '\\b[0-3]?[0-9]/[0-3]?[0-9]/(?:[0-9]{2})?[0-9]{2}\\b';
var output = datapatternValidatorApi.isValid(pattern);
if (output) {
gs.info('pattern is valid!');
} else {
gs.info('pattern is not valid');
}
DataPatternValidator - keywordMatches(문자열 패턴, 문자열 입력, 문자열 키워드, int 키워드근접성)
지정된 입력 데이터가 키워드와 함께 정규 표현식(regex) 패턴과 일치하는지 확인합니다. 키워드 및 키워드 근접성에 대한 자세한 내용은 을 참조하십시오
패턴 구성 데이터 검색 .
표 5. 매개변수
| 이름 |
유형 |
설명 |
| pattern |
문자열 |
정규 표현식 패턴 |
| 입력 |
문자열 |
일치시킬 입력 데이터 |
| 키워드 |
문자열 |
일치시킬 쉼표로 구분된 키워드 값 |
| 키워드근접성 |
int |
일치 패턴의 키워드 근접성 |
표 6. 반환
| 유형 |
설명 |
| 부울 |
표현식이 유효한 정규 표현식이면 예를 반환하고, 그렇지 않으면 아니오를 반환합니다. |
코드 예제
var datapatternValidatorApi = new sn_data_discovery_api.DataPatternValidator();
var pattern = '\\b[0-3]?[0-9]/[0-3]?[0-9]/(?:[0-9]{2})?[0-9]{2}\\b';
var keywords = 'dob,date of birth';
var keywordProximity = 20;
var matchInput = 'dob: 09/09/2023';
var noMatchInput = '09/09/2023';
var output = datapatternValidatorApi.keywordMatches(pattern, matchInput, keywords, keywordProximity);
gs.info('match found for input: ' + matchInput + ' = ' + output);
output = datapatternValidatorApi.keywordMatches(pattern, noMatchInput, keywords, keywordProximity);
gs.info('match found for noMatchInput: ' + noMatchInput + ' = ' + output);
DataPatternScanner - scan(문자열 입력)
주: DataPatternScanner 생성자에 데이터 패턴 시스템 ID 배열이 전달되어야 합니다.
표 7. 매개변수
| 이름 |
유형 |
설명 |
| 입력 |
문자열 |
스캔할 입력 데이터 |
표 8. 반환
| 유형 |
설명 |
| 문자열 |
직렬화된 JSON 문자열
- hasMatches (일치 있음)
패턴 일치가 1개 이상 있으면 예를 반환합니다.
"finding" : [ { # 일치하는 각 패턴에 대해 일치 항목의 시작 및 끝 위치 목록을 포함합니다.
- 오류
- API가 실패한 경우 오류 코드와 메시지를 포함하고, 그렇지 않으면 비어 있습니다.
- unprocessedPatterns (영문)
- 처리되지 않은 데이터 패턴 시스템 ID의 배열을 반환합니다.
- 찾는
- 각 패턴의 ID와 일치 항목의 시작 및 끝 위치 목록을 반환합니다.
|
코드 예제
var emailSysId = '8e5605bceb0561107977d256385228e6';
var ssnSysId = '4964417ceb0561107977d256385228b8';
var dataPatternSysIds = [emailSysId, ssnSysId] // Email and SSN
var dataDiscoveryApi = new sn_data_discovery_api.DataDiscoveryScanner(dataPatternSysIds);
var input = 'my ssn is 123-45-6789 and email is abcd@company.com'
var jsonString = dataDiscoveryApi.scan(input);
var output = JSON.parse(jsonString);
if (output.hasMatches) {
gs.info('found matches for patterns in input');
for (var i=0; i<output.finding.length; i++) {
curFinding = output.finding[i];
gs.info('first match for ' + curFinding.pattern + ' is (' + curFinding.matches[0]['start'] + ',' + + curFinding.matches[0]['end'] + ')');
}
}
표 9. 구성
| 이름 |
구성 모드 |
설명 |
| 키워드(csv) 문자열의 최대 길이입니다. |
구성할 수 없음 |
DataPattern.keyword 필드에서 구성할 수 있는 문자열의 최대 길이를 정의합니다.
- 기본값은 128입니다.
- 최대값은 128입니다.
|
| 키워드 근접성의 최소값과 최대값 |
구성할 수 없음 |
필드에 입력할 수 있는 최소값과 최대값을 정의합니다DataPattern.keyword_proximity. |
| 일치 및 keywordMatches API의 최대 입력 크기 |
구성할 수 없음 |
DataPatternValidator.matches 및 DataPatternValidator.keywordMatches API에서 지원하는 최대 입력 크기를 정의합니다.
- 기본값은 2048입니다.
- 최댓값은 2048입니다.
|
| 스캔 API에 대한 시간 제한 |
DataDiscoveryScanner.setScanTimeout(long timeoutMillis) |
DataDiscoveryScanner.scan 호출을 완료하는 데 걸리는 최대 시간(밀리초)을 정의하는 API 호출입니다.
- 기본값은 20000(ms)입니다.
- 범위는 0-50000(ms) 사이의 정수 값입니다.
|