데이터 검색 API

  • 릴리스 버전: Washingtondc
  • 업데이트 날짜 2024년 02월 21일
  • 읽기6분
  • 데이터 검색 API에 대한 참조

    DataPatternValidator - matches(문자열 패턴, 문자열 입력)

    입력이 regex(regular expression) 패턴과 일치하는지 확인합니다.
    표 1. 매개변수
    이름 유형 설명
    pattern 문자열 정규 표현식 패턴
    입력 문자열 일치시킬 입력 데이터
    표 2. 반환
    유형 설명
    부울 입력이 패턴과 일치하면 true를 반환하고, 그렇지 않으면 false를 반환합니다.

    코드 예제

    var datapatternValidatorApi = new sn_data_discovery_api.DataPatternValidator();
    var pattern = '\\b[0-3]?[0-9]/[0-3]?[0-9]/(?:[0-9]{2})?[0-9]{2}\\b';
    var input = '09/09/2023';
    var output = datapatternValidatorApi.matches(pattern, input);
    if (output) {
      gs.info('pattern found!');
    } else {
      gs.info('pattern not found');
    }
    

    DataPatternValidator - isValid(문자열 패턴)

    지정된 패턴이 올바른 정규 표현식인지 확인합니다.
    표 3. 매개변수
    이름 유형 설명
    pattern 문자열 정규 표현식 패턴
    표 4. 반환
    유형 설명
    부울 표현식이 유효한 정규 표현식이면 true를 반환하고, 그렇지 않으면 false를 반환합니다.

    코드 예제

    var datapatternValidatorApi = new sn_data_discovery_api.DataPatternValidator();
    var pattern = '\\b[0-3]?[0-9]/[0-3]?[0-9]/(?:[0-9]{2})?[0-9]{2}\\b';
    var output = datapatternValidatorApi.isValid(pattern);
    if (output) {
     gs.info('pattern is valid!');
    } else {
      gs.info('pattern is not valid');
    }

    DataPatternValidator - keywordMatches(문자열 패턴, 문자열 입력, 문자열 키워드, int 키워드근접성)

    지정된 입력 데이터가 키워드와 함께 정규 표현식(regex) 패턴과 일치하는지 확인합니다. 키워드 및 키워드 근접성에 대한 자세한 내용은 을 참조하십시오 패턴 구성 데이터 검색 .
    표 5. 매개변수
    이름 유형 설명
    pattern 문자열 정규 표현식 패턴
    입력 문자열 일치시킬 입력 데이터
    키워드 문자열 일치시킬 쉼표로 구분된 키워드 값
    키워드근접성 int 일치 패턴의 키워드 근접성
    표 6. 반환
    유형 설명
    부울 표현식이 유효한 정규 표현식이면 예를 반환하고, 그렇지 않으면 아니오를 반환합니다.

    코드 예제

    var datapatternValidatorApi = new sn_data_discovery_api.DataPatternValidator();
    var pattern = '\\b[0-3]?[0-9]/[0-3]?[0-9]/(?:[0-9]{2})?[0-9]{2}\\b';
    var keywords = 'dob,date of birth';
    var keywordProximity = 20;
    var matchInput = 'dob: 09/09/2023';
    var noMatchInput = '09/09/2023';
    var output = datapatternValidatorApi.keywordMatches(pattern, matchInput, keywords, keywordProximity);
    gs.info('match found for input: ' + matchInput + ' = ' + output);
    output = datapatternValidatorApi.keywordMatches(pattern, noMatchInput, keywords, keywordProximity);
    gs.info('match found for noMatchInput: ' + noMatchInput + ' = ' + output);

    DataPatternScanner - scan(문자열 입력)

    주:
    DataPatternScanner 생성자에 데이터 패턴 시스템 ID 배열이 전달되어야 합니다.
    표 7. 매개변수
    이름 유형 설명
    입력 문자열 스캔할 입력 데이터
    표 8. 반환
    유형 설명
    문자열 직렬화된 JSON 문자열
    hasMatches (일치 있음)

    패턴 일치가 1개 이상 있으면 예를 반환합니다.

    "finding" : [ { # 일치하는 각 패턴에 대해 일치 항목의 시작 및 끝 위치 목록을 포함합니다.

    오류
    API가 실패한 경우 오류 코드와 메시지를 포함하고, 그렇지 않으면 비어 있습니다.
    unprocessedPatterns (영문)
    처리되지 않은 데이터 패턴 시스템 ID의 배열을 반환합니다.
    찾는
    각 패턴의 ID와 일치 항목의 시작 및 끝 위치 목록을 반환합니다.

    코드 예제

    var emailSysId = '8e5605bceb0561107977d256385228e6';
    var ssnSysId = '4964417ceb0561107977d256385228b8';
    var dataPatternSysIds = [emailSysId, ssnSysId] // Email and SSN
    var dataDiscoveryApi = new sn_data_discovery_api.DataDiscoveryScanner(dataPatternSysIds);
    
    var input = 'my ssn is 123-45-6789 and email is abcd@company.com'
    var jsonString = dataDiscoveryApi.scan(input);
    var output = JSON.parse(jsonString);
    
    if (output.hasMatches) {
       gs.info('found matches for patterns in input');
       for (var i=0; i<output.finding.length; i++) {
            curFinding = output.finding[i];
            gs.info('first match for ' + curFinding.pattern + ' is (' + curFinding.matches[0]['start'] + ',' + + curFinding.matches[0]['end'] + ')');
       }
    }
    표 9. 구성
    이름 구성 모드 설명
    키워드(csv) 문자열의 최대 길이입니다. 구성할 수 없음 DataPattern.keyword 필드에서 구성할 수 있는 문자열의 최대 길이를 정의합니다.
    • 기본값은 128입니다.
    • 최대값은 128입니다.
    키워드 근접성의 최소값과 최대값 구성할 수 없음 필드에 입력할 수 있는 최소값과 최대값을 정의합니다DataPattern.keyword_proximity.
    • 최소값 0
    • 최대 64
    일치 및 keywordMatches API의 최대 입력 크기 구성할 수 없음 DataPatternValidator.matches 및 DataPatternValidator.keywordMatches API에서 지원하는 최대 입력 크기를 정의합니다.
    • 기본값은 2048입니다.
    • 최댓값은 2048입니다.
    스캔 API에 대한 시간 제한 DataDiscoveryScanner.setScanTimeout(long timeoutMillis) DataDiscoveryScanner.scan 호출을 완료하는 데 걸리는 최대 시간(밀리초)을 정의하는 API 호출입니다.
    • 기본값은 20000(ms)입니다.
    • 범위는 0-50000(ms) 사이의 정수 값입니다.