Snowflake 메타데이터 수집기 생성
Snowflake에서 메타데이터를 임포트하는 수집기를 생성합니다.
시작하기 전에
시작하기 전에 다음을 확인하십시오.
- 수집기용 MID 서버가 설정됩니다. 자세한 내용은 메타데이터 수집기용 MID 서버 문서를 참조하십시오.
- 모든 필수 작업이 완료되었습니다. 자세한 내용은 Snowflake 수집기 실행 준비 문서를 참조하십시오.
- 필요한 역할: connection-admin
프로시저
- 다음으로 이동 모두 > 워크플로우 데이터 패브릭 > 워크플로우 데이터 패브릭 홈.
-
왼쪽 사이드바에서 허브
아이콘을 선택합니다.
- 선택 작성 > 메타데이터 수집기.
- 시스템 목록에서 Snowflake 를 선택합니다.
-
양식을 작성합니다.
표 1. 새 Snowflake 메타데이터 수집기 양식 필드 설명 연결 이름 연결에 대한 고유 식별자입니다. 연결이 설정되면 이 필드를 수정할 수 없습니다. 간단한 설명 연결의 목적 및 상세 정보입니다. -
인증 옵션을 구성합니다.
표 2. 인증 옵션 필드 설명 사용자 이름 및 암호를 사용하여 인증 사용자 이름 JDBC를 연결하는 데 사용할 사용자 이름입니다. 암호 사용자의 암호입니다. 개인 키를 사용하여 인증 사용자 이름 JDBC를 연결하는 데 사용할 사용자 이름입니다. Snowflake 개인 키 파일 인증에 사용할 개인 키 파일을 업로드합니다. 개인 키 파일 암호 키가 암호화되고 암호가 설정된 경우 개인 키 파일의 암호입니다. -
모든 스키마 수집 및 수집할 스키마 지정 중에서 선택합니다.
표 3. 스키마 컬렉션 옵션 필드 설명 모든 스키마 수집 모든 스키마 수집 사용자가 액세스할 수 있는 모든 스키마를 카탈로그화합니다. 스키마 제외 제외할 데이터베이스 스키마의 이름 또는 정규 표현식입니다. 정보 스키마 포함 카탈로그 컬렉션에 데이터베이스의 정보 스키마를 포함합니다. 수집할 스키마 지정 수집할 스키마 지정 지정된 스키마만 카탈로그화합니다. 스키마 카탈로그할 데이터베이스 스키마의 이름입니다. -
Snowflake 연결 세부 정보를 입력합니다.
표 4. 연결 상세 정보 필드 설명 서버 연결할 데이터베이스 서버의 호스트 이름입니다. 서버 포트 데이터베이스 서버의 포트입니다(기본값이 아닌 경우). 데이터베이스 연결할 데이터베이스의 이름입니다. 한 줄에 하나의 값을 추가하여 여러 데이터베이스를 지정합니다. Snowflake 역할 쿼리를 실행하는 데 사용되는 역할입니다. 제외된 데이터베이스 데이터베이스 필드가 비어 있을 때 카탈로그하지 않을 데이터베이스를 나타내는 이름 또는 정규식입니다. 주:데이터베이스 필드가 지정된 경우 이 매개변수는 무시됩니다. -
통계 및 샘플링 옵션을 구성합니다.
표 5. 수집 범위 및 계보 옵션 필드 설명 데이터 메트릭 기능 정보 수집 데이터 메트릭 기능 및 테이블과의 연결에 대한 메타데이터를 수집하는 옵션입니다. 데이터 메트릭 관찰 횟수 수집할 가장 최근의 데이터 메트릭 관찰 수입니다. 데이터 메트릭 기능 정보 수집을 사용하도록 설정하지 않으면 무시됩니다. 기본값: 1
열 통계 컬렉션 사용 열 통계를 수집하는 옵션, 즉 데이터 프로파일링입니다. 주:이 옵션을 활성화하면 수집기가 테이블 데이터를 읽어 프로파일링 메타데이터를 수집하기 때문에 수집기 실행 시간이 연장될 수 있습니다.열 통계에 대한 대상 샘플 크기 열 통계 및 문자열-값 히스토그램을 계산하기 위해 샘플링된 행 수입니다. 예를 들어 1,000개의 행을 샘플링하려면 값을 1,000으로 설정합니다. 기본값: 100000
주:열 통계 수집 사용이 활성화된 경우에만 적용됩니다.Snowflake 테이블 사용 정보 수집 인기도를 포함하여 쿼리에서 Snowflake 테이블 사용량에 대한 메타데이터를 수집하는 옵션입니다. 데이터베이스의 각 테이블에 대해 대상 테이블보다 적은 횟수 쿼리된 테이블의 백분율을 계산합니다. 테이블 사용량 조사 기간 일 수 테이블 사용량 수집을 시작한 과거 일 수입니다. 기본값: 7일
계보 수집 사용 안 함 데이터베이스 내 계보 메타데이터 수집을 건너뛰는 옵션입니다. 확장된 메타데이터 수집 사용 안 함 데이터베이스, 스키마, 테이블, 열, 함수, 저장 프로시저, 사용자 정의 유형 및 동의어와 같은 데이터 자산 유형에 대한 확장된 메타데이터 수집을 건너뛰는 옵션입니다. 이러한 데이터 자산 유형에 대한 기본 메타데이터는 여전히 수집됩니다. -
수집 범위 및 제한 옵션을 구성합니다.
표 6. 수집 범위 및 제한 옵션 필드 설명 Snowflake 태그 정보 수집 데이터베이스 설정에 지정된 데이터베이스에 있거나 연결된 데이터베이스에 있는 Snowflake 태그에 대한 메타데이터를 수집하는 옵션입니다. 모든 Snowflake 태그 정보 수집 Snowflake 태그가 상주하는 데이터베이스에 관계없이 태그에 대한 메타데이터를 수집하는 옵션입니다. Snowflake 정책 정보 수집 데이터베이스 설정에 지정된 데이터베이스에 있거나 연결된 데이터베이스에 있는 Snowflake 마스킹 및 행 액세스 정책에 대한 메타데이터를 수집하는 옵션입니다. 모든 Snowflake 정책 정보 수집 Snowflake 마스킹 및 행 액세스 정책에 대한 메타데이터가 상주하는 데이터베이스에 관계없이 수집하는 옵션입니다. Streamlit 앱 정보 수집 Snowflake Streamlit 애플리케이션에 대한 메타데이터를 수집하는 옵션입니다. 샘플 문자열 값 컬렉션 사용 문자열 데이터를 포함하는 열의 샘플 값과 히스토그램을 수집하는 옵션입니다. 주:열 통계 수집 사용이 활성화된 경우에만 적용됩니다.시스템 기능 제외 수집에서 내장 시스템 기능을 제외하는 옵션입니다. -
연결 및 안정성 옵션을 구성합니다.
표 7. 연결 및 안정성 옵션 필드 설명 Snowflake 창고 연결할 때 사용할 Snowflake 창고입니다. 기본값: 사용자의 할당된 기본 창고
서버 환경 데이터베이스 서버가 실행되는 환경의 식별 이름입니다. 서버 이름이 localhost이고 다른 환경과 구별해야 하는 경우에 유용합니다. 데이터베이스 ID 이 데이터베이스의 고유 식별자로, 데이터베이스 이름이 충분히 고유하지 않을 때 데이터베이스 ID를 생성하는 데 사용됩니다. JDBC 속성 드라이버 연결에 전달된 JDBC 드라이버 속성입니다. SQL 구문 분석 시간 제한 계보 수집 중 SQL 구문 분석 시간 제한(초)입니다. 기본값: 60
- 저장을 선택합니다.
결과
메타데이터 수집기가 생성되고 커넥터 페이지에 구성됨 상태로 나타납니다. 이제 소스 시스템에 연결하고 메타데이터를 수집할 준비가 되었습니다.
다음에 수행할 작업
수집기를 생성한 후에는 다음 작업을 수행할 수 있습니다.
- 수집기를 수동으로 실행하여 메타데이터를 즉시 수집합니다. 메타데이터 수집기 수동 실행 문서를 참조하십시오.
- 정기적인 수집기 실행 일정을 예약하여 메타데이터 수집을 자동화합니다. 메타데이터 수집기 실행 예약 문서를 참조하십시오.
- 런타임 로그를 확인하여 실행 상태를 모니터링하고 문제를 해결합니다. 수집기 실행에 대한 런타임 로그 보기 문서를 참조하십시오.
- 데이터 카탈로그에서 수집된 데이터 자산을 검색하고 평가합니다. 관리 데이터 카탈로그 문서를 참조하십시오.