열 프로필에 따라 값 빈도, 백분율, 패턴 등 데이터 소스에 있는 열의 특성이 결정됩니다.
열 프로파일링 시에는 데이터에 대한 다음과 같은 정보가 검색됩니다.
각 열의 null 값, 고유한 값 및 고유하지 않은 값의 수가 숫자와 백분율로 표시됩니다.
각 열의 데이터 패턴 및 이러한 값이 표시되는 빈도
각 열에 있는 값의 최대 길이 및 최소 길이와 각 열의 첫 번째 값과 마지막 값 등 열 값에 대한 통계를 제공합니다.
문서화되고 유추된 데이터 유형과 데이터 충돌.
패턴 및 값 빈도 이상값.
열 프로필 옵션을 사용하여 프로필을 실행할 열을 선택하고, 데이터 샘플링 옵션을 설정하고, 프로필을 작성할 때 드릴다운 옵션을 설정합니다.
프로필 및 프로필의 열에 설명 및 태그를 추가할 수 있습니다. 열에 비즈니스 용어를 할당할 수 있습니다.
모델 리포지토리는 리포지토리 프로필 잠금을 사용하여 사용자가 작업을 덮어쓰지 못하도록 프로필을 잠급니다. 버전 제어 시스템은 여러 버전의 프로필을 저장하고 각 버전에 버전 번호를 할당합니다. 프로필을 체크 아웃한 다음 내용을 변경하고 다시 프로파일을 체크 인할 수 있습니다. 프로필을 다시 체크 인하기 전에 프로파일 체크 아웃 작업을 실행 취소할 수 있습니다.
규칙은 프로필을 실행할 때 소스 데이터에 적용되는 조건을 정의하는 비즈니스 논리입니다. 프로필에 규칙을 추가하여 데이터 유효성을 검사할 수 있습니다.
성과 기록표를 작성하여 데이터 품질을 정기적으로 검토합니다. 프로필에 규칙을 적용하기 전과 적용한 후에 성과 기록표를 작성하여 열에 대해 유효한 값의 그래픽 표현을 확인할 수 있습니다.