목차

Search

  1. 데이터 검색 소개
  2. Informatica Analyst를 사용한 데이터 검색
  3. Informatica Developer를 사용한 데이터 검색

Data Discovery 가이드

Data Discovery 가이드

분석가 및 개발자를 위한 큐레이션

분석가 및 개발자를 위한 큐레이션

데이터 분석가 또는 데이터 스튜어드는 Analyst 도구에서 열 프로필 결과 및 데이터 도메인 검색 결과를 큐레이트할 수 있습니다. 프로필 결과를 큐레이트하여 데이터 자산의 검색 및 추가 유효성 검사를 위한 정확한 프로필 정보를 준비할 수 있습니다.
개발자 또는 데이터 설계자는 Developer 도구에서 열 프로필 결과, 데이터 도메인 검색 결과, 기본 키 검색 결과 및 외래 키 검색 결과를 큐레이트할 수 있습니다.
큐레이션 예제
개발자가 엔터프라이즈 검색을 수행하면 Developer 도구가 전체 데이터 집합에서 선택된 데이터 도메인을 처리합니다. 이 작업은 전화 번호 데이터를 주민등록번호 데이터 도메인으로 유추하는 것과 같은 다중 데이터 도메인 유추로 이어질 수 있습니다. 다중 데이터 도메인 유추는 열에 있는 데이터의 일부가 다른 데이터 도메인과 일치하는 경우 발생합니다. 예를 들어 실수로 1자리가 누락된 10자리 전화 번호의 경우 주민등록번호(미국)와 같은 패턴을 가질 수 있습니다. 이는 여러 데이터 도메인의 열 또는 일치하는 패턴 내에 잠재적인 데이터 품질 문제가 있음을 나타냅니다. 이러한 경우에는 Developer 도구가 전화 번호 데이터 도메인과 주민등록번호 데이터 도메인을 모두 유추할 수 있습니다. 이때 프로필 결과를 큐레이트하면 가장 적합한 데이터 도메인을 선택하고 승인할 수 있습니다. 이 예에서는 데이터 품질 문제로 인해 주민등록번호 데이터 도메인이 유추되었으므로 전화 번호 데이터 도메인을 선택하는 것이 적절합니다.
Developer tool에서 엔터프라이즈 검색을 실행하면 날짜 열에 날짜, 문자열 및 Varchar 등 여러 개의 데이터 유형이 유추될 수 있습니다. 데이터 설계자는 날짜 열에 가장 적절한 데이터 유형인 날짜 데이터 유형을 선택하고 승인할 수 있습니다.
Developer 도구에서 엔터프라이즈 검색을 수행하면 열 데이터를 바탕으로 하는 모든 데이터 개체 관계가 유추될 수 있습니다. 이 중에는 검색된 후보 키에서 불필요한 데이터 개체 관계를 포함하는 데이터 개체 관계가 있을 수 있습니다. 예를 들어 Developer 도구가 시퀀스를 나타내는 열을 가능한 키로 유추하고 유사한 열을 포함하는 다른 테이블과의 관계를 검색했을 수 있습니다. 이러한 데이터 개체 관계는 데이터베이스에서 유효한 관계를 형성하지 못할 수 있습니다. 이러한 경우 큐레이션을 사용하면 유추된 프로필 결과를 평가하고 확인한 다음 가장 적합한 프로필 결과를 승인할 수 있습니다.