목차

Search

  1. 데이터 검색 소개
  2. Informatica Analyst를 사용한 데이터 검색
  3. Informatica Developer를 사용한 데이터 검색
  4. 프로파일링 웨어하우스 연결에 기반한 기능 지원

Data Discovery 가이드

Data Discovery 가이드

분석가 및 개발자를 위한 큐레이션

분석가 및 개발자를 위한 큐레이션

데이터 분석가 또는 데이터 스튜어드는 Analyst 도구에서 열 프로필 결과 및 데이터 도메인 검색 결과를 큐레이트할 수 있습니다. 프로필 결과를 큐레이트하여 데이터 자산의 검색 및 추가 유효성 검사를 위한 정확한 프로필 정보를 준비할 수 있습니다.
개발자 또는 데이터 설계자는 Developer 도구에서 열 프로필 결과, 데이터 도메인 검색 결과, 기본 키 검색 결과 및 외래 키 검색 결과를 큐레이트할 수 있습니다.
큐레이션 예제
개발자가 엔터프라이즈 검색을 수행하면 Developer 도구가 전체 데이터 집합에서 선택된 데이터 도메인을 처리합니다. 이 작업은 전화 번호 데이터를 주민등록번호 데이터 도메인으로 유추하는 것과 같은 다중 데이터 도메인 유추로 이어질 수 있습니다. 다중 데이터 도메인 유추는 열에 있는 데이터의 일부가 다른 데이터 도메인과 일치하는 경우 발생합니다. 예를 들어 실수로 1자리가 누락된 10자리 전화 번호의 경우 주민등록번호(미국)와 같은 패턴을 가질 수 있습니다. 이는 여러 데이터 도메인의 열 또는 일치하는 패턴 내에 잠재적인 데이터 품질 문제가 있음을 나타냅니다. 이러한 경우에는 Developer 도구가 전화 번호 데이터 도메인과 주민등록번호 데이터 도메인을 모두 유추할 수 있습니다. 이때 프로필 결과를 큐레이트하면 가장 적합한 데이터 도메인을 선택하고 승인할 수 있습니다. 이 예에서는 데이터 품질 문제로 인해 주민등록번호 데이터 도메인이 유추되었으므로 전화 번호 데이터 도메인을 선택하는 것이 적절합니다.
Developer tool에서 엔터프라이즈 검색을 실행하면 날짜 열에 날짜, 문자열 및 Varchar 등 여러 개의 데이터 유형이 유추될 수 있습니다. 데이터 설계자는 날짜 열에 가장 적절한 데이터 유형인 날짜 데이터 유형을 선택하고 승인할 수 있습니다.
Developer 도구에서 엔터프라이즈 검색을 수행하면 열 데이터를 바탕으로 하는 모든 데이터 개체 관계가 유추될 수 있습니다. 이 중에는 검색된 후보 키에서 불필요한 데이터 개체 관계를 포함하는 데이터 개체 관계가 있을 수 있습니다. 예를 들어 Developer 도구가 시퀀스를 나타내는 열을 가능한 키로 유추하고 유사한 열을 포함하는 다른 테이블과의 관계를 검색했을 수 있습니다. 이러한 데이터 개체 관계는 데이터베이스에서 유효한 관계를 형성하지 못할 수 있습니다. 이러한 경우 큐레이션을 사용하면 유추된 프로필 결과를 평가하고 확인한 다음 가장 적합한 프로필 결과를 승인할 수 있습니다.