목차

Search

  1. 데이터 검색 소개
  2. Informatica Analyst를 사용한 데이터 검색
  3. Informatica Developer를 사용한 데이터 검색

Data Discovery 가이드

Data Discovery 가이드

프로파일링 개요

프로파일링 개요

프로파일링을 사용하면 응용 프로그램, 스키마 또는 엔터프라이즈 데이터 소스의 콘텐츠, 품질 및 구조를 확인할 수 있습니다. 데이터 소스 콘텐츠에는 값 빈도 및 데이터 유형이 포함됩니다. 데이터 소스 구조에는 키 및 함수 종속성이 포함됩니다.
검색 프로세스를 수행할 때 프로필을 작성하고 실행할 수 있습니다. 프로필은 엔터프라이즈 데이터 소스 전체의 모든 데이터 불규칙 및 데이터 프로젝트에 위험을 야기하는 숨겨진 데이터 문제를 찾고 분석하는 리포지토리 개체입니다. 엔터프라이즈의 모든 데이터 소스에 프로필을 실행하여 데이터 및 메타데이터의 강점과 약점을 제대로 파악할 수 있습니다.
Informatica Analyst 및 Informatica Developer를 사용하여 소스 데이터와 메타데이터를 분석할 수 있습니다. 분석가 및 개발자는 이러한 도구를 사용하여 공동 작업을 수행하고 데이터 품질 문제를 식별하고 데이터 관계를 분석할 수 있습니다. 사용자의 작업 역할에 따라 Analyst 도구 또는 Developer tool의 기능을 사용할 수 있습니다. 수행할 수 있는 프로파일링의 수준은 사용하는 도구에 따라 다릅니다.
Developer tool과 Analyst 도구에서 수행할 수 있는 태스크는 다음과 같습니다.
  • 열 프로파일링을 수행합니다. 이 프로세스에는 열의 고유한 값 수, null 값 수 및 데이터 패턴 수에 대한 검색이 포함됩니다.
  • 데이터 도메인 검색을 수행합니다. 엔터프라이즈 내의 중요 데이터 특성을 검색할 수 있습니다.
  • 데이터 유형, 데이터 도메인, 기본 키 및 외래 키를 포함하는 프로필 결과를 큐레이트합니다.
  • 데이터 품질을 모니터링할 성과 기록표를 생성합니다.
  • 운영 체제 프로필에 정의한 운영 체제 사용자의 사용 권한을 기반으로 열 프로필, 엔터프라이즈 검색 프로필 및 성과 기록표를 작성하고 실행할 운영 체제 프로필을 선택합니다.
  • 리포지토리 자산 잠금을 사용하여 다른 사용자가 작업을 덮어쓰는 것을 방지합니다.
  • 버전 제어 시스템을 사용하여 여러 프로필 버전을 저장합니다.
  • 데이터 개체에 대한 태그를 작성하고 할당합니다.
  • 개체 이름의 의미를 Business Glossary Desktop의 비즈니스 용어로 조회합니다. 예를 들어 열 이름 또는 프로필 이름의 의미를 조회하여 해당 열 이름 또는 프로필 이름의 비즈니스 요구 사항 및 현재 구현을 확인할 수 있습니다.
Developer tool에서 수행할 수 있는 태스크는 다음과 같습니다.
  • 데이터 소스에 있는 두 개의 데이터 열 간의 잠재적 조인 수준을 검색합니다.
  • 단일 데이터 소스 또는 여러 데이터 소스 내에 열 쌍으로 겹치는 데이터의 백분율을 확인합니다.
  • 열 프로파일링의 결과를 비교합니다.
  • 프로필에서 매핑 개체를 생성합니다.
  • 데이터 소스에서 기본 키를 검색합니다.
  • 하나 이상의 데이터 소스 집합에서 외래 키를 검색합니다.
  • 데이터 소스에 있는 열 간의 함수 종속성을 검색합니다.
  • 여러 연결에 걸쳐 있는 많은 수의 데이터 소스에 대해 데이터 검색 태스크를 실행합니다. 데이터 검색 태스크에는 열 프로필, 기본 키 및 외래 키 관계 유추, 데이터 도메인 검색 및 데이터 관계에 대한 통합 그래픽 요약 생성이 포함됩니다.
Analyst 도구에서 수행할 수 있는 태스크는 다음과 같습니다.
  • 여러 연결에 걸쳐 있는 많은 수의 데이터 소스에 대해 엔터프라이즈 검색을 수행합니다. 열 메타데이터 및 데이터 도메인의 통합된 검색 결과 요약을 볼 수 있습니다.
  • 검색을 수행하여 엔터프라이즈의 데이터 및 메타데이터 위치를 찾습니다. 데이터 개체, 규칙 및 프로필과 같은 특정 자산을 검색할 수 있습니다. 검색은 엔터프라이즈의 데이터베이스 및 스키마에 있는 자산을 찾고 다른 자산과의 관계를 식별합니다.
  • 기록 프로필 실행에 대한 프로필 결과를 봅니다.
  • 열 프로필에서 프로필 실행 두 개의 프로필 결과를 비교합니다.
  • 각 성과 기록표 메트릭 및 메트릭 그룹에 대한 성과 기록표 연계를 봅니다.
  • 성과 기록표 대시보드를 봅니다.
  • 프로필 또는 프로필의 열에 설명을 추가합니다.
  • 프로필 또는 프로필의 열에 태그를 할당합니다.
  • 프로필의 열에 비즈니스 용어를 할당합니다.