Developer tool에서 데이터 품질 기능을 사용하여 데이터의 콘텐츠와 구조를 분석하고 비즈니스 요구에 맞춰 데이터를 개선할 수 있습니다.
Developer tool을 통해 프로세스를 디자인하고 실행하여 다음과 같은 태스크를 수행할 수 있습니다.
프로필 데이터. 프로파일링으로 데이터의 콘텐츠와 구조를 표시합니다. 프로파일링은 데이터의 강점과 단점을 파악하여 프로젝트 계획을 정립하는 데 도움이 될 수 있으므로 어떤 데이터 프로젝트에서도 핵심 단계로 꼽힙니다.
데이터 품질 검토를 위해 성과 기록표를 작성하십시오. 성과 기록표는 프로필의 품질 측정을 그래픽으로 표현합니다.
데이터 값 표준화. 프로필을 실행할 때 찾는 오류와 불일치를 제거하기 위해 데이터를 표준화하십시오. 구두점, 형식 및 맞춤법에서의 변형을 표준화할 수 있습니다. 예를 들어 도시, 도 및 우편 번호 값이 일관하도록 보장할 수 있습니다.
데이터 구문 분석. 구문 분석은 여러 값으로 구성된 필드를 읽고 포함된 정보의 유형에 따라 각 값에 대한 필드를 작성합니다. 또한 구문 분석은 정보를 레코드에 추가할 수 있습니다. 예를 들어 제품 데이터에 측정 단위를 추가하는 구문 분석 작업을 정의할 수 있습니다.
우편 주소 유효성 검사. 주소 유효성 검사는 우편 주소 데이터의 정확성 및 배달 가능성을 평가하고 향상시킵니다. 주소 유효성 검사는 주소 레코드를 전국 우편 회사의 주소 참조 데이터와 비교하여 주소의 오류를 수정하고 부분적 주소를 완성합니다. 주소 유효성 검사를 통해 메일 전송을 가속화하고 메일 비용을 감소시키는 우편 정보를 추가할 수도 있습니다.
중복 레코드 찾기. 중복 분석은 각 레코드에 있는 하나 이상의 필드에서 데이터를 비교하여 레코드 간의 유사점을 계산합니다. 분석할 필드를 선택하고 데이터에 적용할 비교 전략을 선택합니다. Developer tool에서는 두 가지 유형의 중복 분석을 사용할 수 있습니다. 하나는 유사 레코드 또는 중복 레코드를 식별하는 필드 일치이고 다른 하나는 레코드 데이터에서 유사하거나 중복된 ID를 식별하는 ID 일치입니다.
예외 관리. 예외란 수동으로 수정하는 데이터 품질 문제가 포함된 레코드를 말합니다. 다른 데이터 품질 프로세스를 실행한 후 데이터 집합에 남아 있는 예외 레코드를 캡처하는 매핑을 실행할 수 있습니다. Analyst 도구에서 예외 레코드를 검토하고 편집합니다.
참조 데이터 테이블 작성. Informatica는 표준화 및 구문 분석 등 여러 가지 유형의 데이터 품질 프로세스를 향상시킬 수 있는 참조 데이터를 제공합니다. 프로필 결과의 데이터를 사용하여 참조 테이블을 작성할 수 있습니다.
데이터 품질 규칙 작성 및 실행. Informatica는 프로젝트 목표에 맞춰 실행하거나 편집할 수 있는 규칙을 제공합니다. Developer tool에서 맵렛을 작성하고 규칙으로 맵렛의 유효성을 검사할 수 있습니다.
Informatica 사용자와 공동 작업. 모델 리포지토리는 참조 데이터 및 규칙을 저장하며 Developer tool 및 Analyst 도구의 사용자가 이러한 리포지토리를 사용할 수 있습니다. 사용자는 프로젝트에 대한 공동 작업을 할 수 있고 다른 사용자는 다른 단계의 프로젝트에서 개체 소유권을 보유할 수 있습니다.
PowerCenter에 매핑 내보내기. PowerCenter에서 매핑을 내보내고 실행할 수 있습니다. 물리적 데이터 통합을 위해 메타데이터를 다시 사용하거나 웹 서비스를 작성하기 위해 PowerCenter에 매핑을 내보낼 수 있습니다.