목차

Search

  1. 서문
  2. 매핑
  3. 맵렛
  4. 매핑 매개 변수
  5. 매개 변수를 할당할 위치
  6. 매핑 출력
  7. SQL 쿼리에서 매핑 생성
  8. 동적 매핑
  9. 동적 매핑을 개발 및 실행하는 방법
  10. 동적 매핑 사용 사례
  11. 매핑 관리
  12. PowerCenter에서 가져오기
  13. 성능 조정
  14. 푸시다운 최적화
  15. 분할된 매핑
  16. Developer tool 이름 지정 규칙

Developer 매핑 가이드

Developer 매핑 가이드

각 파이프라인 단계마다 여러 개의 스레드

각 파이프라인 단계마다 여러 개의 스레드

최대 병렬도가 1보다 큰 값으로 설정된 경우 분할이 활성화됩니다. 데이터 통합 서비스는 매핑을 파이프라인 단계로 분리하고 여러 스레드를 사용하여 각 단계를 처리합니다. 파이프라인 단계의 스레드 수는 해당 단계의 파티션 수와 같습니다.
병렬도를 최대화하면 데이터 통합 서비스에서 런타임에 다음 태스크를 동적으로 수행합니다.
데이터를 여러 파티션으로 분할.
데이터 통합 서비스는 기본 데이터를 여러 개의 파티션으로 동적으로 분할하고 파티션을 동시에 실행합니다. 데이터 통합 서비스는 각 파이프라인 단계에 대한 최적의 스레드 수를 결정합니다. 단일 파이프라인 단계에 사용되는 스레드 수는 최대 병렬도 값을 초과할 수 없습니다. 데이터 통합 서비스는 각 파이프라인 단계에 서로 다른 수의 스레드를 사용할 수 있습니다.
여러 파티션 지점 간에 데이터 재배포.
데이터 통합 서비스는 변환 요구 사항에 기반하여 파티션 지점에 걸쳐 데이터를 재배포하는 가장 좋은 방법을 동적으로 결정합니다.
다음 이미지는 각 파이프라인 단계에서 여러 파티션에 걸쳐 데이터를 배포하는 매핑 예제를 보여 줍니다.
매핑은 두 개의 파티션에 걸쳐 판독기 파이프라인 단계와 첫 번째 변환 파이프라인 단계를 배포합니다. 두 번째 변환 파이프라인 단계에서는 매핑이 세 개의 파티션에 걸쳐 행을 재배포합니다. 매핑은 세 개의 파티션에 걸쳐 기록기 파이프라인 단계를 배포합니다.
이전 이미지에서는 데이터 통합 서비스의 최대 병렬도가 3입니다. 매핑의 최대 병렬도는 자동입니다. 데이터 통합 서비스는 매핑을 네 개의 파이프라인 단계로 구분하고 총 12개의 스레드를 사용하여 매핑을 실행합니다. 데이터 통합 서비스는 각 파이프라인 단계에서 다음과 같은 태스크를 수행합니다.
  • 판독기 파이프라인 단계에서 데이터 통합 서비스는 Oracle 데이터베이스 시스템을 쿼리하여 두 소스 테이블(소스 A 및 소스 B) 모두에 데이터베이스 파티션이 두 개씩 있음을 확인합니다. 데이터 통합 서비스는 각 데이터베이스 파티션에 판독기 스레드 한 개를 사용합니다.
  • 첫 번째 변환 파이프라인 단계에서 데이터 통합 서비스는 스레드 두 개에 걸쳐 조인 조건을 위해 그룹 행에 데이터를 재배포합니다.
  • 두 번째 변환 파이프라인 단계에서 데이터 통합 서비스는 집계 변환에 가장 적합한 스레드 수가 세 개임을 확인합니다. 서비스는 스레드 세 개에 걸쳐 집계 식을 위해 그룹 행에 데이터를 재배포합니다.
  • 기록기 파이프라인 단계에서는 데이터 통합 서비스가 대상 파티션 지점에 걸쳐 행을 재배포할 필요가 없습니다. 단일 파티션의 모든 행은 대상 파티션 지점을 거친 후에도 동일한 파티션에 유지됩니다.