목차

Search

  1. 서문
  2. 매핑
  3. 맵렛
  4. 매핑 매개 변수
  5. 매개 변수를 할당할 위치
  6. 매핑 출력
  7. SQL 쿼리에서 매핑 생성
  8. 동적 매핑
  9. 동적 매핑을 개발 및 실행하는 방법
  10. 동적 매핑 사용 사례
  11. 매핑 관리
  12. PowerCenter로 내보내기
  13. PowerCenter에서 가져오기
  14. 성능 조정
  15. 푸시다운 최적화
  16. 분할된 매핑
  17. Developer tool 이름 지정 규칙

Developer 매핑 가이드

Developer 매핑 가이드

각 파이프라인 단계마다 하나의 스레드

각 파이프라인 단계마다 하나의 스레드

최대 병렬도를 1로 설정하면 분할이 비활성화됩니다. 데이터 통합 서비스는 매핑을 파이프라인 단계로 분리하고 각 단계를 처리하는 한 개의 스레드를 사용합니다.
각 매핑에는 하나 이상의 파이프라인이 포함됩니다. 파이프라인은 읽기 변환 및 해당 읽기 변환으로부터 데이터를 수신하는 모든 변환으로 구성됩니다. 데이터 통합 서비스는 매핑 파이프라인을 여러 개의 파이프라인 단계로 분리한 후 각 파이프라인 단계에 대해 추출, 변환 및 로드를 병렬로 수행합니다.
파티션 지점은 파이프라인에서 경계를 표시하며 파이프라인을 여러 단계로 분할합니다. 모든 매핑 파이프라인에 대해 데이터 통합 서비스는 읽기 변환 다음과 쓰기 변환 전에 파티션 지점을 추가하여 여러 파이프라인 단계를 작성합니다.
각 파이프라인 단계는 다음 스레드 중 하나에서 실행됩니다.
  • 데이터 통합 서비스가 소스에서 데이터를 추출하는 방식을 제어하는 판독기 스레드.
  • 데이터 통합 서비스가 파이프라인의 데이터를 처리하는 방식을 제어하는 변환 스레드.
  • 데이터 통합 서비스가 대상으로 데이터를 로드하는 방식을 제어하는 기록기 스레드.
다음 그림에서는 판독기 파이프라인 단계, 변환 파이프라인 단계 및 기록기 파이프라인 단계로 분리된 매핑을 보여 줍니다.
소스 및 대상은 파티션 지점입니다. 판독기 파이프라인 단계는 소스를 포함하고, 변환 파이프라인 단계는 필터 및 식 변환을 포함하고, 기록기 파이프라인 단계는 대상을 포함합니다.
파이프라인에는 3개의 단계가 포함되어 있기 때문에 데이터 통합 서비스가 행 집합 3개를 동시에 처리하고 매핑 성능을 최적화할 수 있습니다. 예를 들어 판독기 스레드가 세 번째 행 집합을 처리하는 동안 변환 스레드는 두 번째 행 집합을 처리하고 기록기 스레드는 첫 번째 행 집합을 처리합니다.
다음 테이블에는 여러 스레드가 행 집합 3개를 어떻게 동시에 처리하는지 나와 있습니다.
판독기 스레드
변환 스레드
기록기 스레드
행 집합 1
-
-
행 집합 2
행 집합 1
-
행 집합 3
행 집합 2
행 집합 1
행 집합 4
행 집합 3
행 집합 2
행 집합 n
행 집합 (n-1)
행 집합 (n-2)
복잡한 계산을 수행하는 변환이 매핑 파이프라인에 포함되어 있으면 변환 파이프라인 단계 처리에 긴 시간이 걸릴 수 있습니다. 성능을 최적화하기 위해 데이터 통합 서비스는 일부 변환 앞에 파티션 지점을 추가하여 다른 변환 파이프라인 단계를 추가적으로 작성합니다.