분할 옵션이 있을 경우 관리자는 데이터 통합 서비스에서 매핑을 실행할 때 병렬도를 최대화하도록 할 수 있습니다. 관리자가 병렬도를 최대화하면 데이터 통합 서비스가 기본 데이터를 파티션으로 동적으로 분할하고 모든 파티션을 동시에 처리합니다.
매핑이 큰 데이터 집합을 처리하거나 복잡한 계산을 수행하는 변환을 포함하는 경우 매핑이 처리하는 데 오래 걸릴 수 있고 데이터 처리량이 낮아질 수 있습니다. 이러한 매핑에 대해 분할을 활성화하면 데이터 통합 서비스가 추가 스레드를 사용하여 매핑을 처리하고 성능을 최적화할 수 있습니다.
분할을 활성화하려면 관리자 및 개발자가 다음 태스크를 수행합니다.
관리자는 Administrator 도구에서 데이터 통합 서비스의 최대 병렬도를 1보다 큰 값으로 설정합니다.
최대 병렬도는 단일 파이프라인 단계를 처리하는 최대 병렬 스레드 수를 결정합니다. 관리자는 매핑이 실행되는 노드에서 사용 가능한 CPU 수에 따라
최대 병렬도
속성 값을 높입니다.
필요한 경우 개발자는 Developer tool에서 매핑의 최대 병렬도 값을 설정할 수 있습니다.
기본적으로 각 매핑의
최대 병렬도
속성은 자동으로 설정됩니다. 각 매핑은 데이터 통합 서비스에 대해 정의된 최대 병렬도 값을 사용합니다.
개발자는 매핑 런타임 속성에서 최대 병렬도 값을 변경하여 특정 매핑에 대한 최대값을 정의할 수 있습니다. 데이터 통합 서비스 및 매핑에 대해 최대 병렬도를 다른 정수 값으로 설정할 경우 데이터 통합 서비스는 두 개 중에서 최소값을 사용합니다.
매핑에 대해 분할이 비활성화되면 데이터 통합 서비스가 매핑을 파이프라인 단계로 구분하고 하나의 스레드를 사용하여 각 단계를 처리합니다.
매핑에 대해 분할이 활성화되면 데이터 통합 서비스가 여러 스레드를 사용하여 각 매핑 파이프라인 단계를 처리합니다.
데이터 통합 서비스는 실제 데이터를 입력 및 출력으로 사용하는 매핑에 대해 파티션을 작성할 수 있습니다. 데이터 통합 서비스는 매핑 실행 시 다음과 같은 작업을 완료하기 위해 여러 파티션을 사용할 수 있습니다.