Developer 转换指南

10.5.2
- 10.5
- 10.4.0
- 10.1.1 HotFix 2
- 10.1.1
- 10.1

上一个下一个

合并映射

要合并记录，请创建一个可创建相关记录组的映射。将合并转换添加到映射中，并将该转换配置为将每个记录组合并到单个主记录。

根据业务目标和数据要求，将合并转换连接到其他转换。要合并匹配的记录，可以将合并转换连接到匹配转换。要将记录合并到异常记录管理中，请将该合并转换连接到某个异常转换。如果使用键生成器转换对记录进行分组，可以将某个合并转换直接连接到该键生成器转换。合并转换会为由键生成器转换创建的每个组创建一条合并的记录。

本地和 Hadoop 环境中的映射输出

当您分别在本地环境和 Hadoop 环境中运行合并映射时，合并转换可能会产生不同的结果。因为映射运行于 Hadoop 中的多个节点上，所以输入记录可能会以与本地环境中不同的顺序输入合并转换。其结果是，对于同一个输入数据集，转换可能会在每个环境中生成不同的残存记录集。对于每种情况下的输入行顺序，转换计算和合并后的结果都是准确的。

要在本地和 Hadoop 环境中生成相同的残存记录，请将合并转换配置为按以下顺序排列记录：

首先，在“分组依据”端口上对记录进行排序。

然后，按照输入端口在转换中的出现顺序对记录进行排序。

合并转换

下载指南

发送反馈

社区

Knowledge Base

成功门户