Informatica Data Quality
- Informatica Data Quality 10.4.1
- 所有产品
属性
| 说明
|
|---|---|
模拟用户名
| 如果 Hadoop 群集使用 Kerberos 身份验证,则为必需。Hadoop 模拟用户。数据集成服务模拟的用户名,用于在 Hadoop 环境中运行映射。
数据集成服务将根据所配置的用户运行映射。数据集成服务按照以下优先级对用户运行映射:
|
临时表压缩编解码器
| 压缩编解码器类名的 Hadoop 压缩库。
Spark 引擎不支持临时表的压缩设置。在 Spark 引擎上运行映射时,Spark 引擎会采用未压缩文件格式存储临时表。
|
编解码器类名
| 可在临时暂存表上启用数据压缩并提高性能的编解码器类名。
|
Hive 暂存数据库名称
| Hive 暂存表的命名空间。对于未指定数据库名称的表,请使用名称 default 。
如果您未配置命名空间,则数据集成服务将使用 Hive 目标连接中的 Hive 数据库名称来创建暂存表。
在本地环境中运行映射以将数据写入到 Hive 中时,必须在 Hive 连接中配置 Hive 暂存数据库名称。数据集成服务将忽略在 Hadoop 连接中配置的值。
|
环境 SQL
| 用于设置 Hadoop 环境的 SQL 命令。数据集成服务在 HiveServer2 作业生成的每个 Hive 脚本开始时执行环境 SQL。
使用环境 SQL 时适用以下规则和准则:
|
引擎类型
| 数据集成服务通过在 Spark 引擎上运行 HiveServer2 任务,使用 HiveServer2 来处理一些作业的某些部分。通过管理工具导入群集配置时,可以选择创建连接。系统会根据发行版默认填充引擎类型属性。
手动创建连接时,必须配置引擎类型。根据 Hadoop 发行版,使用以下引擎类型:
|
高级属性
| Hadoop 环境特有的高级属性的列表。这些属性通用于 Blaze 和 Spark 引擎。高级属性包括一组默认属性。
您可以在数据集成服务,Hadoop 连接和映射中配置 Hadoop 环境的运行时属性。通过在较低级别设置属性值,可以替代在较高级别配置的属性。例如,如果您在数据集成服务自定义属性中配置某个属性,则可以在 Hadoop 连接或映射中替代该属性。数据集成服务根据以下优先级来处理属性的替代:
Informatica 建议在更改这些属性值之前,先查阅第三方文档或 Informatica 文档或者咨询 Informatica 全球客户支持。如果在不了解属性的情况下更改属性值,则可能会导致性能降级或其他意外结果。
|