目录

Search

  1. 前言
  2. 工作流管理器
  3. 工作流和工作集
  4. 会话
  5. 会话配置对象
  6. 任务
  7. 目标
  8. 连接对象
  9. 验证
  10. 计划和运行工作流
  11. 发送电子邮件
  12. Workflow Monitor
  13. Workflow Monitor 详细信息
  14. 会话和工作流日志
  15. 附录 , A: 会话属性参考
  16. 附录 , B: 工作流属性参考

工作流基本指南

工作流基本指南

PowerExchange for Hadoop 连接

PowerExchange for Hadoop 连接

您为希望访问的每个 Hadoop 源或目标使用 Hadoop HDFS 应用程序连接对象。
您通过为 Hadoop 群集运行名称节点服务的 HDFS 主机连接到 Hadoop 群集。
下表介绍了您为 Hadoop HDFS 应用程序连接配置的属性:
属性
说明
名称
Workflow Manager 使用的连接名称。连接名称不能包含空格或除下划线字符以外的其他特殊字符。
用户名
Hadoop 组中用来访问 HDFS 主机的用户名。
密码
访问 HDFS 主机时使用的密码。保留以供将来使用。
HDFS 连接 URI
用于访问 HDFS 的 URI。NameNode URI 使用
fs.default.name
属性的值。可以为 NameNode URI 找到属性的值。您可以在
core-site.xml
配置集中找到
fs.default.name
属性的值。
Hadoop 分布的语法
hdfs://<namenode>:<port>
其中
  • <namenode> 表示 NameNode 的主机名或 IP 地址。
  • <port> 表示 NameNode 用来侦听远程过程调用 (RPC) 的端口。
MapR 分布的语法
maprfs:///
HDInsight 分布的语法
  • adl:// <nameservices>
  • wasb://<nameservices>
Hive 驱动程序名称
Hive 驱动程序的名称。
默认情况下,驱动程序名称为:
org.apache.hive.jdbc.HiveDriver
Hive URL
Hive 主机的 URL。
对于 MapR Ticket 群集,请按以下格式指定 URL:
jdbc:hive2://
hostname
:
portnumber
/default;auth=MAPRSASL/default;auth=MAPRSASL
对于 MapR Kerberos 群集,请按以下格式指定 URL:
jdbc:hive2://
hostname
:
portnumber
/default;auth=MAPRSASL/default;principal=<spn>
Hive 用户名
Hive 用户名。保留以供将来使用。
Hive 密码
Hive 用户的密码。保留以供将来使用。
Hadoop 分布
Hadoop 分布的名称。
默认值为 cloudera_cdh。