目录

Search

  1. 前言
  2. 命令行程序和实用程序
  3. 安装和配置命令行实用程序
  4. 使用命令行程序
  5. 命令行程序的环境变量
  6. 使用 infacmd
  7. infacmd as 命令引用
  8. infacmd aud 命令引用
  9. Infacmd bg 命令参考
  10. infacmd cms 命令引用
  11. infacmd dis 命令引用
  12. Infacmd es 命令参考
  13. infacmd ihs 命令参考
  14. infacmd ipc 命令引用
  15. infacmd isp 命令引用
  16. infacmd ldm 命令参考
  17. infacmd mrs 命令引用
  18. infacmd ms 命令引用
  19. infacmd oie 命令引用
  20. infacmd ps 命令引用
  21. infacmd pwx 命令引用
  22. infacmd rms 命令参考
  23. infacmd rtm 命令引用
  24. infacmd sch 命令参考
  25. infacmd search 命令引用
  26. infacmd sql 命令引用
  27. infacmd tdm 命令引用
  28. infacmd wfs 命令引用
  29. infacmd ws 命令引用
  30. infacmd xrf 命令引用
  31. infacmd 控制文件
  32. infasetup 命令引用
  33. pmcmd 命令引用
  34. pmrep 命令引用
  35. 处理 pmrep 文件
  36. POWERCENTERHELP

Hive 连接选项

Hive 连接选项

使用连接选项定义 Hive 连接。
按以下格式输入连接选项:
... -o option_name='value' option_name='value' ...
要输入多个选项,请使用空格将它们分隔开。
下表介绍了 infacmd isp CreateConnection 和 UpdateConnection 命令的 Hive 连接选项,您可在希望使用 Hive 连接时配置它们:
选项
描述
connectionType
必需。 连接类型为 Hive。
名称
连接的名称。 名称不区分大小写,但在域中必须唯一。 可以在创建连接后更改此属性。 名称不能超出 128 个字符,也不能包含空格或以下特殊字符:
~ ` ! $ % ^ & * ( ) - + = { [ } ] | \ : ; " ' < , > . ? /
relationalSourceAndTarget
Hive 连接模式。 如果要使用连接来访问 Hive 数据仓库,请将此选项设置为 true。 如果要访问 Hive 目标,则需要启用同一个连接或另一个 Hive 连接,以在 Hadoop 群集中运行映射。
如果启用关系源和目标,则必须指定 metadataDatabaseString 选项。
pushDownMode
Hive 连接模式。 如果要使用连接在 Hadoop 群集中运行映射,请将此选项设置为 true。
如果为连接启用下推模式,则必须指定选项以在 Hadoop 群集中运行 Informatica 映射。
environmentSQL
用于设置 Hadoop 环境的 SQL 命令。 在本机环境类型中,数据集成服务会在每次创建与 Hive 元存储的连接时执行环境 SQL。 如果使用 Hive 连接在 Hadoop 群集中运行映射,数据集成服务会在每个 Hive 会话开始时执行环境 SQL。
在两种连接模式下使用环境 SQL 时适用以下规则和指导原则:
  • 使用环境 SQL 指定 Hive 查询。
  • 使用环境 SQL 设置 Hive 用户定义的函数的类路径,然后使用环境 SQL 或 PreSQL 指定 Hive 用户定义的函数。 不能在数据对象属性中使用 PreSQL 来指定类路径。 路径必须为指向 JAR 文件(用于用户定义的函数)的完全限定路径。 使用 infapdo.aux.jars.path 中的所有条目以及指向 JAR 文件(用于用户定义的函数)的路径来设置参数 hive.aux.jars.path。
  • 也可以使用环境 SQL 来定义计划在 PreSQL 命令或自定义查询中使用的 Hadoop 或 Hive 参数。
如果使用 Hive 连接在 Hadoop 群集中运行映射,则仅会执行 Hive 连接的环境 SQL。 即使 Hive 源和目标位于不同的群集上,也不会为 Hive 源或目标的连接执行不同的环境 SQL 命令。
enableQuotes
用引号将所有数据库保留字引起来。 默认值是 false。

用于访问作为源或目标的 Hive 的属性

下表介绍了 infacmd isp CreateConnection 和 UpdateConnection 命令的必需选项,您可在希望使用 Hive 连接访问 Hive 数据时配置它们:
属性
说明
metadataConnString
JDBC 连接 URI 用于访问 Hadoop 服务器中的元数据。
连接字符串采用以下格式:
jdbc:hive://<hostname>:<port>/<db>
其中
  • hostname
    表示正在运行 Hive 服务器的计算机的名称或 IP 地址。
  • port
    表示 Hive 服务器用来执行侦听的端口。
  • db
    表示要连接到的数据库。 如果未提供数据库详细信息,数据集成服务会使用默认的数据库详细信息。
bypassHiveJDBCServer
JDBC 驱动程序模式。 启用此选项可使用嵌入式 JDBC 驱动程序(嵌入模式)。
要使用 JDBC 嵌入模式,请执行以下任务:
  • 验证 Hive 客户端与 Informatica 服务是否安装在同一台计算机上。
  • 将 Hive 连接属性配置为在 Hadoop 群集中运行映射。
如果选择非嵌入模式,则必须配置数据访问连接字符串。
首选模式为 JDBC 嵌入模式,而不是非嵌入模式。
connectString
用于访问 Hadoop 数据存储中数据的连接字符串。 JDBC 非嵌入模式连接字符串必须采用以下格式:
jdbc:hive://<hostname>:<port>/<db>
其中
  • hostname
    表示正在运行 Hive 服务器的计算机的名称或 IP 地址。
  • port
    表示 Hive 服务器用来执行侦听的端口。 默认值为 10000。
  • db
    表示要连接到的数据库。 如果未提供数据库详细信息,数据集成服务会使用默认的数据库详细信息。

用于在 Hadoop 群集中运行映射的属性

下表介绍了 infacmd isp CreateConnection 和 UpdateConnection 命令的必需选项,您可在希望使用 Hive 连接在 Hadoop 群集中运行 Informatica 映射时配置它们:
属性
说明
databaseName
表的命名空间。 对于未指定数据库名称的表,请使用名称
default
defaultFSURI
用于访问默认的 Hadoop 分布式文件系统的 URI。
FS URI 必须采用以下格式:
hdfs://<node name>:<port>
其中
  • node name
    表示 NameNode 的主机名或 IP 地址。
  • port
    表示 NameNode 用来侦听远程过程调用 (RPC) 的端口。
jobTrackerURI
Hadoop 中将 MapReduce 任务提交到群集中特定节点的服务。
JobTracker URI 必须采用以下格式:
<jobtrackername>:<port>
其中
  • jobtrackername
    表示 JobTracker 的主机名或 IP 地址。
  • port
    表示 JobTracker 用来侦听远程过程调用 (RPC) 的端口。
hiveWarehouseDirectoryOnHDFS
仓库(此仓库对群集来说属于本地仓库)的默认数据库的绝对 HDFS 文件路径。 例如,以下文件路径指定了本地仓库:
/user/hive/warehouse
metastoreExecutionMode
连接到远程元存储还是本地元存储的控制机制。 连接到本地元存储时,必须指定元存储数据库 URI、驱动程序、用户名和密码。 连接到远程元存储时,只需指定
远程元存储 URI
metastoreDatabaseURI
用于在本地元存储设置下访问数据存储的 JDBC 连接 URI。 URI 必须采用以下格式:
jdbc:<datastore type>://<node name>:<port>/<database name>
其中
  • node name
    表示数据存储的主机名或 IP 地址。
  • data store type
    表示数据存储的类型。
  • port
    表示数据存储用来侦听远程过程调用 (RPC) 的端口。
  • database name
    表示数据库的名称。
例如,以下 URI 将使用 MySQL 的本地元存储指定为数据存储:
jdbc:mysql://hostname23:3306/metastore
metastoreDatabaseDriver
JDBC 数据存储的驱动程序类名称。 例如,以下类名称指定了 MySQL 驱动程序:
com.mysql.jdbc.Driver
metastoreDatabaseUserName
元存储数据库用户名。
metastoreDatabasePassword
元存储用户名的密码。
remoteMetastoreURI
用于在远程元存储设置下访问元数据的元存储 URI。 对于远程元存储,必须指定 Thrift 服务器详细信息。
URI 必须采用以下格式:
thrift://<hostname>:<port>
其中
  • hostname
    表示 Thrift 元存储服务器的名称或 IP 地址。
  • port
    表示 Thrift 服务器用来执行侦听的端口。