目录

Search

  1. 前言
  2. 了解域
  3. 管理您的帐户
  4. 使用 Informatica Administrator
  5. 使用“域”视图
  6. 域管理
  7. 节点
  8. 高可用性
  9. 连接
  10. 连接属性
  11. 计划
  12. 域对象导出和导入
  13. 许可证管理
  14. 监视
  15. 日志管理
  16. 域报告
  17. 节点诊断
  18. 了解全球化
  19. 代码页
  20. 自定义角色
  21. Informatica 平台连接
  22. 配置 Web 浏览器

管理员指南

管理员指南

HDFS 连接属性

HDFS 连接属性

使用 Hadoop 文件系统 (HDFS) 连接可访问 Hadoop 群集中的数据。HDFS 连接属于文件系统类型连接。您可以在 Administrator 工具、Analyst 工具或 Developer 工具中创建和管理 HDFS 连接。HDFS 连接属性区分大小写,另有说明除外。
连接属性的顺序可能会因查看属性所用的工具而异。
下表介绍了 HDFS 连接属性:
属性
说明
名称
连接的名称。名称不区分大小写,但在域中必须唯一。名称不能超出 128 个字符,也不能包含空格或以下特殊字符:
~ ` ! $ % ^ & * ( ) - + = { [ } ] | \ : ; " ' < , > . ? /
ID
数据集成服务用来标识连接的字符串。ID 不区分大小写。不得超过 255 个字符,并且在域中必须唯一。不能在创建连接后更改此属性。默认值是连接名称。
说明
连接的说明。说明不得超过 765 个字符。
位置
要在其中创建连接的域。对 Analyst 工具不适用。
类型
连接类型。默认为 Hadoop 文件系统。
用户名
用于访问 HDFS 的用户名。
NameNode URI
用于访问存储系统的 URI。
可以在群集配置的
core-site.xml
配置集中找到
fs.defaultFS
的值。
如果在导入群集配置时创建连接,则会默认填充 NameNode URI 属性,并在每次刷新群集配置时更新该属性。如果您手动设置此属性或替代属性值,则刷新操作不会更新此属性。

访问多个存储类型

在连接参数中使用 NameNode URI 属性来连接到多个存储类型。下表介绍了存储类型以及存储类型的 NameNode URI 格式:
存储
NameNode URI 格式
HDFS
hdfs://<namenode>:<port>
其中:
  • <名称节点>
    表示名称节点的主机名或 IP 地址。
  • <端口>
    表示名称节点用于侦听远程过程调用 (RPC) 的端口。
hdfs://<nameservice>
,对于 NameNode 高可用性。
MapR-FS
maprfs:///
HDInsight 中的 WASB
wasb://<container_name>@<account_name>.blob.core.windows.net/<path>
其中:
  • <container_name>
    标识特定的 Azure 存储 Blob 容器。
    <container_name>
    为可选。
  • <account_name>
    标识 Azure 存储 Blob 对象。
示例:
wasb://infabdmoffering1storage.blob.core.windows.net/infabdmoffering1cluster/mr-history
HDInsight 中的 ADLS
adl://home
从 Azure HDInsight 群集创建群集配置时,该群集配置将使用 ADLS 或 WASB 作为主存储。不能以 ADLS 或 WASB 作为辅助存储来创建群集配置。可以在 HDFS 连接中编辑 NameNode URI 属性以连接到本地 HDFS 位置。