目录

Search

  1. 前言
  2. 了解域
  3. 管理您的帐户
  4. 使用 Informatica Administrator
  5. 使用“域”视图
  6. 域管理
  7. 节点
  8. 高可用性
  9. 连接
  10. 连接属性
  11. 计划
  12. 域对象导出和导入
  13. 许可证管理
  14. 监视
  15. 日志管理
  16. 域报告
  17. 节点诊断
  18. 了解全球化
  19. 代码页
  20. 自定义角色
  21. Informatica 平台连接
  22. 配置 Web 浏览器

管理员指南

管理员指南

代码页兼容性

代码页兼容性

PowerCenter 集成服务在 Unicode 数据移动模式下运行时,各代码页之间的兼容性是保证数据移动准确无误必不可少的条件。
代码页可以与另一个代码页兼容,或者可以是另一个代码页的子集或超集:
  • 可兼容。如果在两个代码页中编码的字符几乎相同,则两个代码页兼容。例如,JapanEUC 和 JIPSE 代码页包含相同的字符且彼此兼容。PowerCenter 存储库和 PowerCenter 集成服务进程可以每次使用其中任意一个代码页,且可以传回数据而不造成数据丢失。
  • 超集。如果一个代码页包含在另一个代码页中编码的字符和另一个代码页中未编码的字符,则该代码页是另一个代码页的超集。例如,MS Latin1 是 US-ASCII 的超集,因为 MS Latin1 包含 US-ASCII 代码页中的所有字符。
    Informatica 会将一个代码页视为其自身和所有其他兼容代码页的超集。
  • 子集。如果代码页中的所有字符同时在另一个代码页中进行编码,则该代码页是另一个代码页的子集。例如,US-ASCII 是 MS Latin1 的子集,因为 US-ASCII 代码页中的所有字符也会在 MS Latin1 代码页中进行编码。
为保证数据移动准确无误,目标代码页必须是源代码页的超集。如果目标代码页不是源代码页的超集,则 PowerCenter 集成服务可能不会处理所有字符,从而导致数据不正确或数据丢失。例如,Latin1 是 US-ASCII 的超集。如果选择 Latin1 作为源代码页,并选择 US-ASCII 作为目标代码页,则如果源包含的字符并不包含在 US-ASCII 中,则可能会丢失字符数据。
安装或升级 PowerCenter 集成服务以在 Unicode 模式下运行时,必须确保域配置数据库、Administrator 工具、PowerCenter 客户端、PowerCenter 集成服务进程节点、PowerCenter 存储库、Metadata Manager 存储库以及托管
pmrep
pmcmd
的计算机之间的代码页相互兼容。在 Unicode 模式下,PowerCenter 集成服务会强制执行 PowerCenter 客户端与 PowerCenter 存储库以及 PowerCenter 集成服务进程与 PowerCenter 存储库之间的代码页兼容性。另外,在 Unicode 模式下运行 PowerCenter 集成服务时,与会话关联的代码页必须具有相应的关系:
  • 对于会话中的每个源,源代码页必须是目标代码页的子集。PowerCenter 集成服务不要求源与 PowerCenter 集成服务进程或 PowerCenter 集成服务进程与目标之间的代码页相互兼容。
  • 如果会话包含查找或存储过程转换,则数据库或文件代码页必须是从查找或存储过程转换接收数据的目标的子集,同时是向查找或存储过程转换提供数据的源的超集。
  • 如果会话包含外部过程或自定义转换,则过程必须在属于目标代码页的子集的代码页中传递数据,该目标代码页是针对从外部过程或自定义转换中接收数据的目标。
Informatica 使用以下组件的代码页:
  • 域配置数据库。域配置数据库必须与 PowerCenter 存储库和 Metadata Manager 存储库的代码页兼容。
  • Administrator 工具。可以在 Administrator 工具中输入任何语言的数据。
  • PowerCenter 客户端。可以在 PowerCenter 客户端中输入任何语言的元数据。
  • PowerCenter 集成服务进程。PowerCenter 集成服务可以在 ASCII 模式和 Unicode 模式下移动数据。默认数据移动模式为 ASCII,可传递 7 位 ASCII 或 8 位 ASCII 字符数据。要将多字节字符数据从源传递至目标,请使用 Unicode 数据移动模式。在 Unicode 模式下运行 PowerCenter 集成服务时,每个字符最多可以使用三个字节来移动数据,并在会话级别执行其他检查以确保数据完整性。
  • PowerCenter 存储库。PowerCenter 存储库可以存储任何语言的数据。可以将 UTF-8 代码页用于 PowerCenter 存储库以便在 PowerCenter 存储库中存储多字节数据。PowerCenter 存储库的代码页与数据库代码页相同。
  • Metadata Manager 存储库。Metadata Manager 存储库可以存储任何语言的数据。可以将 UTF-8 代码页用于 Metadata Manager 存储库以便在该存储库中存储多字节数据。该存储库的代码页与数据库代码页相同。
  • 源和目标。源和目标可存储一个或多个语言的数据。使用代码页可指定源和目标中的字符类型。
  • PowerCenter 命令行程序。必须同时确保
    pmrep
    的代码页是 PowerCenter 存储库代码页的子集,以及
    pmcmd
    的代码页是 PowerCenter 集成服务进程代码页的子集。
大多数数据库服务器使用两个代码页,一个客户端代码页用于接收客户端应用程序中的数据,一个服务器代码页用于存储数据。数据库服务器正在运行时,如果两个代码页不同,该服务器会在两个代码页之间转换数据。在此类型的数据库配置中,PowerCenter 集成服务进程与数据库客户端代码页进行交互。因此,PowerCenter 集成服务进程使用的代码页(如 PowerCenter 存储库、源或目标代码页)必须与数据库客户端代码页相同。数据库客户端代码页通常与 PowerCenter 集成服务进程运行所在的操作系统代码页相同。数据库客户端代码页是数据库服务器代码页的子集。
有关特定数据库客户端和服务器代码页的详细信息,请参阅数据库文档。