目录

Search

  1. 前言
  2. 工作流管理器
  3. 工作流和工作集
  4. 会话
  5. 会话配置对象
  6. 任务
  7. 目标
  8. 连接对象
  9. 验证
  10. 计划和运行工作流
  11. 发送电子邮件
  12. Workflow Monitor
  13. Workflow Monitor 详细信息
  14. 会话和工作流日志
  15. 附录 , A: 会话属性参考
  16. 附录 , B: 工作流属性参考

工作流基本指南

工作流基本指南

PowerExchange for Google BigQuery 连接

PowerExchange for Google BigQuery 连接

在配置 Google BigQuery 连接时,需要定义 PowerCenter 集成服务连接到 Google BigQuery 数据库时要使用的连接属性。
下表介绍了 Google BigQuery 连接属性:
属性
说明
服务帐户 ID
指定创建服务帐户后下载的 JSON 文件中的 client_email 值。
服务帐户密钥
指定创建服务帐户后下载的 JSON 文件中的 private_key 值。
连接模式
与 Google BigQuery 间进行数据读写时要使用的模式。
选择以下连接模式之一:
  • 简单。将“记录”数据类型字段中的每个字段平展为映射中的单独字段。
  • 混合。显示 Google BigQuery 表中的所有顶级字段,包括“记录”数据类型字段。PowerExchange for Google BigQuery 将顶级“记录”数据类型字段显示为映射中的单个“字符串”数据类型字段。
  • 复杂。将 Google BigQuery 表中的所有列显示为映射中的单个“字符串”数据类型字段。
默认值为“简单”。
架构定义文件路径
指定客户端计算机上的一个目录,用于存储 PowerCenter 集成服务必须使用 Google BigQuery 表的示例架构创建的 JSON 文件。此 JSON 文件名与 Google BigQuery 表名相同。
也可以指定 Google Cloud Storage 上的一个存储路径,用于存储 PowerCenter 集成服务必须使用 Google BigQuery 表的示例架构创建的 JSON 文件。可将此 JSON 文件从 Google Cloud Storage 中的指定存储路径下载到本地计算机。
项目 ID
指定创建服务帐户后下载的 JSON 文件中的 project_id 值。
如果创建了多个采用同一个服务帐户的项目,请输入要连接到的数据集所在项目的 ID。
存储路径
在读取或写入大量数据时应用此属性。
Google Cloud Storage 中 PowerCenter 集成服务为了临时存储数据而创建的本地暂存文件的路径。
可输入存储桶名称或存储桶名称加文件夹名称。
例如,输入
gs://<存储桶名称>
gs://<存储桶名称>/<文件夹名称>
数据集 ID
不适用于 PowerExchange for Google BigQuery。
使用旧 SQL 进行自定义查询
使用旧 SQL 定义自定义查询。
可以清除此选项,必须使用标准 SQL 来定义自定义查询。
自定义查询的数据集名称
定义自定义查询时,必须指定 Google BigQuery 数据集。
区域 Id
Google BigQuery 数据集所位于的区域的名称。
例如,如果要连接到位于拉斯维加斯区域的 Google BigQuery 数据集,请指定
us-west4
作为
区域 ID
存储路径
连接属性中,请确保指定与 Google BigQuery 数据集位于同一个区域的存储桶名称或文件夹名称。
有关 Google BigQuery 支持的区域的详细信息,请参阅以下 Google BigQuery 文档:https://cloud.google.com/bigquery/docs/locations
可选属性
指定是否可以通过自定义属性配置某些源功能和目标功能。
可以选择以下选项之一:
  • 无。如果不想配置任何自定义属性,则选择此选项。
  • 必需。如果要指定自定义属性来配置源功能和目标功能,则选择此选项。
默认值为“无”。
提供可选属性
逗号分隔的自定义属性键/值对,以启用其他源功能和目标功能。
仅当您在“可选属性”中选择
必需
时出现。