在内容面板中选择工作流中的 Ad Hoc 映射作业、已部署映射作业或映射对象后,可以查看其摘要统计信息。
摘要统计信息
视图会显示作业运行的吞吐量和资源使用情况统计信息。
下图显示了映射作业的
摘要统计信息
视图:
您还可以在
摘要统计信息
选项卡上查看源或目标的摘要统计信息,如已处理的行数和字节数。
对于 Hive 源和目标,“摘要统计信息”中将仅显示
已处理的行数
。Hive 源和目标的其余属性值将显示为 0 或 N/A。
详细统计信息
在内容面板中,可以查看工作流中的 Ad Hoc 映射作业、已部署映射作业或映射对象的详细统计信息。将显示在单独本地进程中运行的时间超过一分钟的作业的详细统计信息。
详细统计信息
视图会显示作业运行的吞吐量和资源使用情况统计信息图。
下图显示了工作流中映射作业的
详细统计信息
视图:
历史统计信息
在
内容
面板中选择工作流中的 Ad Hoc 映射作业、已部署映射作业或映射对象后,可以查看其历史统计信息。
历史统计信息
视图显示过去 500 次运行特定作业的平均数据。例如,您可以查看映射作业的最短持续时间、最长持续时间和平均持续时间。您可以查看该作业运行时使用的平均 CPU 量。可以选择查看具有不同状态(例如,已完成、已取消或已中止)的映射作业的平均数据。条形图将显示每种状态的作业数。单击图形图下方的链接可查看特定状态的统计信息。
下图显示了已完成三次并失败一次的映射作业的
历史统计信息
视图:
聚合群集日志
根据作业 ID 可以获取已部署的 Hadoop 映射、Databricks 映射、自动部署群集作业、本地文件和 Spark 数据预览作业的聚合群集日志。可以为作业获取聚合群集日志的 .zip 或 tar.gz 文件,并将压缩的聚合日志文件写入到目标目录。您还可以使用 infacmd ms