目录

Search

  1. 前言
  2. 转换简介
  3. 转换端口
  4. 转换缓存
  5. 地址验证器转换
  6. 汇总器转换
  7. 关联转换
  8. 离散记录异常转换
  9. 大小写转换器转换
  10. 分类器转换
  11. 比较转换
  12. 合并转换
  13. 数据屏蔽转换
  14. 数据处理器转换
  15. 判定转换
  16. 重复记录异常转换
  17. 表达式转换
  18. 筛选器转换
  19. 层次结构到关系转换
  20. Java 转换
  21. Java 转换 API 引用
  22. Java 表达式
  23. 联接器转换
  24. 键生成器转换
  25. 标签创建器转换
  26. 查找转换
  27. 查找缓存
  28. 动态查找缓存
  29. 宏转换
  30. 匹配转换
  31. 字段分析中的匹配转换
  32. 标识分析中的匹配转换
  33. 规范器转换
  34. 合并转换
  35. 解析器转换
  36. Python 转换
  37. 等级转换
  38. 读取转换
  39. 关系到层次结构转换
  40. REST Web 服务使用者转换
  41. 路由器转换
  42. 序列生成器转换
  43. 排序器转换
  44. SQL 转换
  45. 标准创建器转换
  46. 联合转换
  47. 更新策略转换
  48. Web 服务使用者转换
  49. 解析 Web 服务 SOAP 消息
  50. 生成 Web 服务 SOAP 消息
  51. 加权平均值转换
  52. 窗口转换
  53. 写入转换
  54. 附录 , A: 转换分隔符

Developer 转换指南

Developer 转换指南

窗口转换

窗口转换

如果要将流式传输数据累积到数据组中,然后处理数据集,可以使用窗口转换。窗口转换是一种被动转换。
从未绑定的源读取数据时,您可能需要将数据累积到已绑定的数据组中以进一步进行处理。要将已绑定的间隔引入到未绑定的数据,可以使用窗口转换。
配置窗口转换时,请按时间定义窗口类型和数据边界。要指定数据边界,请配置窗口大小和窗口滑动间隔。窗口大小定义将数据累积到数据组的时间间隔。滑动间隔定义进一步处理已累积的数据组前的时间间隔。水印延迟定义要累积到数据组中的延迟事件的阈值时间。
只能在 Spark 引擎上为流映射运行窗口转换。
有关窗口转换的详细信息,请参阅《
Data Engineering Streaming 用户指南
》。