词汇表
Spring Batch 词汇表
- 批处理
-
随着时间的推移而积累的业务交易。
- 批处理应用程序样式
-
用于将批处理指定为其自身应用程序样式的术语,类似于在线、Web 或 SOA。它具有输入、验证、将信息转换为业务模型、业务处理和输出的标准元素。此外,它还需要在宏观层面上进行监控。
- 批处理
-
处理随着时间的推移而积累的大量业务交易(例如一小时、一天、一周、一个月或一年)。它是将一个或一组流程应用于许多数据实体或对象,以重复且可预测的方式进行处理,而无需人工元素或为错误处理提供单独的人工元素。
- 批处理窗口
-
批处理作业必须在其中完成的时间范围。这可能受到其他系统上线、其他依赖作业需要执行或批处理环境特有的其他因素
- 步骤
-
主要批处理任务或工作单元。它初始化业务逻辑并控制事务环境,具体取决于提交间隔设置和其他因素。
- 任务
-
由应用程序开发人员创建的组件,用于处理步骤的业务逻辑。
- 批处理作业类型
-
作业类型描述了作业在特定类型的处理中的应用。常见领域包括界面处理(通常是平面文件)、表单处理(用于在线 PDF 生成或打印格式)和报告处理。
- 驱动查询
-
驱动查询标识作业要执行的工作集。然后,作业将该工作分解为各个工作单元。例如,驱动查询可能是识别所有状态为“待传输”的财务交易,并将它们发送到合作伙伴系统。驱动查询返回要处理的一组记录 ID。然后,每个记录 ID 都成为一个工作单元。驱动查询可能涉及联接(如果选择条件跨越两个或更多表),或者它可能使用单个表。
- 项目
-
项目表示要处理的最小完整数据量。最简单的说法,这可能是文件中的一个行、数据库表中的一个行或 XML 文件中的一个特定元素。
- 逻辑工作单元 (LUW)
-
批处理作业迭代遍历驱动查询(或其他输入源,例如文件)以执行作业必须完成的一组工作。执行的每次工作迭代都是一个工作单元。
- 提交间隔
-
在单个事务中处理的一组 LUW。
- 分区
-
将作业拆分为多个线程,其中每个线程负责要处理的整体数据的子集。执行线程可能位于同一 JVM 中,或者它们可能跨越支持工作负载平衡的集群环境中的 JVM。
- 暂存表
-
在处理时保存临时数据的表。
- 可重启
-
可以再次执行的作业,并且在运行时假定与最初运行时相同的身份。换句话说,它具有相同的作业实例 ID。
- 可重新运行
-
一个可重新启动且根据前一次运行的记录处理管理其自身状态的作业。可重新运行的步骤的一个示例是基于驱动查询的步骤。如果可以形成驱动查询,以便在作业重新启动时限制处理的行,则该查询可重新运行。这由应用程序逻辑管理。通常,会向
where
语句添加一个条件,以限制驱动查询返回的行,逻辑类似于and processedFlag!= true
。 - 重复
-
批处理最基本的单元之一,它通过重复调用一段代码来定义,直到它完成并且没有错误。通常,只要有输入,批处理就会是可重复的。
- 重试
-
简化了操作执行,其中重试语义最常与处理事务输出异常相关。重试与重复略有不同。重试不是连续调用代码块,而是有状态的,并且会连续使用相同的输入调用相同的代码块,直到它成功或超过某种类型的重试限制。通常只有在操作的后续调用可能会成功(因为环境中的某些内容已得到改善)时,它才普遍有用。
- 恢复
-
恢复操作以这样一种方式处理异常,即重复过程能够继续。
- 跳过
-
跳过是一种恢复策略,通常在文件输入源上使用,作为忽略未通过验证的错误输入记录的策略。