Spring Batch学习笔记三:JobRepository
此系列博客皆为学习Spring Batch时的一些笔记;
Spring Batch Job在运行时有很多元数据,这些元数据一般会被保存在内存或者数据库中,由于Spring Batch在默认配置是使用HSQLDB,也就是说在Job的运行过程中,所有的元数据都被储存在内存中,在Job结束后会随着进程的结束自动消失;在这里我们推荐配置JobRepository去使用MySQL。
在这种情况下,Spring Batch在单次执行或者从一个执行到另外一个执行的时候会使用数据库去维护状态,Job执行的信息包括Job实例、传入的参数、执行的结果、每一个Step执行的结果都会被存储在数据库中;数据库使用了6个表来存储相关信息:
BATCH_JOB_INSTANCE
我们都知道,在Job运行时,一个Job实例被创建;Job实例包含了Job实例它本身和Job参数;所有Job实例本身的信息将会被保存在BATCH_JOB_INSTANCE表中:
字段 | 描述 |
JOB_INSTANCE_ID | 表的主键 |
VERSION | 记录的版本 |
JOB_NAME | 被执行JOB名 |
JOB_KEY | Job名和Job参数的Hash值,被使用来唯一标示一个Job实例 |
BATCH_JOB_PARAMS
这个表包含了所有被传递到Job的参数,正如上面提到的,参数被Spring Batch使用来作为Job标示的一部分。这个表包含的字段如下:
字段 | 描述 |
JOB_INSTANCE_ID | 表示BATCH_JOB_INSTANCE的外键 |
TYPE_CD | 表示被存储的值的类型(string, date, long, double) |
KEY_NAME | Job参数的键(Job参数作为键值对被传递) |
STRING_VAL | 当这个参数是string类型时的值 |
DATE_VAL | 日期型参数值 |
LONG_VAL | 长整型参数值 |
DOUBLE_VAL | 双精度或者单精度型参数值 |
BATCH_JOB_EXECUTION和BATCH_STEP_EXECUTION
当一个Job被创建并执行时,这个Job的运行状态被保存在BATCH_JOB_EXECUTION表中,其中包括:开始时间、结束时间、最近一次执行的结果;
BATCH_STEP_EXECUTION表和BATCH_JOB_EXECUTION差不多,它包含了每一个Step在执行过程中的开始时间、结束时间、commit的次数、Step状态相关的参数;
BATCH_JOB_EXECUTION表的字段信息:
字段 | 描述 |
JOB_EXECUTION_ID | 表的主键 |
VERSION | 记录的版本 |
JOB_INSTANCE_ID | 到BATCH_JOB_INSTANCE表的外键 |
CREATE_TIME | Job实例被创建的时间 |
START_TIME | Job开始执行的时间 |
END_TIME | Job执行结束的时间,不管成功与否 |
STATUS | Job被执行的状态 |
EXIT_CODE | Job返回时的退出码 |
EXIT_MESSAGE | Job返回时的推出消息 |
LAST_UPDATED | 当前记录上一次被更新的时间 |
BATCH_STEP_EXECUTION表的字段信息:
STEP_EXECUTION_ID | 表的主键 |
VERSION | 记录的版本 |
STEP_NAME | 被配置在Job xml中的Step的名字 |
JOB_EXECUTION_ID | 连接到BATCH_JOB_EXECUTION表的外键 |
START_TIME | Step开始的时间 |
END_TIME | Step完成的时间,无论成功与否 |
STATUS | Step当前的状态 |
COMMIT_COUNT | 当前Step被Commit的次数 |
READ_COUNT | 当前Step读取数据库的次数 |
FILTER_COUNT | 当前Step读取到的item数量 |
WRITE_COUNT | 当前Step写的Item数量 |
READ_SKIP_COUNT | 读取Item时跳过的数量 |
WRITE_SKIP_COUNT | 写Item时跳过的数量 |
PROCESS_SKIP_COUNT | 在ItemReader读取后,没有经过ItemProcessor处理的item的数量 |
ROLLBACK_COUNT | 在Step执行过程中,总的Rollback的数量 |
EXIT_CODE | Step完成时返回的退出码 |
EXIT_MESSAGE | Step完成时返回的退出消息 |
LAST_UPDATED | 这条记录上次被更新的时间 |
BATCH_JOB_EXECUTION_CONTEXT和BATCH_STEP_EXECUTION_CONTEXT
这是两个Context相关的表,它们分别用于存储Job或者Step相关的ExecutionContext的持久化版本,Spring Batch中的ExecutionContext类似于WEB应用程序中的Servlet Context或Session,它们都提供了一个存储信息的全局空间,本质上是作用域在Job或者Step中的一个键值对;这个Job或者Step的ExecutionContext被用来在特定的作用域里面传递信息,如果是Job,它就用来在Step与Step之间传递信息,如果是Step,它用来在多个记录的处理过程中传递信息。
表BATCH_JOB_EXECUTION_CONTEXT和BATCH_STEP_EXECUTION_CONTEXT是这些键值对的序列化版本,它们除了一个外键不同之外,其它几乎都相同;
字段 | 描述 |
JOB_EXECUTION_ID/STEP_EXECUTION_ID | 引用自表BATCH_JOB_EXECUTION或BATCH_STEP_EXECUTION的外键 |
SHORT_CONTEXT | Context的字符串表示 |
SERIALIZED_CONTEXT | 一个被序列化的ExecutionContext,以便在将来重试的时候使用 |