kettle介绍-Step之CSV Input
CSV Input/CSV 文件输入介绍
CSV 文件输入步骤主要用于将 CSV 格式的文本文件按照一定的格式输入至
流中
- Step name:步骤的名称,在单一转换中,名称必须唯一
- Filename:指定输入 CSV 文件的名称,或通过单击右边的“浏览”按钮指定本地的 CSV 文件
- Delimiter:指定分隔列的符号,一般 csv 文本文件默认的是逗号。如图 所示,里面的逗号就是列分隔符
- Enclosure:指定一个数据的封装符号,一般 csv 文本文件默认的是双引号。如图上图所示,双引号就是封闭符
- NIO buffer size:指定读取缓冲区的大小,即一次从源读取的字节数。如果读取的字节数超过设置的缓冲区大小,则会报错
- Lazy conversion?:如勾选,则针对行集中的 String 类型,将按照二进制字节流的形式(如果读者有 Java 语言开发背景,可以理解为 byte[]),从数据源读取数据,性能比直接读取字符串略高。所以,这里翻译为“允许以字节流的形式读取字符串”