摘要: 1. 在生产环境下,很多文件是GBK编码格式的,而SPARK 常用的textFile方法默认是写死了读UTF-8格式的文件,其他格式文件会显示乱码 用如下代码实现读取GBK文件的方法 import org.apache.hadoop.io.{LongWritable, Text}import org 阅读全文
posted @ 2016-12-06 23:50 郭应文 阅读(6020) 评论(0) 推荐(0)
摘要: 文本文件格式转换 GBK UTF-8 阅读全文
posted @ 2016-12-06 23:16 郭应文 阅读(4468) 评论(0) 推荐(0)