摘要: 在spark中常使用textFile读取文件,默认的是UTF-8编码,但在实际读取文件时,存在不同的文件编码,如果不是UTF-8编码的文件,便不能直接使用这个方法读文件。 以下是2种读取不同编码文件的方法,下面以ANSI的中文简体编码为例,codepage是1252. 方法1:使用decode方法 阅读全文
posted @ 2020-06-29 16:38 黎明踏浪号 阅读(3182) 评论(0) 推荐(0)