txt文件导入hive表出现乱码

今天完成老师的一个大数据实验,在做到txt文件导入hive表是出现乱码

后来发现是在爬取手机评论数据时数据时有些人的评论有换行符所以出现了这个错误。

在python里用replace函数可以在爬取时把换行符替换掉

再次导入时又出现了乱码

这次是文件编码的问题

把文件编码改成utf8就行了

最后总算是弄好了。

posted @ 2022-03-15 18:35  Ryuuko-  阅读(312)  评论(0)    收藏  举报