冷夜独酌

导航

 

问题重现:

 
在通过URL获取数据时, 在控制台中输出所获取的内容时发现中文是乱码,英文无影响。即使在函数中表明通过utf-8去进行解码也会有这个问题。
这是因为R是通过本地编码来对Unicode进行解释,而本地码通常是GBK,所以会有乱码。
 
解决方案:
 
利用 iconv 函数解决: iconv ( x , from = , to = )
eg :
raw = readLines(URL, encoding = 'utf-8')
iconv ( raw, 'utf-8', 'gbk')
 
这样再在控制台中输出raw时 中文就不会有乱码了。
posted on 2016-05-29 14:40  冷夜独酌  阅读(1665)  评论(0)    收藏  举报