今天一个问题困扰了我一段时间,就是有关python2读取文件中含有中文的文字片段 读取过程中会乱码,分享一下文件内容,如下图所示:

分享一下读取的代码如下:

file_path = r'D:\test\mtcnn_asian1.txt'
file_name = open(file_path, 'r').readlines()
for i in file_name:
    print i

读取结果如下:

face_data\����������\���Ӿ�\0_0.jpg 

face_data\����������\���Ӿ�\102_0.jpg

�����ף����

发现全是乱码了,不管我一顿捯饬,基本上所有的的编码格式都用了,结果还是出不来中文,你可以自己试试吧,我这里直接分享我正确的解析代码,如下图:

file_path = r'D:\test\mtcnn_asian1.txt'
file_name = open(file_path, 'r').readlines()
for i in file_name:
    print i.decode("gb2312")

读取结果如下:

face_data\华人男明星\丁子峻\0_0.jpg 

face_data\华人男明星\丁子峻\102_0.jpg

祖国我祝福你

果然是一顿操作猛如虎 到最后原来这么简单的问题,果然是自己 low low 呀