之前用kindle导出的txt文件是unicode编码的,想要自己写个小程序来自行格式化,然而怎么读都是乱码。像这样:
一开始没有找到办法只好把txt文件另存为ansi格式,顺利格式化了。
但是,为什么会读取成这样呢?
最后一直查办法终于找到了这个东西:chardet
导入它以后使用
这个方法
得到了