查看文件编码的Linux命令

使用 windows 子系统查看 windows 上面的GB2312编码格式的文本文件,想使用 Linux 的指令 iconv ,将其转换为 utf-8 文件,首先应该是查看此文件的编码
使用 file 指令

file [filename]

输出

[filename]: Non-ISO extended-ASCII text, with very long lines, with CRLF line terminators

可见并未给出明确的编码信息。
如此,不清楚文件编码无法使用 iconv 命令转换
所以使用另一个命令 enca , 正在使用的 ubuntu 18.08 没有自带 enca 命令,需要在线安装

sudo apt-get install enca

命令

enca [filename]

输出

Simplified Chinese National Standard; GB2312
  CRLF line terminators

得知文件编码为GB2312,所以使用 iconv 命令

iconv -c -f GB2312 -t UTF-8 [filename] -o [filename.back]

完成文件的编码格式转换

posted @ 2021-12-25 20:36  欲渡黄河  阅读(1387)  评论(0)    收藏  举报