linux 字符集与编码格式相关
字符集:多个字符的集合。 # 书写系统字母与符号的集合。
字符编码:把 字符集 中的字符 编码为(映射)指定集合中的某一对象。 # 以便文本在计算机中存储和通过通信网络的传递
查看文件的的编码格式file,其实现机制如下:
检验文件系统(Filesystem)中支持的文件类型。
检验magic file规则。
检验文件内容的语言和字符集。
详细的file命令介绍,参考:file命令与magic file
修改文件的编码格式
iconv -f from-encoding -t to-encoding inputfile
- 可以看到文件编码格式随编辑内容而改变
% touch 1
% file 1
1: empty
%
% echo "123" > 1
% file 1
1: ASCII text
% echo "汉字" >> 1
% file 1
1: UTF-8 Unicode text
Linux中字符集的设置
参考:LANG、LC_ALL、LANGUAGE环境变量的区别
VIM的编码方式
VIM 读取需要编辑的文件,根据 fileencodings 中列出的字符编码方式逐一探测该文件编码方式。并设置 fileencoding 为探测到看起来是正确的 字符编码方式,如果没有找到合适的编码,就用latin-1(ASCII)编码打开。

浙公网安备 33010602011771号