linux 字符集与编码格式相关

字符集:​多个字符的集合。 # 书写系统字母与符号的集合。
字符编码:​把 字符集 中的字符 编码为(映射)指定集合中的某一对象。 # 以便文本在计算机中存储和通过通信网络的传递

查看文件的的编码格式file,其实现机制如下:

检验文件系统(Filesystem)中支持的文件类型。
检验magic file规则。
检验文件内容的语言和字符集。

详细的file命令介绍,参考:file命令与magic file

修改文件的编码格式

iconv -f from-encoding -t to-encoding inputfile

  • 可以看到文件编码格式随编辑内容而改变
% touch 1        
% file 1
1: empty
% 
% echo "123" > 1 
% file 1         
1: ASCII text
% echo "汉字" >> 1
% file 1          
1: UTF-8 Unicode text

Linux中字符集的设置

参考:LANG、LC_ALL、LANGUAGE环境变量的区别

VIM的编码方式

参考:linux下vim中文乱码的解决方法

VIM 读取需要编辑的文件,根据 fileencodings 中列出的字符编码方式逐一探测该文件编码方式。并设置 fileencoding 为探测到看起来是正确的 字符编码方式,如果没有找到合适的编码,就用latin-1(ASCII)编码打开。

posted @ 2022-12-14 10:22  武平宁  阅读(54)  评论(0)    收藏  举报