Vim 字符集问题

    使用CentOS中的Vim 文本编辑器出现中文乱码的问题。

     凡是字符乱码的问题,都是字符集不匹配的问题引起的。这里的字符集不匹配只的是文件的编码和解码方式不匹配,同时可能涉及到不只一次的解码过程。

  计算机中的所有文件都是以二进制格式存储的(计算机可识别内容)。我们在读取文件内容时,均是通过不同的软件读取的,软件在读取文件内容时,需要使用不同的字符集来识别文件中的人类可识别内容。字符集就是一个数值与人类可识别基础字符的对照表。

   一个文件 有自己的编码字符集,编辑器在读取文件时有自己的字符集,在linux系统中还会涉及到终端的显示字符集。

     在Xshell终端中使用Vim打开文件时,中文出现乱码。分析原因时要考虑:1.文件的原始编码方式 2.vim打开文件的编码方式 3. xshell 终端的编码方式。

       在 Vim 中主要有三个和字符集相关的变量: encoding(enc) , fileencoding(fenc) , fileencodings(fencs).  

 

       fileencodings:打开文件的时候进行解码的猜测列表。

       fileencoding :用于设置保存文件时使用的字符集。

       encoding:用于设置编辑文件时使用的字符集。   

   例如:可以使用下面的命令

   1.  :edit ++enc=<encoding> [filename]   以指定的编码格式重新打开文件。即在这种字符集下编辑文件。

   2.  :write ++enc=<encoding> [filename]  以指定的编码格式保存文件。

        以上两种方式是可以暂时 覆盖 下边 3.4 两种方式指定的默认 编辑、写入时默认的字符集。

   3. :set encoding[=<encoding>]  指定编辑文件的字符集。(显示时)

   4. :set fileencoding[=<encoding>] 指定保存文件的字符集。(写入时)

 

     我们使用vim打开编辑文件时,文件时存在于内存中的,当编辑完成时 使用  :w 命令将内容写入磁盘,所以会有encoding 和 fileencoding 两种参数的,分别设置打开文件编辑时及保存内容到硬盘时使用的字符集。

    vim 在打开文件是 首先根据变量 fileencodings 中的 字符集类别 猜测正确的字符集,然后将fileencoding 变量设置成选中的字符集。如果fileencodings 没有设置,选择用系统的字符集 (locale 命令查看)。之后fileencoding 被设置为此编码。

    使用vim打开一个文件,可以使用 [:set fileencodings]  ,[:set fileencoding] , [:set encoding] 查看当前变量的配置信息。

 

    在Centos中配置vim的三个变量:/etc/vimrc 文件中。

 

 

 

参考的文章:

https://spin.atomicobject.com/2011/06/21/character-encoding-tricks-for-vim/ 

http://www.itnose.net/detail/6487670.html

http://stackoverflow.com/questions/16507777/vim-set-encoding-and-fileencoding-utf-8

http://stackoverflow.com/questions/1174847/how-to-set-the-character-encoding-for-a-file-in-vim

http://www.cnblogs.com/ggjucheng/archive/2012/01/04/2312522.html

http://www.cnblogs.com/jacklikedogs/p/3494566.html

http://www.joelonsoftware.com/articles/Unicode.html

http://blog.sina.com.cn/s/blog_912de1360102wm5p.html

http://www.joelonsoftware.com/articles/Unicode.html

posted @ 2016-10-05 14:53  googlg  阅读(3189)  评论(0编辑  收藏  举报