linux 文件编码

公告

“新装的linux如果预装的是英文系统的话，时常会碰到乱码问题。即使装全了中文字体也不能完全幸免，纠其原因是为：有简体，繁体中文与通用utf－8各种编码方式产生的文件共存于一个系统之中，而应用程往往以其默认的编码方式打开查看，如vi等。上网搜集资料加以总结了一下：“

在Linux中查看文件编码可以通过以下几种方式：
1.在Vim中可以直接查看文件编码
:set fileencoding
即可显示文件编码格式。
如果你只是想查看其它编码格式的文件或者想解决用Vim查看文件乱码的问题，那么你可以在
~/.vimrc 文件中添加以下内容：

set encoding=utf-8 fileencodings=BIG5,utf-8,GB2312

#(若新装的系统无.vimrc文件，则添加一个，不要乱编辑.viminfo)

这样，就可以让vim自动识别文件编码（可以自动识别UTF-8或者GBK编码的文件），其实就是依照fileencodings提供的编码列表尝试，如果没有找到合适的编码，就用latin-1(ASCII)编码打开。
2. enca (如果你的系统中没有安装这个命令，可以用sudo yum install -y enca 安装 )查看文件编码
$ enca filename
filename: Universal transformation format 8 bits; UTF-8
CRLF line terminators
需要说明一点的是，enca对某些GBK编码的文件识别的不是很好，识别时会出现：
Unrecognized encoding

文件编码转换
1.在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式
:set fileencoding=utf-8

2. enconv 转换文件编码，比如要将一个GBK编码的文件转换成UTF-8编码，操作如下
enconv -L zh_CN -x UTF-8 filename

3. iconv 转换，iconv的命令格式如下：
iconv -f encoding -t encoding inputfile
比如将一个UTF-8 编码的文件转换成GBK编码
iconv -f GBK -t UTF-8 file1 -o file2

示例：
假如：你的tmp下面有个aa.sql文件，则
#cd /tmp
#vi aa.sql
:set fileencoding

如果要把aa.sql转换成UTF-8编码的bb.sql文件,这里假设aa.sql的编码为GB2312，则
#cd /tmp
#iconv -f GB2312 -t UTF-8 aa.sql -o bb.sql

posted on 2012-05-03 14:37 L,wang 阅读(315) 评论(0) 收藏举报

刷新页面返回顶部