L,wang

坚持改革,开放人性的弱点……
linux 文件编码

“新装的linux如果预装的是英文系统的话,时常会碰到乱码问题。即使装全了中文字体也不能完全幸免,纠其原因是为:有简体,繁体中文与通用utf-8各种编码方式产生的文件共存于一个系统之中,而应用程往往以其默认的编码方式打开查看,如vi等。上网搜集资料加以总结了一下:“

 

在Linux中查看文件编码可以通过以下几种方式:
1.在Vim中可以直接查看文件编码
:set fileencoding
即可显示文件编码格式。
如果你只是想查看其它编码格式的文件或者想解决用Vim查看文件乱码的问题,那么你可以在
~/.vimrc 文件中添加以下内容:

set encoding=utf-8 fileencodings=BIG5,utf-8,GB2312

#(若新装的系统无.vimrc文件,则添加一个,不要乱编辑.viminfo)

这样,就可以让vim自动识别文件编码(可以自动识别UTF-8或者GBK编码的文件),其实就是依照fileencodings提供的编码列表尝试,如果没有找到合适的编码,就用latin-1(ASCII)编码打开。
2. enca (如果你的系统中没有安装这个命令,可以用sudo yum install -y enca 安装 )查看文件编码
$ enca filename
filename: Universal transformation format 8 bits; UTF-8
CRLF line terminators
需要说明一点的是,enca对某些GBK编码的文件识别的不是很好,识别时会出现:
Unrecognized encoding

文件编码转换
1.在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式
:set fileencoding=utf-8

2. enconv 转换文件编码,比如要将一个GBK编码的文件转换成UTF-8编码,操作如下
enconv -L zh_CN -x UTF-8 filename

3. iconv 转换,iconv的命令格式如下:
iconv -f encoding -t encoding inputfile
比如将一个UTF-8 编码的文件转换成GBK编码
iconv -f GBK -t UTF-8 file1 -o file2

示例:
假如:你的tmp下面有个aa.sql文件,则
#cd /tmp
#vi aa.sql
:set fileencoding

如果要把aa.sql转换成UTF-8编码的bb.sql文件,这里假设aa.sql的编码为GB2312,则
#cd /tmp
#iconv -f GB2312 -t UTF-8 aa.sql -o bb.sql

 

 

posted on 2012-05-03 14:37  L,wang  阅读(309)  评论(0编辑  收藏  举报