姓名区位码--解析txt时遇到的蛋疼问题

场景:从网上找了一个txt文件的区位码表进行解析存入本地数据库。

问题:解析过程中Log打印解析的内容,发现输出的全部是乱码,但是在eclipse中查看的文本内容并没有异常。

解决办法:google后发现是以下原因,另存为ntf-8后,Log中就不会是乱码了。

-------------------------

紧接着又出现了一个问题:在解析txt的第一行的内容时,比如“abcdef”,str.startsWith("a")判断竟然是false。

原因:用文本编辑器将文件保存为utf-8的时候,在windows平台下,会产生bom头"EF BB BF"字节在文本的最前面(需要用十六进制工具打开才能看的到)。

解决办法:ultraedit去除bom头办法,打开文件后,另存为选项的编码格式里选择(utf-8 无bom头),确定就ok了

posted @ 2012-08-29 22:41  xiaolvtaomi  阅读(122)  评论(0)    收藏  举报