05 2014 档案
摘要:/*** 中英文全角字符转为半角字符* @param src 输入全角* @return 输出半角*/public static String toSemiangle(String src) { char[] c = src.toCharArray(); for (int index =...
阅读全文
摘要:程序员要有哪些职业素养?关于这个话题,已经有很多资料了。本文作者根据自己的经验和观察,谈谈“程序员的职业素养”的一个方面,就是“克制”——克制写代码的冲动。许多年前我刚开始学编程时,朋友曾说过一个笑话:差劲的程序员有两种,一种是开始就写main函数的;还有一种是上来就上网找各种类库源代码的。当时我并...
阅读全文
摘要:IKAnalyzerIKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0...
阅读全文
摘要:文章来源于:http://blog.sina.com.cn/s/blog_c206a2c30101dmb0.html 中文分词 (Chinese Word Segmentation) 指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。我们知道,...
阅读全文
摘要:原来windows里记事本的ansi编码就是GB2312啊,跟utf-8,unicode是不一样的。程序里的比如java的,Qt的string都是unicode的字符串,因此如果是你从文件中读取文字的话,一定要注意编码的问题!windows上用的一般就是GB2312,而linux大部分可能就是utf...
阅读全文

浙公网安备 33010602011771号