代码改变世界

中文分词技术(中文分词原理)

2014-07-23 09:38 by 东方校长, 462 阅读, 0 推荐, 收藏,
摘要:一、为什么要进行中文分词?词是最小的能够独立活动的有意义的语言成分,英文单词之间是以空格作为自然分界符的,而汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。Lucene中对中文的处理是基于自动切分的单字切分,或者二元切分。除此之外,还有最大切分(... 阅读全文

Java字节码操作开源框架简介

2014-07-15 14:15 by 东方校长, 875 阅读, 0 推荐, 收藏,
摘要:avassistJavassist是一个开源的分析、编辑和创建Java字节码的类库。是由东京技术学院的数学和计算机科学系的 Shigeru Chiba 所创建的。它已加入了开放源代码JBoss 应用服务器项目,通过使用Javassist对字节码操作为JBoss实现动态AOP框架。BCELByte C... 阅读全文