First we try, then we trust

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

SharpICTCLAS(测试版)发布了!

 

本版本尚未经过大规模分词测试,存在问题在所难免,如果有什么问题可以将出现问题的句子贴出来,我会尽快改进并发布新的版本。

 

  • ICTCLAS简介:

计算所汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),功能有:中文分词;词性标注;未登录词识别。分词正确率高达97.58%(973专家评测结果),未登录词识别召回率均高于90%,其中中国人名的识别召回率接近98%;处理速度为31.5Kbytes/s。

著作权: Copyright(c)2002-2005中科院计算所 职务著作权人:张华平

遵循协议:自然语言处理开放资源许可证1.0

Email: zhanghp@software.ict.ac.cn

Homepage: http://www.i3s.ac.cn

 

  • SharpICTCLAS:

.net平台下的ICTCLAS,是由河北联合大学管理学院吕震宇根据Free版ICTCLAS改编而成,并对原有代码做了部分重写与调整。

Email: zhenyulu@163.com

Blog: http://www.cnblogs.com/zhenyulu

 

posted on 2007-03-15 12:52  吕震宇  阅读(18738)  评论(44编辑  收藏  举报