First we try, then we trust

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::
  190 随笔 :: 111 文章 :: 3513 评论 :: 358 引用

公告

SharpICTCLAS(测试版)发布了!

 

本版本尚未经过大规模分词测试,存在问题在所难免,如果有什么问题可以将出现问题的句子贴出来,我会尽快改进并发布新的版本。

 

  • ICTCLAS简介:

计算所汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),功能有:中文分词;词性标注;未登录词识别。分词正确率高达97.58%(973专家评测结果),未登录词识别召回率均高于90%,其中中国人名的识别召回率接近98%;处理速度为31.5Kbytes/s。

著作权: Copyright(c)2002-2005中科院计算所 职务著作权人:张华平

遵循协议:自然语言处理开放资源许可证1.0

Email: zhanghp@software.ict.ac.cn

Homepage: http://www.i3s.ac.cn

 

  • SharpICTCLAS:

.net平台下的ICTCLAS,是由河北联合大学管理学院吕震宇根据Free版ICTCLAS改编而成,并对原有代码做了部分重写与调整。

Email: zhenyulu@163.com

Blog: http://www.cnblogs.com/zhenyulu

 

posted on 2007-03-15 12:52 吕震宇 阅读(...) 评论(...) 编辑 收藏