2009年10月19日
摘要: 中英文分词组件。完全C#托管代码编写,独立开发。技术特点=========1. 识别率接近90%。虽然和专业分词系统相比有一定的差距,但对于搜索引擎等小型分词需求而言足够了。2. 多元歧义自动识别。对于前后歧义有较好的识别效果。如:长春市长春节致词 -- 长春/市长/春节/致词/长春市长春药店 -- 长春市/长春/药店3. 常用及敏感词过滤功能。通过一个简单的属性设置就可以完成针对常用词、标点和敏... 阅读全文
posted @ 2009-10-19 08:59 一叶工作室 阅读(611) 评论(0) 推荐(0) 编辑
摘要: 1。http://www.chinesecomputing.com/nlp/segment.html此链接介绍了很多分词资源。注意看其第二项(A Simplified Chinese Segmenter written in Perl )。里面有Perl和Java版的简体中文分词程序,完全free。我试了一下,效果不错。网上很多人向Lucene中添加中文分词时用的都是中科院ICTCLAS的接口。而... 阅读全文
posted @ 2009-10-19 08:56 一叶工作室 阅读(664) 评论(0) 推荐(0) 编辑
摘要: Request.ServerVariables("Url")返回服务器地址Request.ServerVariables("Path_Info")客户端提供的路径信息Request.ServerVariables("Appl_Physical_Path")与应用程序元数据库路径相应的物理路径Request.ServerVariables("Path_Translated")通过由虚拟至物理的映射后... 阅读全文
posted @ 2009-10-19 08:36 一叶工作室 阅读(444) 评论(0) 推荐(0) 编辑