Ads by Lake Quincy Media

eaglet

本博专注于基于微软技术的搜索相关技术
posts - 177, comments - 3003, trackbacks - 26, articles - 0
  博客园 :: 首页 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理

V 2.3.3.0 版本改进了批量导入功能

可以批量导入单词,词性和词频了。
输入文件的格式为:
单词|0x00000010|119
子弹|0x00000008|28
文本|0x00000100|2052
其中第一个参数为单词,第二个参数为词性,第三个参数为词频

需要下载代码编译,代码位置:

http://pangusegment.codeplex.com/SourceControl/list/changesets

标签: 中文分词

Feedback

#1楼  回复 引用 查看   

2011-06-30 21:32 by xiaopohou      
弱弱的问一句!

这个东西怎么用?

#2楼[楼主]  回复 引用 查看   

2011-07-01 09:06 by eaglet      
@xiaopohou
在字典管理的界面上有个批量导入按钮,你可以看盘古主页的文档

#3楼  回复 引用 查看   

2011-07-01 09:53 by zsea      
在分词组件上有没有添加分词的功能???

#4楼[楼主]  回复 引用 查看   

2011-07-01 12:42 by eaglet      
@zsea
添加什么分词?

#5楼  回复 引用 查看   

2011-07-01 13:12 by zsea      
字打错了。。。
是添加分词管理功能,自己开发的时候能够动态添加词库。

#6楼  回复 引用 查看   

2011-07-01 15:37 by semoon      
@zsea
能动态获取单词么。。。其实还是手动添加,不过能跟你的系统集成罢了

#7楼  回复 引用 查看   

2011-07-01 16:12 by zsea      
对对对,就是这个意思。。

#8楼[楼主]  回复 引用 查看   

2011-07-01 20:17 by eaglet      
可以动态添加,如果盘古在运行的话,会定时判断是否添加了,如果添加了就动态更新。不过词库变化后一般要重新索引,所以不太建议动态添加。

#9楼  回复 引用 查看   

2011-08-01 15:13 by .NET miracle      
您好,请问如何通过盘古分词获得人名呢?(人名不一定在词库中存在)。

盘古分词中识别出人名(非词库中)后,可不可以给人名加上“人名”的属性?
POS_A_NR = 0x00000080, // 人名

谢谢,希望不吝赐教..

#10楼  回复 引用 查看   

2011-10-24 10:15 by elevenfire      
eaglet,问个问题,我在词典里明明加了新词“牛奶粉”,但是那个Demo.exe程序里,结果还是“牛奶(0,5)/粉(2,1)/”

#11楼  回复 引用 查看   

2011-10-24 10:19 by elevenfire      
原来字典的手动保存,这个没注意看。

#12楼  回复 引用 查看   

2011-12-26 17:44 by shenopkss      
亲爱的eaglet,感谢您,和您的盘古分词,无私的精神,和强大的技艺。我在使用盘古分词时,使用DictManage.exe添加关键词,该程序报bug无法使用,详情请看附件,


再次感谢!
Email:421713337@qq.com

#13楼  回复 引用 查看   

2012-01-10 11:25 by 飞龙侠客      
eaglet,怎么批量导入同义词库呀?

#14楼[楼主]  回复 引用 查看   

2012-01-19 13:56 by eaglet      
@shenopkss
你执行什么操作时出这个故障?感觉你好像没有加载字典。代码是开源的,你可以跟踪一下代码,看看到底是在哪里出错。然后告诉我。

#15楼[楼主]  回复 引用 查看   

2012-01-19 13:57 by eaglet      
@飞龙侠客
同义词库是个文本文件,你用程序批量生成应该就可以了。