会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
张朝阳讲go语言
Technologies come and technologies go, but insight is forever.
博客园
首页
联系
订阅
管理
2012年3月4日
文章关键词提取算法
摘要: 本文只粘代码,理论方法请参见《基于语义的中文文本关键词提取算法》。 文本预处理部分 1.对于原始文档,我们要求是中文(包括标点符号),并且文档的一第句(即第一个全角句号之前的内容)应该是文章的标题。 2.采ISCTCLAS分词,并标注词性。 wordseg.cpp 注意编译时要指明头文件和动态库的路
阅读全文
posted @ 2012-03-04 16:08 张朝阳讲go语言
阅读(33599)
评论(10)
推荐(1)
公告