摘要: 本文只粘代码,理论方法请参见《基于语义的中文文本关键词提取算法》。 文本预处理部分 1.对于原始文档,我们要求是中文(包括标点符号),并且文档的一第句(即第一个全角句号之前的内容)应该是文章的标题。 2.采ISCTCLAS分词,并标注词性。 wordseg.cpp 注意编译时要指明头文件和动态库的路 阅读全文
posted @ 2012-03-04 16:08 张朝阳讲go语言 阅读(33599) 评论(10) 推荐(1)