DearSoul

博客园 首页 新随笔 联系 订阅 管理

2009年7月26日 #

摘要: 近期要对数据库内的文章表,进行分类汇总,同时要对新增加的文章自动分类,想做以下的方案: 1、提取关键词的分类。通过中文分词对文章的标题和内容进行关键词的提取,选出每篇文章所出现前10个关键词,然后对这些关键词进行汇总到一个分类表内,其中关键词属于哪个分类,这个工作由手工分类(暂时想不出好的办法)。 2、对原来的文章进行分类。循环读取数据库内的文章,然后对文章的标题和内容利用中文分词技术提取10个关... 阅读全文
posted @ 2009-07-26 23:48 DearSoul 阅读(792) 评论(0) 推荐(0)