摘要:
目的:从数据库中抽取文章关键词,并统计这些关键词在哪些文章中出现,出现多少次。(算是词袋子模型吧),然后对每篇文章形成形成VSM模型,写成weka的数据格式,然后调用weka对文章聚类。目前“形成此代码模型一块已经完毕”其中词袋子的数据结构如下:map<string,vector<pair<int,int>>>&mymap),目前... 阅读全文
posted @ 2010-08-25 16:47
finallyly
阅读(1246)
评论(7)
推荐(0)
浙公网安备 33010602011771号