随笔 - 285  文章 - 0  评论 - 864 

最新评论

共44页: 1 2 3 4 5 6 7 8 9 下一页 末页 
Re:Kmeans文本聚类系列之全部代码 newsoulguoguo 2012-05-31 20:45  
你好,能问一下,把boost库等等环境配置都搞好,这个代码就能调通了吗?不需要再加其他东西了吗?
能把3个图给发下吗,johnhypo@163.com
Re:文本分类资源和程序开源共享 finallyly 2012-05-11 10:35  
@woshixu @woshixu 推荐下载电子书 Data Minning Practical Machine Learning Tools and Techniques. weka实践的姊妹篇。 你的问题调用classify 下面的ibk 就行了。这个就是knn. 其实可以看看weka联机手册mannual里面找一下的。不过我第一次也是问的别人:)
Re:Kmeans文本聚类系列之全部代码 finallyly 2012-05-11 10:32  
@逍遥子_w @逍遥子_w 抱歉,一段时间毕业旅行去了,没有看到留言,你下一步就是用这些词建立vector space model然后用k-means算法分类了。
Re:K-means文本聚类系列(已经完成) finallyly 2012-05-11 10:30  
@zhuzhu2223 您好,您没有安装boost库吧。安装方法在 http://www.cnblogs.com/finallyliuyu/archive/2010/08/23/1806811.html
Re:K-means文本聚类系列(已经完成) zhuzhu2223 2012-05-09 21:15  
1>e:\apmserv-v5.2.6\apmserv-v5.2.6\apmserv5.2.6\www\文本聚类\wekapreprocess\wekapreprocess\preprocess.h(16) : fatal error C1083: 无法打开包括文件:“boost\tr1\regex.hpp”: No such file or directory 1>WekaPreprocess.cpp 1>e:\apmserv-v5.2.6\apmserv-v5.2.6\apmserv5.2.6\www\文本聚类\wekapreprocess\wekapreprocess\preprocess.h(16) : fatal error C1083: 无法打开包括文件:“boost\tr1\regex.hpp”: No such file or directory 1>正在生成代码... 1>生成日志保存在“file://e:\APMServ-v5.2.6\APMServ-v5.2.6\APMServ5.2.6\www\文本聚类\WekaPreprocess\WekaPreprocess\Debug\BuildLog.htm” 请问,这个情况要怎么解决? 谢谢
Re:文本分类资源和程序开源共享 woshixu 2012-05-08 17:50  
@finallyly 你好,weka里classify里选择分类器里找不到KN算法,里面有吗?能不能教下我
Re:Kmeans文本聚类系列之全部代码 逍遥子_w 2012-04-28 15:38  
博主您好,我最近刚开始接触自然语言处理,打算做个东西:从几万条微博数据中聚成几个主题,现在分词已经分完了,打算先做个简单的,把出现频率排在前一千个的实词作为特征词,接下来就没什么思路了,还望指点!谢谢 (还有,我看您这个k-means算法需要什么词袋子模型,我这个应该不用吧?)
@唐装鼠 o,那样可能会很慢吧。建议你一个函数一个函数调用,分阶段处理,各个函数都跑通了,再一次性调用。我写这个代码的目的一方面是自己学习文本分类聚类机制,一方面是想向别人传达这个实现机制,对于代码效率方面,确实有点捉襟见肘。
语料库全用做训练用了。。。
Re:Kmeans文本聚类系列之全部代码 finallyly 2012-04-24 18:12  
@逍遥子_w 是的,但是后续版本数据库又有升级到MSSQL2005,所以最好安装MSSQL2005,数据库直接附加就没问题。
Re:Kmeans文本聚类系列之全部代码 逍遥子_w 2012-04-24 17:26  
楼主您好,我想问下您的编译环境是:VS2008+MSSQL2000吗?
@ll&yy 王斌翻译的现代信息检索导论。 原书作者是christphor D manning
Re:K-means文本聚类系列(已经完成) finallyly 2012-04-24 09:43  
@唐装鼠 最多10分钟,如果长时间没有反应,就进入生成词典的函数中单步调试,看看问题出在哪了。
Re:K-means文本聚类系列(已经完成) finallyly 2012-04-24 09:43  
@唐装鼠 最多10分钟,如果长时间没有反应,就进入生成词典的函数中单步调试,看看问题出在哪了。
请问LZ,本文开头部分提到的书指的是什么书呢?
Re:K-means文本聚类系列(已经完成) 唐装鼠 2012-04-23 14:47  
用你的语料库生成词典要多久
Re:Kmeans聚类之特征词选择(DF法) 唐装鼠 2012-04-22 16:54  
你好,用你的语料库,DFthreshold选多少合适,N选多少
@唐装鼠 你好,看看common.h 或者common.cpp中有没有? 或者在Preprocess.cpp的头部有没有?
共44页: 1 2 3 4 5 6 7 8 9 下一页 末页