随笔 - 285
文章 - 0
评论 - 864
最新评论
Re:Kmeans文本聚类系列之全部代码 newsoulguoguo 2012-05-31 20:45
你好,能问一下,把boost库等等环境配置都搞好,这个代码就能调通了吗?不需要再加其他东西了吗?
Re:Kmeans 聚类之建立文档向量模型(VSM) 唐装鼠 2012-05-22 18:17
能把3个图给发下吗,johnhypo@163.com
Re:文本分类资源和程序开源共享 finallyly 2012-05-11 10:35
@woshixu
@woshixu
推荐下载电子书 Data Minning Practical Machine Learning Tools and Techniques. weka实践的姊妹篇。
你的问题调用classify 下面的ibk 就行了。这个就是knn.
其实可以看看weka联机手册mannual里面找一下的。不过我第一次也是问的别人:)
Re:Kmeans文本聚类系列之全部代码 finallyly 2012-05-11 10:32
@逍遥子_w
@逍遥子_w
抱歉,一段时间毕业旅行去了,没有看到留言,你下一步就是用这些词建立vector space model然后用k-means算法分类了。
Re:K-means文本聚类系列(已经完成) finallyly 2012-05-11 10:30
@zhuzhu2223
您好,您没有安装boost库吧。安装方法在 http://www.cnblogs.com/finallyliuyu/archive/2010/08/23/1806811.html
Re:K-means文本聚类系列(已经完成) zhuzhu2223 2012-05-09 21:15
1>e:\apmserv-v5.2.6\apmserv-v5.2.6\apmserv5.2.6\www\文本聚类\wekapreprocess\wekapreprocess\preprocess.h(16) : fatal error C1083: 无法打开包括文件:“boost\tr1\regex.hpp”: No such file or directory
1>WekaPreprocess.cpp
1>e:\apmserv-v5.2.6\apmserv-v5.2.6\apmserv5.2.6\www\文本聚类\wekapreprocess\wekapreprocess\preprocess.h(16) : fatal error C1083: 无法打开包括文件:“boost\tr1\regex.hpp”: No such file or directory
1>正在生成代码...
1>生成日志保存在“file://e:\APMServ-v5.2.6\APMServ-v5.2.6\APMServ5.2.6\www\文本聚类\WekaPreprocess\WekaPreprocess\Debug\BuildLog.htm”
请问,这个情况要怎么解决? 谢谢
Re:文本分类资源和程序开源共享 woshixu 2012-05-08 17:50
@finallyly
你好,weka里classify里选择分类器里找不到KN算法,里面有吗?能不能教下我
Re:Kmeans文本聚类系列之全部代码 逍遥子_w 2012-04-28 15:38
博主您好,我最近刚开始接触自然语言处理,打算做个东西:从几万条微博数据中聚成几个主题,现在分词已经分完了,打算先做个简单的,把出现频率排在前一千个的实词作为特征词,接下来就没什么思路了,还望指点!谢谢 (还有,我看您这个k-means算法需要什么词袋子模型,我这个应该不用吧?)
Re:菜鸟进阶: C++实现KNN文本分类算法 finallyly 2012-04-25 11:10
@唐装鼠
o,那样可能会很慢吧。建议你一个函数一个函数调用,分阶段处理,各个函数都跑通了,再一次性调用。我写这个代码的目的一方面是自己学习文本分类聚类机制,一方面是想向别人传达这个实现机制,对于代码效率方面,确实有点捉襟见肘。
Re:菜鸟进阶: C++实现KNN文本分类算法 唐装鼠 2012-04-25 09:06
语料库全用做训练用了。。。
Re:Kmeans文本聚类系列之全部代码 finallyly 2012-04-24 18:12
@逍遥子_w
是的,但是后续版本数据库又有升级到MSSQL2005,所以最好安装MSSQL2005,数据库直接附加就没问题。
Re:Kmeans文本聚类系列之全部代码 逍遥子_w 2012-04-24 17:26
楼主您好,我想问下您的编译环境是:VS2008+MSSQL2000吗?
Re:文本分类专题(ultimate 版)绝对是目前最全的C++版开源文本分类代码和最令人耳目一新的实验解释 ll&yy 2012-04-24 11:28
@finallyly
嘿,谢谢博主~!
Re:文本分类专题(ultimate 版)绝对是目前最全的C++版开源文本分类代码和最令人耳目一新的实验解释 finallyly 2012-04-24 09:44
@ll&yy
王斌翻译的现代信息检索导论。 原书作者是christphor D manning
Re:K-means文本聚类系列(已经完成) finallyly 2012-04-24 09:43
@唐装鼠
最多10分钟,如果长时间没有反应,就进入生成词典的函数中单步调试,看看问题出在哪了。
Re:K-means文本聚类系列(已经完成) finallyly 2012-04-24 09:43
@唐装鼠
最多10分钟,如果长时间没有反应,就进入生成词典的函数中单步调试,看看问题出在哪了。
Re:文本分类专题(ultimate 版)绝对是目前最全的C++版开源文本分类代码和最令人耳目一新的实验解释 ll&yy 2012-04-23 16:32
请问LZ,本文开头部分提到的书指的是什么书呢?
Re:K-means文本聚类系列(已经完成) 唐装鼠 2012-04-23 14:47
用你的语料库生成词典要多久
Re:Kmeans聚类之特征词选择(DF法) 唐装鼠 2012-04-22 16:54
你好,用你的语料库,DFthreshold选多少合适,N选多少
Re:菜鸟进阶: C++实现KNN文本分类算法 finallyly 2012-04-20 19:24
@唐装鼠
你好,看看common.h 或者common.cpp中有没有?
或者在Preprocess.cpp的头部有没有?
