随笔分类 -  机器学习

摘要:1 分类和聚类Classification (分类):对于一个 classifier ,通常需要你告诉它“这个东西被分为某某类”这样一些例子,理想情况下,一个 classifier 会从它得到的训练数据中进行“学习”,从而具备对未知数据进行分类的能力,这种提供训练数据的过程通常叫做 supervised learning (监督学习)。Clustering(聚类),简单地说就是把相似的东西分到一组,聚类的时候,我们并不关心某一类是什么,我们需要实现的目标只是把相似的东西聚到一起。因此,一个聚类算法通常只需要知道如何计算相似度就可以开始工作了。因此 clustering 通常并不需要使用训练数据 阅读全文
posted @ 2013-05-11 00:41 java程序员填空 阅读(2872) 评论(1) 推荐(0)
摘要:在使用libsvm的过程中,会用到gnuplot,具体安装过程如下所示。1.下载gnuplot(版本4.6.3)2.解压文件 tar zxvf gnuplot-4.6.3.tar.gz3.配置安装路径 cd gnuplot-4.6.3 ./configure --prefix=/public/software/gnuplot4.编译 make5.安装 make install6.启用环境 source /etc/profile.d/gnuplot.sh7. 修改libsvm/tools/easy.py中,gnuplot的路径:修改:gnuplot_exe = "/usr... 阅读全文
posted @ 2013-05-06 21:01 java程序员填空 阅读(469) 评论(0) 推荐(0)
摘要:1常用参数svm-train training_set_file model_filesvm-predict test_file model_file output_file自动脚本:pythoneasy.py train_data test_data自动选择最优参数,自动进行归一化。对训练集合和测试结合,使用同一个归一化参数。-c:参数-g:参数-v:交叉验证数-s svm_type : set type of SVM (default 0)0 -- C-SVC1 -- nu-SVC2 -- one-class SVM3 -- epsilon-SVR4 -- nu-SVR-t kernel_ 阅读全文
posted @ 2013-05-06 20:56 java程序员填空 阅读(256) 评论(0) 推荐(0)