2015年11月30日

如何提高分布式机器学习系统的执行效率?

摘要: 翻译自http://weibo.com/p/1001603913581535062112,作者是CMU邢波教授的高徒。目前有很多开源的分布式机器学习和深度学习系统,例如DMLC,Spark,MLlib,Petuum,parameter server,Caffe,Torch,Theano和Tensor... 阅读全文

posted @ 2015-11-30 17:42 zqliu 阅读(1516) 评论(0) 推荐(0) 编辑

2015年11月15日

数据挖掘领域最有影响力的18个算法(转载)

摘要: Classification==================================#1. C4.5Quinlan, J. R. 1993. C4.5: Programs for Machine Learning.Morgan Kaufmann Publishers Inc.Google... 阅读全文

posted @ 2015-11-15 14:44 zqliu 阅读(275) 评论(0) 推荐(0) 编辑

2015年11月10日

值得推荐的C/C++框架和库(转)

摘要: 转自http://coolshell.info/blog/2014/12/c-open-project.html值得学习的C语言开源项目1.WebbenchWebbench是一个在linux下使用的非常简单的网站压测工具。它使用fork()模拟多个客户端同时访问我们设定的URL,测试网站在压力下工作... 阅读全文

posted @ 2015-11-10 13:14 zqliu 阅读(179) 评论(0) 推荐(0) 编辑

如何评价Petuum分布式机器学习系统?

摘要: 机器学习算法和计算机领域的其他算法相比,有自己的一些独特特点,(1)迭代性:模型的更新并非一次完成,需要循环迭代多次;(2)容错性:即使在每个循环中产生一些错误,模型最终的收敛不受影响;(3)参数收敛的非均匀性:模型中有些参数经过几个循环便不再改变,其他参数需要很长时间收敛。这些特点决定了分布式机器... 阅读全文

posted @ 2015-11-10 12:37 zqliu 阅读(980) 评论(0) 推荐(0) 编辑

2015年10月29日

如何选择分类器?

摘要: 如何为实际的分类应用选择合适的分类器?如果你很关心分类的精度,那么最好的选择是逐个尝试不同的分类器并采用不同的参数,从中选择最好的一个。如果你只是想大致了解一下分类结果,那么本文接下来给出几个挑选原则。(1)你的数据集有多大?如果数据集较小,high bias/low variance类型的分类器(... 阅读全文

posted @ 2015-10-29 15:51 zqliu 阅读(1058) 评论(0) 推荐(0) 编辑

2015年10月28日

主题模型

摘要: 主题模型(topic modeling)是一种常见的机器学习应用,主要用于对文本进行分类。传统的文本分类器,例如贝叶斯、KNN和SVM分类器,只能将测试对象分到某一个类别中,假设我给出三个分类:“算法”、“网络”和“编译”让其判断,这些分类器往往将对象归到某一类中。但是如果一个外行完全给不出备选类别... 阅读全文

posted @ 2015-10-28 19:46 zqliu 阅读(5643) 评论(0) 推荐(0) 编辑

导航