随笔分类 -  Machine Learning

摘要:使用机器学习方法解决问题时,有较多模型可供选择。 一般的思路是先根据数据的特点,快速尝试某种模型,选定某种模型后, 再进行模型参数的选择(当然时间允许的话,可以对模型和参数进行双向选择) 因为不同的模型具有不同的特点, 所以有时也会将多个模型进行组合,以发挥"三个臭皮匠顶一个诸葛亮的作用", ... 阅读全文
posted @ 2015-07-16 20:58 Poll的笔记 阅读(4459) 评论(0) 推荐(3)
摘要:本文主要详细地介绍了一种灵活高效地机器学习算法——随机森林(Random Forest)。对其理论研究和工业领域中的应用进行了简单的介绍,并且详细地介绍了它的工作机制,最后用Python进行了实现。 阅读全文
posted @ 2015-06-19 11:29 Poll的笔记 阅读(207124) 评论(35) 推荐(192)
摘要:本文汇编了一些机器学习领域的框架、库以及软件(按编程语言排序)。 阅读全文
posted @ 2015-06-18 23:17 Poll的笔记 阅读(5958) 评论(8) 推荐(6)
摘要:本文介绍了Python的机器学习库scikit-learn模块,包括如何安装scikit-learn,以及如何利用scikit-learn来进行数据挖掘和数据分析。通过几个简单的实例,展示了scikit-learn的用法。 阅读全文
posted @ 2015-06-17 13:51 Poll的笔记 阅读(20407) 评论(10) 推荐(5)
摘要:声明:以下内容根据潘的博客和crackcell's dustbin进行整理,尊重原著,向两位作者致谢!1 现有的排序模型 排序(Ranking)一直是信息检索的核心研究问题,有大量的成熟的方法,主要可以分为以下两类:相关度排序模型和重要性排序模型。1.1 相关度排序模型(Relevance Ran... 阅读全文
posted @ 2015-06-04 19:54 Poll的笔记 阅读(6263) 评论(0) 推荐(1)