随笔分类 -  机器学习

摘要:转自http://www.cnblogs.com/jerrylead/archive/2011/04/18/2020209.html http://www.cnblogs.com/jerrylead/archive/2011/04/18/2020216.html 几个特别有用 的链接: 更加深入理解 阅读全文
posted @ 2019-10-31 18:58 笔记记忆 阅读(3357) 评论(0) 推荐(0)
摘要:学习的过程中,关于特征选择和降维都是防止数据过拟合的有效手段,但是两者又有本质上的区别。 降维 降维本质上是从一个维度空间映射到另一个维度空间,特征的多少别没有减少,当然在映射的过程中特征值也会相应的变化。 举个例子,现在的特征是1000维,我们想要把它降到500维。降维的过程就是找个一个从1000 阅读全文
posted @ 2019-10-31 18:54 笔记记忆 阅读(3053) 评论(0) 推荐(0)
摘要:转自http://blog.csdn.net/dongtingzhizi/article/details/15962797 当我第一遍看完台大的机器学习的视频的时候,我以为我理解了逻辑回归,可后来越看越迷糊,直到看到了这篇文章,豁然开朗 基本原理 Logistic Regression和Linear 阅读全文
posted @ 2019-10-31 18:53 笔记记忆 阅读(2001) 评论(0) 推荐(0)
摘要:转自 http://blog.csdn.net/hguisu/article/details/7996185 1. PageRank算法概述 PageRank,即网页排名,又称网页级别、Google左侧排名或佩奇排名。 是Google创始人拉里·佩奇和谢尔盖·布林于1997年构建早期的搜索系统原型时 阅读全文
posted @ 2019-10-31 18:52 笔记记忆 阅读(2351) 评论(0) 推荐(1)
摘要:转自 http://blog.csdn.net/Androidlushangderen/article/details/43311943 参考资料:http://blog.csdn.net/hguisu/article/details/7996185更多数据挖掘算法:https://github.c 阅读全文
posted @ 2019-10-31 18:50 笔记记忆 阅读(871) 评论(0) 推荐(0)
摘要:对于一般的回归问题,给定训练样本D={(x1,y1),(x2,y2),...,(xn,yn)},yi€R,我们希望学习到一个f(x)使得,其与y尽可能的接近,w,b是待确定的参数。在这个模型中,只有当发f(x)与y完全相同时,损失才为零,而支持向量回归假设我们能容忍的f(x)与之间最多有ε的偏差,当 阅读全文
posted @ 2019-10-31 18:44 笔记记忆 阅读(1037) 评论(0) 推荐(0)
摘要:常见的机器学习模型:感知机,线性回归,逻辑回归,支持向量机,决策树,随机森林,GBDT,XGBoost,贝叶斯,KNN,K-means等; 常见的机器学习理论:过拟合问题,交叉验证问题,模型选择问题,模型融合问题等; K近邻:算法采用测量不同特征值之间的距离的方法进行分类。 优点: 1.简单好用,容 阅读全文
posted @ 2019-10-31 18:43 笔记记忆 阅读(1618) 评论(0) 推荐(0)
摘要:过拟合产生的原因: ①假设过于复杂②噪音数据③数据规模太小 解决过拟合的方案:数据清洗(将错误的lable纠正或者删除错误的数据),伪造更多的数据,正则化,验正 正则化--范数:转自http://blog.csdn.net/zouxy09/article/details/24971995 监督机器学 阅读全文
posted @ 2019-10-31 18:41 笔记记忆 阅读(447) 评论(0) 推荐(0)
摘要:他通过改变训练样本的权重,学习多个分类器,并将这些分类器进行线性组合,提高分类的性能。 adaboost提高那些被前一轮弱分类器错误分类样本的权重,而降低那些被正确分类样本的权重,这样使得,那些没有得到正确分类的数据,由于其权重的加大而受到后一轮的弱分类器的更大的关注。在组合阶段,加大分类误差率小的 阅读全文
posted @ 2019-10-31 18:39 笔记记忆 阅读(179) 评论(0) 推荐(0)
摘要:国内外网站如果你想搜索比较新颖的机器学习资料或是文章,可以到以下网站中搜索,里面不仅包括了机器学习的内容,还有许多其它相关领域内容,如数据科学和云计算等。InfoWord:http://www.infoworld.com/reviews/Kdnuggets:http://www.kdnuggets. 阅读全文
posted @ 2019-10-31 18:37 笔记记忆 阅读(216) 评论(0) 推荐(0)
摘要:转自 http://blog.csdn.net/linkin1005/article/details/39054023 同朴素贝叶斯一样,高斯判别分析(Gaussian discriminant analysismodel, GDA)也是一种生成学习算法,在该模型中,我们假设y给定的情况下,x服从混 阅读全文
posted @ 2019-10-31 18:35 笔记记忆 阅读(1140) 评论(0) 推荐(0)
摘要:马尔科夫过程 马尔科夫过程可以看做是一个自动机,以一定的概率在各个状态之间跳转。 考虑一个系统,在每个时刻都可能处于N个状态中的一个,N个状态集合是 {S1,S2,S3,...SN}。我们现在用q1,q2,q3,…qn来表示系统在t=1,2,3,…n时刻下的状态。在t=1时,系统所在的状态q取决于一 阅读全文
posted @ 2019-10-31 18:34 笔记记忆 阅读(875) 评论(0) 推荐(0)
摘要:<转>机器学习系列(9)_机器学习算法一览(附Python和R代码) 转自http://blog.csdn.net/han_xiaoyang/article/details/51191386 – 谷歌的无人车和机器人得到了很多关注,但我们真正的未来却在于能够使电脑变得更聪明,更人性化的技术,机器学习 阅读全文
posted @ 2019-10-31 18:32 笔记记忆 阅读(1988) 评论(0) 推荐(0)
摘要:出处: http://blog.csdn.net/longxinchen_ml/article/details/50493845, http://blog.csdn.net/han_xiaoyang/article/details/50503115 1. 剧情一:挑螃蟹的秘密 李雷与韩梅梅的关系发展 阅读全文
posted @ 2019-10-31 18:30 笔记记忆 阅读(360) 评论(0) 推荐(0)
摘要:转自http://blog.csdn.net/han_xiaoyang/article/details/50481967 1. 引言 再过一个月就是春节,相信有很多码农就要准备欢天喜地地回家过(xiang)年(qin)了。我们今天也打算讲一个相亲的故事。 讲机器学习为什么要讲相亲?被讨论群里的小伙伴 阅读全文
posted @ 2019-10-31 18:29 笔记记忆 阅读(176) 评论(0) 推荐(0)
摘要:转自 http://blog.csdn.net/u014568921/article/details/49383379 另外一个很容易理解的文章 :http://www.jianshu.com/p/005a4e6ac775 更多参考如下 机器学习(四)— 从gbdt到xgboost 机器学习常见算法 阅读全文
posted @ 2019-10-31 18:24 笔记记忆 阅读(841) 评论(0) 推荐(0)
摘要:最近在学习论文的时候发现了在science上发表的关于新型的基于密度的聚类算法 Kmean算法有很多不足的地方,比如k值的确定,初始结点选择,而且还不能检测费球面类别的数据分布,对于第二个问题,提出了Kmean++,而其他不足还没有解决,dbscan虽然可以对任意形状分布的进行聚类,但是必须指定一个 阅读全文
posted @ 2019-10-31 18:22 笔记记忆 阅读(440) 评论(0) 推荐(0)
摘要:前言: PCA的实现一般有两种,一种是用特征值分解去实现的,一种是用奇异值分解去实现的。在上篇文章中便是基于特征值分解的一种解释。特征值和奇异值在大部分人的印象中,往往是停留在纯粹的数学计算中。而且线性代数或者矩阵论里面,也很少讲任何跟特征值与奇异值有关的应用背景。奇异值分解是一个有着很明显的物理意 阅读全文
posted @ 2019-10-31 18:16 笔记记忆 阅读(313) 评论(0) 推荐(0)
摘要:xgboost原理 参考: http://blog.csdn.net/a819825294/article/details/51206410 http://blog.csdn.net/sb19931201/article/details/52557382 http://www.cnblogs.com 阅读全文
posted @ 2019-10-31 18:16 笔记记忆 阅读(114) 评论(0) 推荐(0)
摘要:转自http://blog.csdn.net/mytestmy/article/details/19088827 声明:1)该博文是整理自网上很大牛和专家所无私奉献的资料的。具体引用的资料请看参考文献。具体的版本声明也参考原文献2)本文仅供学术交流,非商用。所以每一部分具体的参考资料并没有详细对应, 阅读全文
posted @ 2019-10-31 18:13 笔记记忆 阅读(320) 评论(0) 推荐(0)