• 博客园logo
  • 会员
  • 周边
  • 新闻
  • 博问
  • 闪存
  • 众包
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
暗时间&量变
博客园 | 首页 | 新随笔 | 新文章 | 联系 | 订阅 订阅 | 管理

随笔分类 -  机器学习

 
Reservoir sampling
摘要:在看蚂蚁***的时候看到这道题,真心觉得有趣,所以啊,一定要投入其中,知识的美妙啊~ 小明在天猫上开了一个网店,某天要开展一个抽奖活动,奖品数量100个。为了保证活动的公平,小明希望保证每个顾客中奖概率都一样,但他无法提前预估活动当天参加抽奖的顾客数。请你给他设计一个算法,要求: 1) 在抽奖过程中 阅读全文
posted @ 2018-04-24 14:26 WuLei吴磊 阅读(146) 评论(0) 推荐(0)
聚类
摘要:聚类: http://blog.pluskid.org/?p=39 https://blog.csdn.net/xmu_jupiter/article/details/50889023 http://blog.sina.com.cn/s/blog_1584387c90102x0c9.html 阅读全文
posted @ 2018-04-12 10:28 WuLei吴磊 阅读(139) 评论(0) 推荐(0)
朴素贝叶斯
摘要:最简单的解决方案通常是最强大的解决方案,而朴素贝叶斯就是一个很好的证明。尽管机器学习在过去几年取得了巨大的进步,但朴素贝叶斯已被证明不仅简单,而且快速、准确、可靠。它已经成功地用于许多项目中,而且它对自然语言处理(NLP)的问题的解决提供了很大的帮助。 朴素贝叶斯是利用概率论和贝叶斯定理预测样本类别 阅读全文
posted @ 2018-04-11 21:40 WuLei吴磊 阅读(309) 评论(0) 推荐(0)
One VS Rest
摘要:简单来说就是分类的类别有多个,不再是二分,比如根据某些特征,什么温度、湿度、空气流动情况来预测天气,天气的label不能说是好天气和坏天气两种,而是分晴天、雨天、阴天,雪天等等,对于决策树或者从计算机的本质上来说,二分,0或者1是本质,计算机对于二分才是擅长的,那么接下来就有两种分类方法,一种是按照 阅读全文
posted @ 2018-04-11 21:20 WuLei吴磊 阅读(885) 评论(0) 推荐(0)
多层感知器
摘要:写在最前面 本系列文章试图以直观的思维讲解神经网络的两个种类——多层感知器(Muti-Layer Percetron)和卷积网络(Convolutional Neural Network)。这两种网络都属于前馈型网络(Feedforward network),其中多层感知器(MLP)是最简单也是最常 阅读全文
posted @ 2018-04-11 20:39 WuLei吴磊 阅读(706) 评论(0) 推荐(0)
随机森林
摘要:在机器学习中,随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定。 随机森林构建 编辑 决策树相当于一个大师,通过自己在数据集中学到的知识对于新的数据进行分类。但是俗话说得好,一个诸葛亮,玩不过三个臭皮匠。随机森林就是希望构建多个臭皮匠,希望最终的分类效果能够超过 阅读全文
posted @ 2018-04-10 20:36 WuLei吴磊 阅读(389) 评论(0) 推荐(0)
决策树
摘要:以下关于决策树的内容来自网络,都是非常通俗易懂的。 一.GBDT简介 GBDT(Gradient Boosting Decision Tree) 是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终结果。它在被提出之初就和SVM一起被认为是泛化能力(generalization 阅读全文
posted @ 2018-04-03 15:04 WuLei吴磊 阅读(1198) 评论(0) 推荐(0)
机器学习算法入门
摘要:机器学习算法简单入门。 由于团队(大数据团队)技术发展需要,借对交通业务数据进行需求拓展,实现数据挖掘和数据分析技术的掌握,绕不开机器学习算法,可以说,大数据的核心价值在于算法。 如下图,当前机器学习按照任务类型可以分为有监督学习和无监督学习,这两者的区别在于你是否告诉程序一个标签,或者叫答案,一个 阅读全文
posted @ 2018-03-07 20:54 WuLei吴磊 阅读(241) 评论(0) 推荐(0)
 

公告


博客园  ©  2004-2026
浙公网安备 33010602011771号 浙ICP备2021040463号-3