摘要:K-Means是一种无监督学习方法,用于将无标签的数据集进行聚类。其中K指集群的数量,Means表示寻找集群中心点的手段。 一、 无监督学习 K-Means 贴标签是需要花钱的。 所以人们研究处理无标签数据集的方法。(笔者狭隘了) 面对无标签的数据集,我们期望从数据中找出一定的规律。一种最简单也最快 阅读全文
posted @ 2021-03-20 02:12 CaiYongji 阅读(5) 评论(0) 推荐(0) 编辑
摘要:与SVM一样,决策树是通用的机器学习算法。随机森林,顾名思义,将决策树分类器集成到一起就形成了更强大的机器学习算法。它们都是很基础但很强大的机器学习工具,虽然我们现在有更先进的算法工具来训练模型,但决策树与随机森林因其简单灵活依然广受喜爱,建议大家学习。 一、决策树 1.1 什么是决策树 我们可以把 阅读全文
posted @ 2021-02-25 20:59 CaiYongji 阅读(151) 评论(0) 推荐(0) 编辑
摘要:上一篇文章我们介绍了使用逻辑回归来处理分类问题,本文我们讲一个更强大的分类模型。本文依旧侧重代码实践,你会发现我们解决问题的手段越来越丰富,问题处理起来越来越简单。 支持向量机(Support Vector Machine, SVM)是最受欢迎的机器学习模型之一。它特别适合处理中小型复杂数据集的分类 阅读全文
posted @ 2021-02-15 15:42 CaiYongji 阅读(121) 评论(0) 推荐(0) 编辑
摘要:本文是机器学习系列的第三篇,算上前置机器学习系列是第八篇。本文的概念相对简单,主要侧重于代码实践。 上一篇文章说到,我们可以用线性回归做预测,但显然现实生活中不止有预测的问题还有分类的问题。我们可以从预测值的类型上简单区分:连续变量的预测为回归,离散变量的预测为分类。 一、逻辑回归:二分类 1.1 阅读全文
posted @ 2021-02-01 16:34 CaiYongji 阅读(293) 评论(0) 推荐(0) 编辑
摘要:预测从瞎猜开始 按上一篇文章所说,机器学习是应用数学方法在数据中发现规律的过程。既然数学是对现实世界的解释,那么我们回归现实世界,做一些对照的想象。 想象我们面前有一块塑料泡沫做的白板,白板上分布排列着数枚蓝色的图钉,隐约地它们似乎存在着某种规律,我们试着找出规律。 白板上的图钉(数据)如上图所示, 阅读全文
posted @ 2021-01-19 19:14 CaiYongji 阅读(209) 评论(1) 推荐(1) 编辑
摘要:引言 现在市面上的机器学习教程大多先学习数学基础,然后学机器学习的数学算法,再建立机器学习的数学模型,再学习深度学习,再学习工程化,再考虑落地。这其中每个环节都在快速发展,唯独落地特别困难。我们花费大量时间成本去学习以上内容,成本无疑是特别昂贵的。所以我们不如先“盲人摸象”、“不求甚解”地探索下机器 阅读全文
posted @ 2021-01-16 00:21 CaiYongji 阅读(519) 评论(1) 推荐(0) 编辑
摘要:如果我们不能击败它,就必须与之共存。 随便聊聊。文末有红包🧧现金💰书籍📖赠送。 新冠病毒正在彻底改变世界,人类与之斗争,没有人敢断言结果。我们做职业规划、人生规划时,要重新考虑风险。 中国崛起 IMF预计,中国是2020年全球唯一一个经济正增长的主要经济体。 中国在悠悠的历史长河中,一直不是以 阅读全文
posted @ 2020-12-31 18:24 CaiYongji 阅读(26) 评论(0) 推荐(0) 编辑
摘要:Matplotlib 是建立在NumPy基础之上的Python绘图库,是在机器学习中用于数据可视化的工具。 我们在前面的文章讲过NumPy的用法,这里我们就不展开讨论NumPy的相关知识了。 Matplotlib具有很强的工具属性,也就是说它只是为我所用的,我们不必花太多的精力去精进它。我们只需要知 阅读全文
posted @ 2020-12-25 18:18 CaiYongji 阅读(196) 评论(0) 推荐(0) 编辑
摘要:刚刚看了条新闻,像聊家常似的说两句。希望程序员的心脏能永远“跳动”,指尖的“字节”能永远流淌。 聊聊猝死。 我试着在中文语境下找一些资料来佐证我标题的观点,“运动能锻炼身体的原理”。可惜只能搜到各种健身指南、健身技巧。显然,健身市场很红火, 这些关键字都被买断了。我只能做一些不那么严谨的论证。 在我 阅读全文
posted @ 2020-12-19 01:30 CaiYongji 阅读(505) 评论(5) 推荐(8) 编辑
摘要:本文收集整理了机器学习相关速查表(Machine Learning Cheatsheet),包含机器学习、Python、Numpy、Pandas、Matplotlib、线性代数、微积分、统计学、概率论等相关速查表。我已经建立了开源项目MachineLearningCheatsheets,我将持续更新 阅读全文
posted @ 2020-12-18 20:05 CaiYongji 阅读(140) 评论(0) 推荐(1) 编辑