随笔分类 -  机器学习

1
机器学习相关
摘要:上一篇介绍了 SVM 的原理和一些基本概念,本篇来介绍如何用 SVM 处理实际问题。 阅读全文
posted @ 2021-01-22 10:48 码农充电站 阅读(642) 评论(0) 推荐(0)
摘要:SVM 算法最初是用来解决二分类问题的,而在这个基础上进行扩展,也能够处理多分类问题以及回归问题。 阅读全文
posted @ 2021-01-20 10:35 码农充电站 阅读(3156) 评论(0) 推荐(0)
摘要:随机森林算法由多个决策树分类器组成,每一个子分类器都是一棵 CART 分类回归树,所以随机森林既可以做分类,又可以做回归。 阅读全文
posted @ 2021-01-19 10:06 码农充电站 阅读(12735) 评论(0) 推荐(0)
摘要:Logistic 回归,中文音译为逻辑回归,它是一个非线性模型,是由线性回归改进而来。逻辑回归模型主要用于处理二分类问题,也可以用于处理多分类问题。 阅读全文
posted @ 2020-12-22 10:19 码农充电站 阅读(2437) 评论(0) 推荐(0)
摘要:线性回归模型用于处理回归问题,也就是预测连续型数值。线性回归模型是最基础的一种回归模型,理解起来也很容易,我们从解方程组谈起。 阅读全文
posted @ 2020-12-21 10:45 码农充电站 阅读(3888) 评论(0) 推荐(0)
摘要:在机器学习算法中,有一种算法叫做集成算法。AdaBoost 算法是集成算法的一种,由Freund 等人于1995 年提出。 阅读全文
posted @ 2020-12-17 15:30 码农充电站 阅读(1430) 评论(0) 推荐(1)
摘要:词云又叫文字云,它可以统计文本中频率较高的词,并将这些词可视化,让我们可以直观的了解文本中的重点词汇。 阅读全文
posted @ 2020-12-15 09:04 码农充电站 阅读(1721) 评论(2) 推荐(0)
摘要:EM 算法是聚类算法,中文为期望最大化算法,它是一个不断观察和调整的迭代过程,以此来构建聚类模型。 阅读全文
posted @ 2020-12-14 11:44 码农充电站 阅读(4050) 评论(1) 推荐(2)
摘要:关联分析可以被用于发掘商品与商品之间的内在关联关系,进而通过商品捆绑销售或者相互推荐,来增加商品销量。 阅读全文
posted @ 2020-12-10 13:09 码农充电站 阅读(2945) 评论(0) 推荐(0)
摘要:1998 年前后,拉里·佩奇和谢尔盖·布林一起发明了著名的 PageRank 算法,才完美的解决了网页排名的问题。也正是因为这个算法,诞生了伟大的 Google 公司。 阅读全文
posted @ 2020-12-09 09:43 码农充电站 阅读(1820) 评论(0) 推荐(1)
摘要:本篇文章要介绍的K 均值算法是一种无监督学习。与分类算法相比,无监督学习算法又叫聚类算法,就是只有特征数据,没有目标数据,让算法自动从数据中“学习知识”,将不同类别的数据聚集到相应的类别中。 阅读全文
posted @ 2020-12-04 09:57 码农充电站 阅读(2440) 评论(0) 推荐(0)
摘要:手写数字数据集是一个用于图像处理的数据集,这些数据描绘了 [0, 9] 的数字,我们可以用KNN 算法来识别这些数字。 阅读全文
posted @ 2020-12-03 09:00 码农充电站 阅读(2353) 评论(0) 推荐(1)
摘要:KNN 算法的全称是K-Nearest Neighbor,中文为K 近邻算法,它是基于距离的一种算法,简单有效。KNN 算法即可用于分类问题,也可用于回归问题。 阅读全文
posted @ 2020-12-02 11:09 码农充电站 阅读(1890) 评论(0) 推荐(0)
摘要:在进行数据分析的时候,经常需要将数据进行可视化,以方便我们对数据的认识和理解。Matplotlib 是一个可视化工具包,可以让我们使用Python 来可视化数据。 阅读全文
posted @ 2020-12-01 09:40 码农充电站 阅读(8003) 评论(5) 推荐(0)
摘要:数据变换的目的是将不同渠道,不同量级的数据转化到统一的范围之内,方便后续的分析处理。数据变换的方法有很多,比如数据平滑,数据聚集,数据概化,数据规范化和属性构造等。 阅读全文
posted @ 2020-11-30 11:03 码农充电站 阅读(2110) 评论(2) 推荐(0)
摘要:生活中,我们经常会对比两个事物的相关性,也可以叫做相似度。人类会根据自己的经验,很容易的判断两件事物是否相似,或者相似度是多少。那如何让计算机也能够进行这样的判断呢? 阅读全文
posted @ 2020-11-27 10:01 码农充电站 阅读(1045) 评论(2) 推荐(2)
摘要:上篇介绍了朴素贝叶斯的原理,本篇来介绍如何用朴素贝叶斯解决实际问题。朴素贝叶斯最擅长的领域是文本分析,包括文本分类,情感分析,垃圾邮件处理等。要对文本进行分类,首先要做的是如何提取文本的主要信息,如何衡量哪些信息是文本中的主要信息呢? 阅读全文
posted @ 2020-11-25 09:31 码农充电站 阅读(3886) 评论(0) 推荐(1)
摘要:贝叶斯原理是英国数学家托马斯·贝叶斯于18 世纪提出的,当我们不能直接计算一件事情(A)发生的可能性大小的时候,可以间接的计算与这件事情有关的事情(X,Y,Z)发生的可能性大小,从而间接判断事情(A)发生的可能性大小。 阅读全文
posted @ 2020-11-18 14:01 码农充电站 阅读(2551) 评论(0) 推荐(2)
摘要:决策树是常用的机器学习算法之一,决策树模型的决策过程非常类似人类做判断的过程,比较好理解。决策树可用于很多场景,比如金融风险评估,房屋价格评估,医疗辅助诊断等。要使用决策树算法,我们先来介绍一下 scikit-learn 。 阅读全文
posted @ 2020-11-16 11:39 码农充电站 阅读(6261) 评论(0) 推荐(0)
摘要:微信公众号:码农充电站pro 个人主页:https://codeshellme.github.io 1,什么是决策树? 决策树是一种机器学习算法,我们可以使用决策树来处理分类问题。决策树的决策(分类)过程可以用一个倒着的树形结构来形象的表达出来,因此得名决策树。 比如我们根据天气是否晴朗和是否刮风来 阅读全文
posted @ 2020-11-09 13:19 码农充电站 阅读(3172) 评论(0) 推荐(0)

1