摘要: 1998 年前后,拉里·佩奇和谢尔盖·布林一起发明了著名的 PageRank 算法,才完美的解决了网页排名的问题。也正是因为这个算法,诞生了伟大的 Google 公司。 阅读全文
posted @ 2020-12-09 09:43 码农充电站 阅读(1405) 评论(0) 推荐(0) 编辑
摘要: 本篇文章要介绍的K 均值算法是一种无监督学习。与分类算法相比,无监督学习算法又叫聚类算法,就是只有特征数据,没有目标数据,让算法自动从数据中“学习知识”,将不同类别的数据聚集到相应的类别中。 阅读全文
posted @ 2020-12-04 09:57 码农充电站 阅读(2047) 评论(0) 推荐(0) 编辑
摘要: 手写数字数据集是一个用于图像处理的数据集,这些数据描绘了 [0, 9] 的数字,我们可以用KNN 算法来识别这些数字。 阅读全文
posted @ 2020-12-03 09:00 码农充电站 阅读(1823) 评论(0) 推荐(1) 编辑
摘要: KNN 算法的全称是K-Nearest Neighbor,中文为K 近邻算法,它是基于距离的一种算法,简单有效。KNN 算法即可用于分类问题,也可用于回归问题。 阅读全文
posted @ 2020-12-02 11:09 码农充电站 阅读(1644) 评论(0) 推荐(0) 编辑
摘要: 在进行数据分析的时候,经常需要将数据进行可视化,以方便我们对数据的认识和理解。Matplotlib 是一个可视化工具包,可以让我们使用Python 来可视化数据。 阅读全文
posted @ 2020-12-01 09:40 码农充电站 阅读(7675) 评论(5) 推荐(0) 编辑
摘要: 数据变换的目的是将不同渠道,不同量级的数据转化到统一的范围之内,方便后续的分析处理。数据变换的方法有很多,比如数据平滑,数据聚集,数据概化,数据规范化和属性构造等。 阅读全文
posted @ 2020-11-30 11:03 码农充电站 阅读(1635) 评论(2) 推荐(0) 编辑
摘要: 生活中,我们经常会对比两个事物的相关性,也可以叫做相似度。人类会根据自己的经验,很容易的判断两件事物是否相似,或者相似度是多少。那如何让计算机也能够进行这样的判断呢? 阅读全文
posted @ 2020-11-27 10:01 码农充电站 阅读(790) 评论(2) 推荐(2) 编辑
摘要: 上篇介绍了朴素贝叶斯的原理,本篇来介绍如何用朴素贝叶斯解决实际问题。朴素贝叶斯最擅长的领域是文本分析,包括文本分类,情感分析,垃圾邮件处理等。要对文本进行分类,首先要做的是如何提取文本的主要信息,如何衡量哪些信息是文本中的主要信息呢? 阅读全文
posted @ 2020-11-25 09:31 码农充电站 阅读(3114) 评论(0) 推荐(1) 编辑
摘要: 计算机的运算是由CPU 完成的,而CPU 只会做加法运算,不会做减法运算,那计算机怎样完成减法工作呢? 阅读全文
posted @ 2020-11-23 11:09 码农充电站 阅读(3209) 评论(0) 推荐(4) 编辑
摘要: 贝叶斯原理是英国数学家托马斯·贝叶斯于18 世纪提出的,当我们不能直接计算一件事情(A)发生的可能性大小的时候,可以间接的计算与这件事情有关的事情(X,Y,Z)发生的可能性大小,从而间接判断事情(A)发生的可能性大小。 阅读全文
posted @ 2020-11-18 14:01 码农充电站 阅读(2141) 评论(0) 推荐(2) 编辑