2018年10月10日

【火炉炼AI】机器学习038-NLP创建词袋模型

摘要: 【火炉炼AI】机器学习038 NLP创建词袋模型 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2, NLTK 3.3) 词袋模型(Bag Of Words, BOW)和词向量(Word Emb 阅读全文

posted @ 2018-10-10 16:00 科技老丁哥 阅读(922) 评论(0) 推荐(0)

【火炉炼AI】机器学习037-NLP文本分块

摘要: 【火炉炼AI】机器学习037 NLP文本分块 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2, NLTK 3.3) 文本分块是将一大段文本分割成几段小文本,其目的是比如想获取一段文本中的一小部 阅读全文

posted @ 2018-10-10 12:56 科技老丁哥 阅读(507) 评论(0) 推荐(0)

【火炉炼AI】机器学习036-NLP词形还原

摘要: 【火炉炼AI】机器学习036 NLP词形还原 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2, NLTK 3.3) 词形还原也是将单词转换为原来的相貌,和上一篇文章中介绍的词干提取不一样,词形 阅读全文

posted @ 2018-10-10 12:55 科技老丁哥 阅读(489) 评论(0) 推荐(0)

【火炉炼AI】机器学习035-NLP词干提取

摘要: 【火炉炼AI】机器学习035 NLP词干提取 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2, NLTK 3.3) 在英语中,经常会有很多单词的变形,记得以前英语老师讲课时,讲到动词的变形,有 阅读全文

posted @ 2018-10-10 12:53 科技老丁哥 阅读(505) 评论(0) 推荐(0)

【火炉炼AI】机器学习034-NLP对文本进行分词

摘要: 【火炉炼AI】机器学习034 NLP对文本进行分词 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2, NLTK 3.3, jieba 0.39) 分词过程可以认为是自然语言处理(NLP)的第一 阅读全文

posted @ 2018-10-10 12:53 科技老丁哥 阅读(773) 评论(0) 推荐(1)

【火炉炼AI】机器学习033-构建电影推荐系统

摘要: 【火炉炼AI】机器学习033 构建电影推荐系统 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 电影推荐系统内部最关键的部件是推荐引擎,和汽车的发动机一样,推荐引擎的作用是产生数据动力,提 阅读全文

posted @ 2018-10-10 12:52 科技老丁哥 阅读(526) 评论(0) 推荐(0)

【火炉炼AI】机器学习032-用户之间相似度的计算

摘要: 【火炉炼AI】机器学习032 用户之间相似度的计算 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 在构建推荐引擎时,一般需要计算两个用户之间的相似度,以便找到与数据库中特定用户相似的用户 阅读全文

posted @ 2018-10-10 12:51 科技老丁哥 阅读(693) 评论(0) 推荐(0)

【火炉炼AI】机器学习031-KNN回归器模型的构建

摘要: 【火炉炼AI】机器学习031 KNN回归器模型的构建 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 在上一篇文章中我们学习了构建KNN分类器模型,但是KNN不仅可以用于分类问题,还可以用 阅读全文

posted @ 2018-10-10 12:50 科技老丁哥 阅读(373) 评论(0) 推荐(0)

【火炉炼AI】机器学习030-KNN分类器模型的构建

摘要: 【火炉炼AI】机器学习030 KNN分类器模型的构建 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) KNN(K nearest neighbors)是用K个最近邻的训练数据集来寻找未知对 阅读全文

posted @ 2018-10-10 12:48 科技老丁哥 阅读(505) 评论(0) 推荐(0)

【火炉炼AI】机器学习029-找到离你最近的邻居

摘要: 【火炉炼AI】机器学习029 找到离你最近的邻居 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 最近邻算法的核心思想是:想要判断你属于哪一个类别,先找离你最近的K个邻居,看看这些邻居的大 阅读全文

posted @ 2018-10-10 12:47 科技老丁哥 阅读(203) 评论(0) 推荐(0)

【火炉炼AI】机器学习028-五分钟教你打造机器学习流水线

摘要: 【火炉炼AI】机器学习028 五分钟教你打造机器学习流水线 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 现在的社会工业化大生产离不开流水线作业,有了流水线,我们可以轻松的制造出成千上万 阅读全文

posted @ 2018-10-10 12:46 科技老丁哥 阅读(399) 评论(0) 推荐(0)

【火炉炼AI】机器学习027-项目案例:用聚类算法建立客户细分模型

摘要: 【火炉炼AI】机器学习027 项目案例:用聚类算法建立客户细分模型 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 客户细分是市场营销成功的前提,我们从市场中获取的数据一般都没有标记,要想 阅读全文

posted @ 2018-10-10 12:44 科技老丁哥 阅读(577) 评论(0) 推荐(0)

【火炉炼AI】机器学习026-股票数据聚类分析-近邻传播算法

摘要: 【火炉炼AI】机器学习026 股票数据聚类分析 近邻传播算法 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2, tushare 1.2) 有一位朋友很擅长炒股,听说其资产已经达到了两百多万,我 阅读全文

posted @ 2018-10-10 12:43 科技老丁哥 阅读(1669) 评论(0) 推荐(0)

【火炉炼AI】机器学习024-无监督学习模型的性能评估--轮廓系数

摘要: 【火炉炼AI】机器学习024 无监督学习模型的性能评估 轮廓系数 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 前面我们学习过监督学习模型的性能评估,由于数据集有标记,所以我们可以将模型 阅读全文

posted @ 2018-10-10 12:41 科技老丁哥 阅读(898) 评论(0) 推荐(0)

【火炉炼AI】机器学习025-自动估算集群数量-DBSCAN算法

摘要: 【火炉炼AI】机器学习025 自动估算集群数量 DBSCAN算法 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 在前面的文章 "【火炉炼AI】机器学习024 无监督学习模型的性能评估 轮 阅读全文

posted @ 2018-10-10 12:41 科技老丁哥 阅读(472) 评论(0) 推荐(0)

【火炉炼AI】机器学习023-使用层次聚类算法构建模型

摘要: 【火炉炼AI】机器学习023 使用层次聚类算法构建模型 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 聚类的算法有很多种,前面我们讲解了k means算法和均值漂移算法,此处我们继续讲解 阅读全文

posted @ 2018-10-10 12:40 科技老丁哥 阅读(507) 评论(0) 推荐(0)

【火炉炼AI】机器学习022-使用均值漂移聚类算法构建模型

摘要: 【火炉炼AI】机器学习022 使用均值漂移聚类算法构建模型 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 无监督学习算法有很多种,前面已经讲解过了K means聚类算法,并用该算法对图片 阅读全文

posted @ 2018-10-10 12:38 科技老丁哥 阅读(1204) 评论(0) 推荐(0)

【火炉炼AI】机器学习021-使用K-means进行图片的矢量量化操作

摘要: 【火炉炼AI】机器学习021 使用K means进行图片的矢量量化操作 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 前一篇文章我们讲解了K means算法的定义方法,并用K means 阅读全文

posted @ 2018-10-10 12:36 科技老丁哥 阅读(1015) 评论(0) 推荐(0)

【火炉炼AI】机器学习020-使用K-means算法对数据进行聚类分析

摘要: 【火炉炼AI】机器学习020 使用K means算法对数据进行聚类分析 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 前面的机器学习类文章(编号从010 019)都是关于 监督学习 ,但 阅读全文

posted @ 2018-10-10 12:35 科技老丁哥 阅读(637) 评论(0) 推荐(0)

【火炉炼AI】机器学习019-项目案例:使用SVM回归器估算交通流量

摘要: 【火炉炼AI】机器学习019 项目案例:使用SVM回归器估算交通流量 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 我们都知道,SVM是一个很好地分类器,不仅适用于线性分类模型,而且还适 阅读全文

posted @ 2018-10-10 12:34 科技老丁哥 阅读(356) 评论(0) 推荐(0)

【火炉炼AI】机器学习018-项目案例:根据大楼进出人数预测是否举办活动

摘要: 【火炉炼AI】机器学习018 项目案例:根据大楼进出人数预测是否举办活动 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 我们经常看到办公大楼中人来人往,进进出出,在平时没有什么活动的时候 阅读全文

posted @ 2018-10-10 12:33 科技老丁哥 阅读(327) 评论(0) 推荐(0)

【火炉炼AI】机器学习017-使用GridSearch搜索最佳参数组合

摘要: 【火炉炼AI】机器学习017 使用GridSearch搜索最佳参数组合 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 在前面的文章( "【火炉炼AI】机器学习012 用随机森林构建汽车评 阅读全文

posted @ 2018-10-10 12:32 科技老丁哥 阅读(536) 评论(0) 推荐(0)

【火炉炼AI】机器学习016-如何知道SVM模型输出类别的置信度

摘要: 【火炉炼AI】机器学习016 如何知道SVM模型输出类别的置信度 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 一般的,对于未知样本,我们通过模型预测出来属于某种类别,往往会给出是这种类 阅读全文

posted @ 2018-10-10 12:32 科技老丁哥 阅读(1415) 评论(0) 推荐(1)

【火炉炼AI】机器学习015-如何处理样本数偏差较大的数据集

摘要: 【火炉炼AI】机器学习015 如何处理样本数偏差较大的数据集 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 我们得到的数据集在绝大多数情况下,都不是理想的数据集,都需要经过各种各样的处理 阅读全文

posted @ 2018-10-10 10:17 科技老丁哥 阅读(930) 评论(0) 推荐(0)

【火炉炼AI】机器学习014-用SVM构建非线性分类模型

摘要: 【火炉炼AI】机器学习014 用SVM构建非线性分类模型 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 支持向量机(Support Vector Machine,SVM)是一种常见的判别 阅读全文

posted @ 2018-10-10 10:15 科技老丁哥 阅读(467) 评论(0) 推荐(0)

【火炉炼AI】机器学习013-用朴素贝叶斯分类器估算个人收入阶层

摘要: 【火炉炼AI】机器学习013 用朴素贝叶斯分类器估算个人收入阶层 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 每个人都有权利追求幸福的生活,我等屌丝也不例外,但是,怎么样才能知道自己到 阅读全文

posted @ 2018-10-10 10:12 科技老丁哥 阅读(460) 评论(0) 推荐(0)

【火炉炼AI】机器学习012-用随机森林构建汽车评估模型及模型的优化提升方法

摘要: 【火炉炼AI】机器学习012 用随机森林构建汽车评估模型及模型的优化提升方法 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 在前面的文章中( "【火炉炼AI】机器学习007 用随机森林构 阅读全文

posted @ 2018-10-10 10:11 科技老丁哥 阅读(688) 评论(0) 推荐(0)

【火炉炼AI】机器学习011-分类模型的评估:准确率,精确率,召回率,F1值

摘要: 【火炉炼AI】机器学习011 分类模型的评估:准确率,精确率,召回率,F1值 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 在前面的( "【火炉炼AI】机器学习004 岭回归器的构建和模 阅读全文

posted @ 2018-10-10 10:10 科技老丁哥 阅读(1246) 评论(0) 推荐(0)

【火炉炼AI】机器学习010-用朴素贝叶斯分类器解决多分类问题

摘要: 【火炉炼AI】机器学习010 用朴素贝叶斯分类器解决多分类问题 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 前面讲到了使用逻辑回归分类器解决多分类问题( "【火炉炼AI】机器学习009 阅读全文

posted @ 2018-10-10 10:09 科技老丁哥 阅读(785) 评论(0) 推荐(0)

【火炉炼AI】机器学习009-用逻辑回归分类器解决多分类问题

摘要: 【火炉炼AI】机器学习009 用逻辑回归分类器解决多分类问题 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 前面的 "【火炉炼AI】机器学习008" 已经讲解了用简单线性分类器解决二分类 阅读全文

posted @ 2018-10-10 10:08 科技老丁哥 阅读(330) 评论(0) 推荐(0)

【火炉炼AI】机器学习008-简单线性分类器解决二分类问题

摘要: 【火炉炼AI】机器学习008 简单线性分类器解决二分类问题 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 分类问题,就是将数据点按照不同的类别区分开来,所谓人以类聚,物以群分,就是这个道 阅读全文

posted @ 2018-10-10 10:07 科技老丁哥 阅读(383) 评论(0) 推荐(0)

【火炉炼AI】机器学习007-用随机森林构建共享单车需求预测模型

摘要: 【火炉炼AI】机器学习007 用随机森林构建共享单车需求预测模型 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 共享单车是最近几年才发展起来的一种便民交通工具,基本上是我等屌丝上班,下班 阅读全文

posted @ 2018-10-10 09:55 科技老丁哥 阅读(846) 评论(0) 推荐(0)

【火炉炼AI】机器学习006-用决策树回归器构建房价评估模型

摘要: 【火炉炼AI】机器学习006 用决策树回归器构建房价评估模型 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 最近几十年,房价一直是中国老百姓心中永远的痛,有人说,中国房价就像女人的无肩带 阅读全文

posted @ 2018-10-10 09:54 科技老丁哥 阅读(342) 评论(0) 推荐(0)

【火炉炼AI】机器学习005-多项式回归器的创建和测试

摘要: 【火炉炼AI】机器学习005 多项式回归器的创建和测试 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 前面讲到了简单线性回归器和岭回归器,这两类回归器都是将数据集拟合成直线,但现实生活中 阅读全文

posted @ 2018-10-10 08:51 科技老丁哥 阅读(298) 评论(0) 推荐(0)

【火炉炼AI】机器学习004-岭回归器的构建和模型评估

摘要: 【火炉炼AI】机器学习004 岭回归器的构建和模型评估 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 在我的上一篇文章( "【火炉炼AI】机器学习003 简单线性回归器的创建,测试,模型 阅读全文

posted @ 2018-10-10 08:50 科技老丁哥 阅读(428) 评论(0) 推荐(0)

【火炉炼AI】机器学习003-简单线性回归器的创建,测试,模型保存和加载

摘要: 【火炉炼AI】机器学习003 简单线性回归器的创建,测试,模型保存和加载 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 回归分析是一种基于现有数据集,从现有数据集中寻找数据规律的一种建模 阅读全文

posted @ 2018-10-10 08:49 科技老丁哥 阅读(242) 评论(0) 推荐(0)

【火炉炼AI】机器学习002-标记编码方法

摘要: 【火炉炼AI】机器学习002 标记编码方法 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 监督学习中的标记的形式有各种各样,比如对于人脸识别的标记,可能是[“小红”,“小花”,“翠花”。 阅读全文

posted @ 2018-10-10 08:45 科技老丁哥 阅读(463) 评论(0) 推荐(0)

【火炉炼AI】机器学习001-数据预处理技术(均值移除,范围缩放,归一化,二值化,独热编码)

摘要: 【火炉炼AI】机器学习001 数据预处理技术(均值移除,范围缩放,归一化,二值化,独热编码) (【本文所使用的Python库和版本号】: Python 3.5, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 数据预处理的必要性:在真实世界中,经常需要 阅读全文

posted @ 2018-10-10 08:40 科技老丁哥 阅读(640) 评论(0) 推荐(0)

导航