文章分类 -  ML in Action

Machine Learning in Action
摘要:AdaBoost 通过结合相似的分类器进行性能提高 使用AdaBoost算法 处理分类不平衡问题 [TOC] 元算法(meta algorithm)是对其他算法进行组合的一种方式 AdaBoost 一种监督学习方法,是一种元算法 "核心概念" booststraping 自助法,依靠你自己的资源 一 阅读全文
posted @ 2019-09-29 21:56 keep-minding 阅读(88) 评论(0) 推荐(0)
摘要:SVM 介绍 SVM 使用SMO优化算法 使用核函数对数据进行空间转化 与其他分类器对比 [TOC] SVM 的实现方法有多种,本章介绍最常见的一种:序列最小化优化算法(SMO, sequential minimal optimization algorithm) 通过最大化间隔分离数据 优点 泛化 阅读全文
posted @ 2019-09-24 21:30 keep-minding 阅读(118) 评论(0) 推荐(0)
摘要:Logistic regression sigmoid 函数和逻辑回归分类器 优化 梯度下降算法 缺失值处理 [TOC] 逻辑回归的一般方法 收集数据 准备:数值型数据用于距离计算。最好是结构化数据 分析 训练:最花费时间的地方,找到一套最优参数来分类 测试 应用 逻辑回归分类和 sigmoid 函 阅读全文
posted @ 2019-08-31 07:51 keep-minding 阅读(106) 评论(0) 推荐(0)
摘要:Naive Bayes 使用概率分布进行分类 学习朴素贝叶斯分类器 解析 RSS 源数据 使用朴素贝叶斯来分析区域态度 [TOC] 从最简单的概率分来开始 然后在此基础上加入一些假设 然后学习朴素贝叶斯分类 基于贝叶斯决策理论的分类方法 朴素贝叶斯优点: 可以处理少量数据,可以处理多分类 缺点: 对 阅读全文
posted @ 2019-08-13 22:09 keep-minding 阅读(103) 评论(0) 推荐(0)
摘要:Decision Trees decision tree algorithm 测量数据一致性 使用递归构建决策树 使用 展示决策树 [TOC] 决策树相对knn的优势是对数据有一定的洞见,能帮助人们理解数据 决策树常用于专家系统 用决策树得到的规则常与人类专家的经验比较 实现 ID3 算法 决策树 阅读全文
posted @ 2019-07-27 20:17 keep-minding 阅读(173) 评论(0) 推荐(0)
摘要:K Nearest Neighbors KNN algorithm 从文件读数据 画散点图 归一化数值型数据 [TOC] 根据距离分类 优点 精度高 对奇异点不敏感 对数据没有假设 缺点 计算量大 需要大量内存 数据类型 数值型,名词性数值 算法描述 没有训练过程,直接进行分类。当获取了新的数据,遍 阅读全文
posted @ 2019-07-19 19:07 keep-minding 阅读(88) 评论(0) 推荐(0)
摘要:Machine Learning basics 机器学习基础 机器学习概览 机器学习中的关键问题 为什么需要学习机器学习 为什么Python很重要 机器学习 将数据转化为信息 使用统计学 互联网的出现使得数据海量增长 分类 监督学习 K近邻 朴素贝叶斯 SVM 决策树 线性回归 局部权重的线性回归 阅读全文
posted @ 2019-07-15 19:28 keep-minding 阅读(72) 评论(0) 推荐(0)
摘要:Machine Learning in Action Introduction by Peter Harrington "baiduyun" c9fq [TOC] Contents Classification Machine Learning basics 机器学习基础 Classifying w 阅读全文
posted @ 2019-07-05 21:02 keep-minding 阅读(110) 评论(0) 推荐(0)