随笔分类 - 机器学习
摘要:本文参考自: "flaskapi" 说明:系统ubuntu, anaconda虚拟环境, python = 2.7 1. 项目结构和文件说明 . ├── data │ └── 数据汇总.csv 需要预测的数据 ├── infer.py 主要文件, 模型加载推理,和flask服务的创建、解析等 ├──
阅读全文
摘要:文章转载自 "liuwu265的博客" Bagging和Boosting都是将已有的分类或回归算法通过一定方式组合起来,形成一个性能更加强大的分类器,更准确的说这是一种分类算法的组装方法。即将弱分类器组装成强分类器的方法。 首先介绍Bootstraping,即自助法:它是一种有放回的抽样方法(可能抽
阅读全文
摘要:1. 错误率和精度 错误率 - 错误样本占总样本比例 精度 - 正确样本占样本比例 2. 混淆矩阵 混淆矩阵的行代表的是实际类别,列代表的是预测的类别. 3. 查全率 、 查准率 查准率和查全率的重视程度有所不同。F1度量的一般形式,能让我们表达出对查准率/查全率的不同偏好,它定义为 其中β>0度量
阅读全文
摘要:转载地址:http://www.math345.com/blog/article/17
阅读全文
摘要:一、 k-近邻法 选择未知样本一定范围内确定个数的K个样本,该K个样本大多数属于某一类型,则未知样本判定为该类型。 粗暴性KNN实现: 适用情况: 1) 样本容量比较大,切各个分类数量差异不大; 2) 类域重叠交叉较多; 缺点: 1)需要存储全部的训练样本,耗内存 2) 计算量较大 3)样本数量少或
阅读全文