机器学习 - 随笔分类 - Geoffrey_one

Ubuntu搭建flask服务器，部署sklearn 机器学习模型

摘要：本文参考自： "flaskapi" 说明：系统ubuntu, anaconda虚拟环境， python = 2.7 1. 项目结构和文件说明 . ├── data │ └── 数据汇总.csv 需要预测的数据 ├── infer.py 主要文件，模型加载推理，和flask服务的创建、解析等 ├── 阅读全文

posted @ 2019-05-21 17:17 Geoffrey_one 阅读(943) 评论(0) 推荐(0)

Bagging和Boosting 概念及区别

摘要：文章转载自 "liuwu265的博客" Bagging和Boosting都是将已有的分类或回归算法通过一定方式组合起来，形成一个性能更加强大的分类器，更准确的说这是一种分类算法的组装方法。即将弱分类器组装成强分类器的方法。首先介绍Bootstraping，即自助法：它是一种有放回的抽样方法（可能抽阅读全文

posted @ 2018-11-26 14:25 Geoffrey_one 阅读(231) 评论(0) 推荐(0)

机器学习的性能度量

摘要：1. 错误率和精度错误率 - 错误样本占总样本比例精度 - 正确样本占样本比例 2. 混淆矩阵混淆矩阵的行代表的是实际类别,列代表的是预测的类别. 3. 查全率、查准率查准率和查全率的重视程度有所不同。F1度量的一般形式，能让我们表达出对查准率/查全率的不同偏好，它定义为其中β>0度量阅读全文

posted @ 2018-11-21 19:27 Geoffrey_one 阅读(369) 评论(0) 推荐(0)

信息熵的域值范围（转载）

摘要：转载地址：http://www.math345.com/blog/article/17 阅读全文

posted @ 2018-11-20 22:18 Geoffrey_one 阅读(3155) 评论(0) 推荐(0)

KNN

摘要：一、 k-近邻法选择未知样本一定范围内确定个数的K个样本，该K个样本大多数属于某一类型，则未知样本判定为该类型。粗暴性KNN实现：适用情况： 1）样本容量比较大，切各个分类数量差异不大； 2）类域重叠交叉较多；缺点： 1）需要存储全部的训练样本，耗内存 2) 计算量较大 3）样本数量少或阅读全文

posted @ 2018-11-12 20:34 Geoffrey_one 阅读(202) 评论(0) 推荐(0)

Loading

Geoffrey_one

随笔分类 - 机器学习