摘要: 1信息增益 划分数据的最大原则就是:将无序的数据变得更加有序。 在划分数据集之前之后信息发生的变化称为信息增益,通过计算每个特征值划分数据集获得的信息增益,获得信息增益最高的特征就是最好的选择。 度量集合信息的方式简称为熵。另一个度量集合无序程度的方法是基尼不纯度。 计算信息熵的代码实现 from 阅读全文
posted @ 2020-06-11 17:11 六神酱 阅读(329) 评论(0) 推荐(0) 编辑
摘要: 工作原理: 1.假设一个带有标签的样本数据集(训练样本集),其中每条数据与其分类有对应关系。 2.输入没有标签的新数据后,将新数据中的每个特征与样本数据集中的每个特征进行比较。 2.1 计算新数据与样本数据集中的每条数据的距离。 2.2 对求得的每个距离进行排序(从小到大排序) 2.3 取前k个样本 阅读全文
posted @ 2020-06-08 16:17 六神酱 阅读(228) 评论(0) 推荐(0) 编辑
摘要: 调用: 阅读全文
posted @ 2019-04-23 10:48 六神酱 阅读(1006) 评论(0) 推荐(0) 编辑
摘要: 问题:pyinstaller 打包不成功,提示inporterror 缺少xlrd、xlwt 解决:将 pypiwin 230 改为 219 阅读全文
posted @ 2018-07-04 11:02 六神酱 阅读(1009) 评论(0) 推荐(0) 编辑
摘要: 独立线性度,最佳直线,independent linearity 阅读全文
posted @ 2018-06-01 11:55 六神酱 阅读(778) 评论(0) 推荐(0) 编辑
摘要: json.dumps 阅读全文
posted @ 2017-12-08 13:52 六神酱 阅读(1398) 评论(0) 推荐(0) 编辑
摘要: 数据分析 阅读全文
posted @ 2017-11-06 21:55 六神酱 阅读(189) 评论(0) 推荐(0) 编辑
摘要: web框架 http协议&TCP协议 web框架 Django请求的生命周期 MVC 和 MTV 模式 http协议&TCP协议 http协议 每一次 请求 响应 后都会断开连接,不记录状态 HTTP 协议基于 请求 响应 模式 HTTP /1.0默认使用的是 短链接 (浏览器和服务器每进行一次HT 阅读全文
posted @ 2017-10-29 18:33 六神酱 阅读(238) 评论(0) 推荐(0) 编辑
摘要: 操作系统 一、概念 操作系统是介于计算机硬件和应用程序之间的控制程序(或者叫做软件、应用软件等等),用于协调、管理和控制计算机硬件资源和软件资源。 特点: 1.操作系统运行于内核态(可以直接管理硬件)。 2.给应用程序提供系统接口调用(屏蔽底层硬件)。 3.通过多路复用技术,将应用程序对硬件资源的竞 阅读全文
posted @ 2017-10-28 14:21 六神酱 阅读(322) 评论(0) 推荐(0) 编辑
摘要: 链表,python 阅读全文
posted @ 2017-10-26 22:25 六神酱 阅读(153) 评论(0) 推荐(0) 编辑