01 2017 档案
摘要:本系列文章为《机器学习实战》学习笔记,内容整理自书本,网络以及自己的理解,如有错误欢迎指正。 源码在Python3.5上测试均通过,代码及数据 --> https://github.com/Wellat/MLaction 1、连续和离散型特征的树的构建 决策树算法主要是不断将数据切分成小数据集,直到
阅读全文
摘要:本系列文章为《机器学习实战》学习笔记,内容整理自书本,网络以及自己的理解,如有错误欢迎指正。 源码在Python3.5上测试均通过,代码及数据 --> https://github.com/Wellat/MLaction 1、线性回归 现有一数据集,其分布如下图所示, 通过观察发现可以通过一个线性方
阅读全文
摘要:本文是在Cat Qi的原贴的基础之上,经本人逐题分别在MySql数据库中实现的笔记. 参考原贴:http://www.cnblogs.com/qixuejia/p/3637735.html 01 问题描述 本题用到下面三个关系表: 借书卡:card 图书:books 借书记录:borrow 备注:限
阅读全文
摘要:1、经验误差与过拟合 通常我们把分类错误的样本数占样本总数的比例称为“错误率”(error rate),即如果在m个样本中有a个样本分类错误,则错误率E=a/m;相应的,1-a/m称为“精度”(accuracy),即“精度=1一错误率”。更一般地,我(学习器的实际预测输出与样本的真实输出之间的差异称
阅读全文

浙公网安备 33010602011771号