01 2017 档案

摘要:本系列文章为《机器学习实战》学习笔记,内容整理自书本,网络以及自己的理解,如有错误欢迎指正。 源码在Python3.5上测试均通过,代码及数据 --> https://github.com/Wellat/MLaction 1、连续和离散型特征的树的构建 决策树算法主要是不断将数据切分成小数据集,直到 阅读全文
posted @ 2017-01-13 14:36 日青天 阅读(6211) 评论(2) 推荐(0)
摘要:本系列文章为《机器学习实战》学习笔记,内容整理自书本,网络以及自己的理解,如有错误欢迎指正。 源码在Python3.5上测试均通过,代码及数据 --> https://github.com/Wellat/MLaction 1、线性回归 现有一数据集,其分布如下图所示, 通过观察发现可以通过一个线性方 阅读全文
posted @ 2017-01-06 15:09 日青天 阅读(1960) 评论(1) 推荐(0)
摘要:本文是在Cat Qi的原贴的基础之上,经本人逐题分别在MySql数据库中实现的笔记. 参考原贴:http://www.cnblogs.com/qixuejia/p/3637735.html 01 问题描述 本题用到下面三个关系表: 借书卡:card 图书:books 借书记录:borrow 备注:限 阅读全文
posted @ 2017-01-04 21:39 日青天 阅读(1115) 评论(0) 推荐(0)
摘要:1、经验误差与过拟合 通常我们把分类错误的样本数占样本总数的比例称为“错误率”(error rate),即如果在m个样本中有a个样本分类错误,则错误率E=a/m;相应的,1-a/m称为“精度”(accuracy),即“精度=1一错误率”。更一般地,我(学习器的实际预测输出与样本的真实输出之间的差异称 阅读全文
posted @ 2017-01-03 15:48 日青天 阅读(4576) 评论(0) 推荐(0)