随笔分类 -  Machine Learning

摘要:碰到样本数据类别不均衡怎么办? 如果有 10000个样例, 做二分类,9990条数据 都属于 正类1, 如果不处理的话 预测全部结果为 1, 准确率也为 99%,但这显然不是想要的结果。 碰到这样样本很不平衡的样例,应该怎样做。 前期数据准备 1. 欠采样 2. 过采样 对样本量偏少的数据,采用重复 阅读全文
posted @ 2018-09-19 20:36 Gssol 阅读(4785) 评论(0) 推荐(1)
摘要:conda install cmake conda install gcc git clone recursive https://github.com/Microsoft/LightGBM ; cd LightGBM mkdir build ; cd build cmake .. make j 返 阅读全文
posted @ 2018-01-03 19:46 Gssol 阅读(654) 评论(0) 推荐(0)
摘要:决策树 1 决策树概念 A decision tree is a decision support tool that uses a tree like graph or model of decisions and their possible consequences, including ch 阅读全文
posted @ 2017-06-22 15:20 Gssol 阅读(1085) 评论(3) 推荐(1)
摘要:机器学习 Gssol 20170620 星期二 1 机器学习概念 机器学习,通常的机器指的是“计算机”,机器学习就是让计算机自己学习。最主要的思想是“统计”和“分类”。 通常的是给计算机一些指令,然后计算机进行处理;而机器学习主要是分析数据,产生模型,进而进行预测。 “等人事件”: 例如和某人有约, 阅读全文
posted @ 2017-06-20 14:50 Gssol 阅读(773) 评论(1) 推荐(1)