摘要: 加深对决策树, 集成学习理解, 如bagging, boosting, 为接下来XGBoost推导做准备 阅读全文
posted @ 2019-12-09 18:50 致于数据科学家的小陈 阅读(399) 评论(0) 推荐(0)
摘要: 基于信息熵的决策树构建过程, 随机森林理解 阅读全文
posted @ 2019-12-09 00:31 致于数据科学家的小陈 阅读(692) 评论(0) 推荐(0)
摘要: Adaboost 算法理解 阅读全文
posted @ 2019-12-08 17:24 致于数据科学家的小陈 阅读(586) 评论(0) 推荐(0)
摘要: Bagging, 待补充一个 "降低方差"的严格证明 阅读全文
posted @ 2019-12-07 23:40 致于数据科学家的小陈 阅读(478) 评论(0) 推荐(0)
摘要: 集成学习初识, 民主决策. 阅读全文
posted @ 2019-12-07 21:24 致于数据科学家的小陈 阅读(3710) 评论(0) 推荐(0)
摘要: 数据分析重点. 同维度下,对不同字段聚合 groupbby(key).agg({'字段1':'aggfunc1', '字段1':'aggfunc2''..} 阅读全文
posted @ 2019-12-07 17:50 致于数据科学家的小陈 阅读(1488) 评论(0) 推荐(0)
摘要: 用数学定义 "高内聚, 低耦合", 很有难度其实, 然后 转为 最优化问题, 最后用到特征分解来求解. 阅读全文
posted @ 2019-12-06 22:22 致于数据科学家的小陈 阅读(713) 评论(0) 推荐(0)
摘要: LDA-作为线性判别 分类器 的推导, 其实就是一个贝叶斯公式的过程, 涉及先验概率, 抽样分布, 多元正态分布, 协方差矩阵等, 还有, "优化的思想" 阅读全文
posted @ 2019-12-05 16:20 致于数据科学家的小陈 阅读(1616) 评论(0) 推荐(0)
摘要: 逻辑回归推导, 损失函数, 梯度推导, 证明是凸函数, 模型应用 阅读全文
posted @ 2019-12-04 14:41 致于数据科学家的小陈 阅读(413) 评论(0) 推荐(0)
摘要: 逻辑回归的 logist 函数推导, 从概率论视角. 阅读全文
posted @ 2019-12-03 15:47 致于数据科学家的小陈 阅读(525) 评论(0) 推荐(0)
摘要: 模型泛化优化之 L1 L2 正则化. 涉及正则化认识, 梯度方向来理解, 交叉校验调参, L1 L2比较等 阅读全文
posted @ 2019-12-03 00:00 致于数据科学家的小陈 阅读(629) 评论(0) 推荐(0)
摘要: 模型优化评估, 扩充基, 过拟合, 模型的Bias, Variance 阅读全文
posted @ 2019-12-02 16:09 致于数据科学家的小陈 阅读(596) 评论(0) 推荐(0)
摘要: group by 过程, 数据分析中,绝对是最为重要的部分, 没有之一. 阅读全文
posted @ 2019-12-01 21:29 致于数据科学家的小陈 阅读(1904) 评论(0) 推荐(0)
摘要: 线性回归的推导和求解. 分别从 矩阵代数, 微积分, 概率论, Pyhton 实现求解等, 巩固我的6年经验了. 阅读全文
posted @ 2019-11-30 19:01 致于数据科学家的小陈 阅读(755) 评论(0) 推荐(0)
摘要: 交叉验证 阅读全文
posted @ 2019-11-29 19:08 致于数据科学家的小陈 阅读(331) 评论(0) 推荐(0)