摘要: 面试session(收集中ing,欢迎读者朋友抛问题哦) 特征不是数字,特别是有些特征是数字,有些是字符型,怎么处理? 特征分布不一致,如特征1范围在(1,100),特征2在(0,1)之间,要不要处理呢? 结果过拟合和欠拟合? 不是二分类是多分类? 线性不可分? 样本不平衡? LR算法的应用场景? 阅读全文
posted @ 2020-08-20 22:29 ahpuched 阅读(209) 评论(0) 推荐(0) 编辑
摘要: 1. python 原生实现 这里的原生实现异常粗糙(没有正则项,随机梯度上升),就是上一篇 原理篇 的代码实现,数据集直接来自sklearn iris(3分类问题),另外,手工提出了0,1两类,仅做了两类iris的分类。 对于 \(h(X) = w_0 + w_1 x_1 + w_2 x_2 + 阅读全文
posted @ 2020-08-20 22:27 ahpuched 阅读(657) 评论(0) 推荐(0) 编辑