随笔分类 -  统计机器学习

LR,SVM,KNN,K-means,HMM,RCF
摘要:面试session(收集中ing,欢迎读者朋友抛问题哦) 特征不是数字,特别是有些特征是数字,有些是字符型,怎么处理? 特征分布不一致,如特征1范围在(1,100),特征2在(0,1)之间,要不要处理呢? 结果过拟合和欠拟合? 不是二分类是多分类? 线性不可分? 样本不平衡? LR算法的应用场景? 阅读全文
posted @ 2020-08-20 22:29 ahpuched 阅读(229) 评论(0) 推荐(0)
摘要:1. python 原生实现 这里的原生实现异常粗糙(没有正则项,随机梯度上升),就是上一篇 原理篇 的代码实现,数据集直接来自sklearn iris(3分类问题),另外,手工提出了0,1两类,仅做了两类iris的分类。 对于 \(h(X) = w_0 + w_1 x_1 + w_2 x_2 + 阅读全文
posted @ 2020-08-20 22:27 ahpuched 阅读(835) 评论(0) 推荐(0)
摘要:R方公式 在机器学习中,首先定义一个样本$(x_i,y_i)\(,预测的y为\)\hat$ 则有: \(\bar{y} = \frac{1}{n} \sum_i^n y_{i}\) \(SS_{tot} = \sum_i(y_i - \hat{y_i})^2\) \(SS_{reg} = \sum_ 阅读全文
posted @ 2020-08-19 17:02 ahpuched 阅读(1796) 评论(0) 推荐(0)
摘要:1. LR算法简述 LR 全称Logistic Regression,我们喜欢称她为逻辑回归或者逻辑斯蒂克回归,是传统机器学习中的最简单的最常用的分类模型。总之,LR算法简单、高效、易于并行且在线学习的特点,在工业界具有非常广泛的应用。在线学习指得是:可以利用新的数据对各个特征的权重进行更新,而不需 阅读全文
posted @ 2020-08-17 00:58 ahpuched 阅读(2392) 评论(0) 推荐(0)
摘要:混淆矩阵 True Positive(TP):将正类预测为正类数 True Negative(TN):将负类预测为负类数 False Positive(FP):将负类预测为正类数 False Negative(FN):将正类预测为负类数 准确率(accuracy) 计算公式 \(acc = \fra 阅读全文
posted @ 2020-08-16 21:20 ahpuched 阅读(1421) 评论(0) 推荐(0)
摘要:理论基础 算法实现 面试session 阅读全文
posted @ 2020-08-13 15:34 ahpuched 阅读(180) 评论(0) 推荐(0)