机器学习（4）- 机器学习系统的设计

根据Andrew Ng在斯坦福的《机器学习》视频做笔记，已经通过李航《统计学习方法》获得的知识不赘述，仅列出提纲。

1 机器学习系统的设计

构建一个学习算法的推荐方法为：

用分类精确度并不能准确衡量算法优劣

精确率（Precision）：预测为真，但是实际为真的占比

召回率（Recall）：实际为真，但是预测为真的占比

将算法预测的结果分成四种情况：

真阳性（True Positive，TP）：预测为真，实际为真

真阴性（True Negative，TN）：预测为假，实际为假

假阳性（False Positive，FP）：预测为真，实际为假

假阴性（False Negative，FN）：预测为假，实际为真

\[precision=\frac{TP}{TP+FP} \]

\[recall=\frac{TP}{TP+FN} \]

高精确率和高召回率的模型是一个好的分类模型。

将出现较少的类设定为\(y=1\)，即真

高精确率，低召回率；低精确率，高召回率

自动选择：尝试不同的临界值，并根据评估度量值选择最优的

评估度量值

\[F_1 \ scroe=2\frac{PR}{P+R} \]

通过一个具有很多参数的学习算法来解决偏差问题；

通过用非常大的训练集来解决方差问题。

posted @ 2019-05-30 22:22 白芷呀阅读(350) 评论(0) 收藏举报

刷新页面返回顶部