摘要:
prioritizing what to work on设计一个机器学习算法时,我们应该先做什么?以垃圾邮件识别的例子为例:垃圾邮件发送者可能会故意将一些字符写错,如上图中的Medicine用1来代替i,M0rgages中o用0来代替。我们有一些标识为Spam的邮件,有一些标识为non-spam的邮... 阅读全文
摘要:
怎么区分哪些措施对我们有用呢?----首先根据learning curve来判断你的问题是high bias or variance当你的算法是high bias问题时,如果你get more training examples是没有用处的,这时我们就不要浪费时间在get5 more trainin... 阅读全文
摘要:
Linear regression with regularization当我们的λ很大时,hθ(x)≈θ0,是一条直线,会出现underfit;当我们的λ很小时(=0时),即相当于没有做regularization,会出现overfit;只有当我们的λ取intermediate值时,才会刚刚好。那... 阅读全文
摘要:
假设我们现在想要知道what degree of polynomial to fit to a data set 或者 应该选择什么features 或者 如何选择regularization parameterλ我们该如何做?----Model selection process很好的拟合trai... 阅读全文