机器学习基石第五讲 Training versus Testing

一.Recap and Preview

 

 

 

 

 

第一节是对第一讲的复习

 

二.Effective Number of Lines

如果加无限多个项,每项还不是0,那么P可能就成为了一个大于1的数,这个union bound就失去了意义。

 

为什么可以使用union bound,因为发生错误的dataset很可能不太一样。

 

这句话老师反手就说不对了。。。从上面的图可以看出,发生错误的dataset很可能有很大相似的地方,我们必须找到他们重叠的部分。

 

 

 

 

如果只有一个点,那么只有两种线,一种说x1是0,一种说x1是x

 

如果有2个点,那么有四种线

 

 

 

在三个点的时候,有8条线,但如果三个点是摆在同一直线上的时候,只有6种线,三个点摆成三角形的时候可以有8条线。

 

四个点的时候,如上图,有一种线是画不出的,所以最多有14种线

 

 

 

 

三.Effective Number of Hypotheses

dichotomy:划分

 

 

 

 

 

 

大于和小于threshold的时候,分别都有两种取值,o和x,所以一共2*(N - 1),再加上全o和全x两种情况。所以是2*N

 

四.Break Point

 

 

第一个达不到2^n的点

 

 

posted @ 2015-11-13 16:48  早杰  阅读(266)  评论(0编辑  收藏  举报