09 2014 档案

摘要:1. 最长公共子串注意子串是连续的。有下列动态转移方程c[i][j] = c[i-1][j-1] + 1 when X[i] = Y[j]c[i][j] = 0 when X[i] != Y[j] 1 int c[100][100]; 2 3 int LCS(char x[], int len... 阅读全文
posted @ 2014-09-14 22:16 IT屁民 阅读(422) 评论(0) 推荐(0)
摘要:K近邻很简单。简而言之,对于未知类的样本,按照某种计算距离找出它在训练集中的k个最近邻,如果k个近邻中多数样本属于哪个类别,就将它判决为那一个类别。由于采用k投票机制,所以能够减小噪声的影响。由于KNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于类域的交叉或重叠较... 阅读全文
posted @ 2014-09-13 19:35 IT屁民 阅读(652) 评论(0) 推荐(0)
摘要:1 定义2 直观解释信息熵用来衡量信息量的大小若不确定性越大,则信息量越大,熵越大若不确定性越小,则信息量越小,熵越小比如A班对B班,胜率一个为x,另一个为1-x则信息熵为 -(xlogx + (1-x)log(1-x))求导后容易证明x=1/2时取得最大,最大值为2也就是说两者势均力敌时,不确定性... 阅读全文
posted @ 2014-09-13 19:20 IT屁民 阅读(21329) 评论(1) 推荐(2)