摘要: 思想 通过找到一个低维平面,使得样本到该平面的投影误差最小,而这些投影形成了新的特征。比如下图: 步骤 1.对样本做feature scaling 2.将数据从n维降到k维,计算协方差矩阵(这里的x没有1项): 利用SVD(奇异值分解)计算特征向量 我们真正需要的是U矩阵的前k列: 然后将原来的特征 阅读全文
posted @ 2019-05-07 23:06 Jary霸 阅读(196) 评论(0) 推荐(0)
摘要: 代价函数 定义:即每个样本到它所属类的聚类中心的距离平方和再除以m: 本质就是为了代价函数最小从而推出的算法。 步骤 1.随机选择K个聚类中心(可以随机选择k个样本点作为聚类中心),离聚类中心近的样本点被归为一类 公式表达:(i=1,2..m,Ci表示第i个样本所在的类的索引是多少) 聚类中心k的坐 阅读全文
posted @ 2019-05-07 16:39 Jary霸 阅读(260) 评论(0) 推荐(0)