11 2016 档案

摘要:一. KNN原理: 1. 有监督的学习 根据已知事例及其类标,对新的实例按照离他最近的K的邻居中出现频率最高的类别进行分类。伪代码如下: 1)计算已知类别数据集中的点与当前点之间的距离 2)按照距离从小到大排序 3)选取与当前点距离最小的k个点 4)确定这k个点所在类别的出现频率 5)返回这K个点出 阅读全文
posted @ 2016-11-17 17:23 lesleysbw 阅读(5363) 评论(0) 推荐(0)
摘要:1. 降维技术 1.1 降维的必要性 1. 多重共线性--预测变量之间相互关联。多重共线性会导致解空间的不稳定,从而可能导致结果的不连贯。2. 高维空间本身具有稀疏性。一维正态分布有68%的值落于正负标准差之间,而在十维空间上只有0.02%。 3. 过多的变量会妨碍查找规律的建立。 4. 仅在变量层 阅读全文
posted @ 2016-11-15 19:54 lesleysbw 阅读(511) 评论(0) 推荐(0)
摘要:一. SVD 1. 基本概念: (1)定义:提取信息的方法:奇异值分解Singular Value Decomposition(SVD) (2)优点:简化数据, 去除噪声,提高算法的结果 (3)缺点:数据转换难以想象,耗时,损失特征 (4)适用于:数值型数据 2. 应用: (1)隐性语义索引(LSI 阅读全文
posted @ 2016-11-15 17:03 lesleysbw 阅读(1215) 评论(0) 推荐(0)
摘要:1. crab 介绍: Recommender systems in Python 官网介绍:http://muricoca.github.io/crab/ 在安装过程中,发现一个问题,我已经安装了Anconda,像numpy、scikits_learn都已经安装好了,但是在cmd shell中一直 阅读全文
posted @ 2016-11-14 11:02 lesleysbw 阅读(634) 评论(0) 推荐(0)
摘要:Basis(基础): MSE(Mean Square Error 均方误差),LMS(LeastMean Square 最小均方),LSM(Least Square Methods 最小二乘法),MLE(MaximumLikelihood Estimation最大似然估计),QP(Quadratic 阅读全文
posted @ 2016-11-14 09:00 lesleysbw 阅读(468) 评论(0) 推荐(0)
摘要:1 集体智慧和协同过滤 1.1 什么是集体智慧(社会计算)? 集体智慧 (Collective Intelligence) 并不是 Web2.0 时代特有的,只是在 Web2.0 时代,大家在 Web 应用中利用集体智慧构建更加有趣的应用或者得到更好的用户体验。集体智慧是指在大量的人群的行为和数据中 阅读全文
posted @ 2016-11-02 20:27 lesleysbw 阅读(6903) 评论(1) 推荐(2)
摘要:转: http://www.360doc.com/content/14/0315/11/14268060_360747574.shtml http://semocean.com/%E6%8E%A8%E8%8D%90%E7%B3%BB%E7%BB%9F%E7%BB%8F%E5%85%B8%E8%AE% 阅读全文
posted @ 2016-11-02 19:43 lesleysbw 阅读(3222) 评论(0) 推荐(1)