代码改变世界

你懂的

2013-03-15 09:32 by ggzwtj, 23 阅读, 0 推荐, 收藏, 编辑
该文被密码保护。 阅读全文

Boltzmann machine

2013-03-14 17:16 by ggzwtj, 5285 阅读, 0 推荐, 收藏, 编辑
摘要:工欲善其事,必先利其器。boltzmann machine涉及到的东西还是比较多的,这里不会给出详尽的证明,只是会提到一下,重点还是这个机器学习算法的有点、缺点、能处理的问题等。Boltzman分布 Boltzman分布形成了分子运动论的基础,它解释了许多基本的气体性质,包括压强和扩散。通常描述的是气体中分子的速率的分布,但它还可以指分子的速度、动量及动量大小的分布。 其中:T:平衡温度。Ni:状态i的粒子数。k:状态i的能量。gi:状态i的简并度。Ei:状态i的能量。模拟退火算法 首先,什么是退火?其实之前别人提到这个算法的是模拟“119”的做法,其实真正的含义是:金属冶炼的退火过... 阅读全文

Deep Learning

2013-03-13 20:54 by ggzwtj, 520 阅读, 0 推荐, 收藏, 编辑
摘要:概念depth 所表示的意思是从input到output最长的路径长度。传统的机器学习算法也是有depth这个性质的:BP:depth = layers + 1;SVM:depth = 2,核函数和线性分类器?Deep的动机 在depth比较小的时候,很多ML能够完成指定的任务,不过会有一些显著的缺点:节点数增长的非常快,会随着input的规模成倍地增加。要明白这一点,先思考一下节点与节点的关系:在同一层:扩充。在不同层:组合。这样的话,在增加相同节点数的时候第二种状态下的节点能表达的情况数会更多,而且这点上是不是有点“组合爆炸”的感觉?这里YY一下,如果大脑中的神经元和ML中的神经元非常.. 阅读全文

搜索

2013-03-07 20:35 by ggzwtj, 190 阅读, 0 推荐, 收藏, 编辑
摘要:搜索宝贝SearchItem.excute根据搜索条件设置好SearchConditionEngineAOImpl.getCategoryInfo——获取类目信息EngineAOImpl.getFeedListEngineSearchManagerImpl.getItemListSearchClient.query——根据条件搜索(HA3引擎的实现了)根据引擎返回的doc得到List<item>EngineAOImpl.convertFeed——得到前段展示时需要的数据搜索用户SearchUser.excute根据搜索条件设置好SearchConditionEngineAOImpl 阅读全文

计数器

2013-03-07 16:21 by ggzwtj, 421 阅读, 0 推荐, 收藏, 编辑
摘要:Feed减少Feed评论数CommentManagerImpl.deleteComment——删除评论接口FeedCountRelatedManagerImpl.decrCommentCount——减少Feed评论数(数据库+缓存)FeedDAOImpl.decrCommentCount——减少数据库中的计数FeedBodyManagerImpl.get——从缓存中取到FeedDOFeedDO评论数减一;FeedBodyManagerImpl.put——将FeedDO插入缓存增加Feed评论数:CommentManagerImpl.addComment——发表评论接口FeedCountRela 阅读全文

关联规则

2013-03-07 14:51 by ggzwtj, 781 阅读, 0 推荐, 收藏, 编辑
摘要:啤酒和尿布 在超市中人们发现一个有趣的现象:啤酒和尿布这两种风牛马不相及的东西摆放在了一起。这种奇怪的做法使得啤酒和尿布的销量大量增加。对此的解释可能是:一般都是妇女在家照顾孩子,丈夫在下班回家的时候会去买尿布,这时候会去顺便买一瓶自己喜欢的啤酒。 当然,啤酒和尿布的关系可以通过细心的观察得到,而并不是所有的这种规则都能通过观察现象得到。所以,需要有一种算法来寻找这种规则,并且衡量找到规则的有效性——这就是数据挖掘中的关联规则。概念稍微想一下,关联规则要解决的是两个问题:如何找到规则?找到的规则是否有效?比如,超市的数据库中发现所有的购买了下面这几种物品: A B C D E F G那么... 阅读全文

2012总结

2013-03-06 18:02 by ggzwtj, 51 阅读, 0 推荐, 收藏, 编辑
该文被密码保护。 阅读全文

fuzzy c-means

2013-03-06 16:21 by ggzwtj, 4305 阅读, 0 推荐, 收藏, 编辑
摘要:在k-means中,每个元素只能属于所有类别中的一类。那这样会带来一些问题:所有的元素对于计算聚类中心的贡献都是相同的。 因为从根本上,对于属于一个类的所有元素来说,在k-means中是无法将他们区别开的(如果非要用距离什么的来区分也可以,但是这部分功能不是k-mean擅长的)。而在fuzzy c-means中,元素可能属于任何一类,不同的是它们之间的可能性是不同的。数学表示如下:Jm = ΣΣuijm × |xi - ci|2其中:xi:元素;cj:聚类中心;uij:元素xi对于聚类中心cj的隶属度(属于这个类的可能性);m:大于1的实数,一般取值2.0; Jm用来评估聚类效果,J 阅读全文

k-means

2013-03-06 14:38 by ggzwtj, 236 阅读, 0 推荐, 收藏, 编辑
摘要:k均值聚类算法是无监督的,这里均值的含义应该是指在确定新的聚类中心时的算法,具体的过程如下:随机选择k个元素作为中心;将剩下的元素归类到距离最近的聚类中心;重新计算每个类的中心的位置:计算这个类中元素的平均值;对所有元素重新归类,如果归类结果与之前不同,转3;输出聚类结果;需要注意的几点:在不同的场景选择合适的距离计算方式;一些特殊的场合中是不会知道聚类中心具体的值;----- -- -end. 阅读全文

贝叶斯分类

2013-03-06 13:57 by ggzwtj, 400 阅读, 0 推荐, 收藏, 编辑
摘要:贝叶斯分类是指利用概率统计知识来进行分类的算法,基于贝叶斯定理。但是由于贝叶斯定理有一个假设:每个属性对类的影响互相独立。但在实际中,这个假设基本不成立,所以贝叶斯分类的准确度也可能因此有所下降。贝叶斯定理如下: P(A|B) = P(B)× P(B|A) / P(A)证明非常简单: P(A∩B) = P(A)× P(B|A) = P(B)× P(A|B)。贝叶斯分类问题的定义如下:定义特征属性x = {ai},0 < i < m;预先定义类别集合c = {yi},0 < i < n;计算{P(yi|x)},0 < i < n; 阅读全文